汉王科技迈入30年富足年华:深耕数字化,用AI创新技术赋能未来

时间:2023-5-29    作者:大策观察    分类:


1. 公司业务在人工智能方向有何进展?

朱德永:人工智能是未来产业变革的重要力量,也势必给各产业发展带来重大影响,公司的 AI 技术也在由感知技术向认知技术演进发展。汉王科技源于中科院,在人工智能的感知智能和认知智能领域持续耕耘,形成了包括多模式识别、智能人机交互、自然语言理解 NLP、智能视频分析等多种自研核心技术。

在 TO B 行业端,公司以“人工智能技术平台+行业数字化赛道”的模式,将嵌入了 AI 技术的产品或解决方案为人文、档案、司法、金融等行业提供数智化服务,例如公司在人文、档案行业,依托 OCR、NLP 技术,从数据采集到数字化提取再到知识图谱接着数据分析最后形成可交付的智能化数据输出,根据客户需要打造不同类型的数智化产品及解决方案,帮助客户实现数智化管理。

在司法行业,向客户交付的“数字员工”产品是依托文字识别、NLP 等 AI 能力再加上 RPA 自动机器人,帮助客户降低了人力成本、减少重复性作业。另外,公司在 AI+智能硬件上也在寻求多方向发展,例如公司 4 月 12 日发布的 AI 电纸学习本、柯氏音血压计、图像识别电子枪 PK Gun 等产品;公司开发的智能仿生机器鸟已成功实现商业化销售。现阶段,无论是软件产品还是硬件产品,公司都会在 AI 能力上不断加强植入;现在所做的很多工作也是在为将来的服务机器人做准备。

2. 公司如何看待通用大模型?公司未来在相关产品上有何计划?

朱德永:国外,以 OPEN AI 公司为代表的通用大模型研究公司以及 AIGC 技术应用公司推出了多种交互类生成产品,获得了较好的市场反应,将国内大模型的研发带到了空前的热度;现阶段来看,大算力、大数据量、千亿级参数成为通用大模型的主流;根据公司现有的规划,不会在通用大模型上与之竞争,会集中精力在行业应用类模型上,发挥对行业数据的理解、对行业背景知识的理解等优势,在行业领域生根。另外,还会在针对特定的专用模型,如教育类专用模型上,公司有自己的思路,希望通过对不同学科叠加递进的学习与训练,打造出中等规模参数、小算力的专用优化模型。

3. 公司在文本大数据上有较多积累,在数据价值挖掘上公司都做了哪些工作?

朱德永:公司掌握了联机手写输入法、手写文稿识别技术、多民族多语种文字识别等多种自研核心技术,服务包括中国第一历史档案馆、中国第二历史档案馆,国家图书馆、故宫博物馆、人民出版社、人民教育出版社、最高人民检察院、最高人民法院、北京协和医院、同仁医院、解放军总医院301 医院、华西医院等政法、医疗、人文、档案、金融等行业客户,为其提供数字化、数据化、数智化全方位服务。

公司根据客户的需求,使用客户提供的资料或信息,结合 AI 相关技术,通过数字化流程、数字化平台,将资料或信息的数据提取,进行结构化处理,再加以学习和训练,可输出有价值的数据结果提供给客户;比如在数字人文领域,公司在国家图书馆“智慧图书馆体系建设项目”中,针对民国文献数字资源开展知识化加工,完成数字资源精细化标引和知识内容抽取,细化文献颗粒度,多维度揭示文献的知识内容,并开展多维度、多层次知识组织,提供基于知识图谱的可视化展示。在司法档案上,主要产品是电子卷宗生成与深度应用,该产品集成了公司 OCR 和 NLP 相关技术,实现了卷宗材料“一次扫描、全程使用、一键归档”机制,打通了电子诉讼材料一二审法院间的信息链接,实现案件“一键上诉”,初步实现了从以纸质档案保管为主的传统模式向以电子档案保管为主的新模式转型。

经过多年的积累,在中文数据标注、知识图谱、自动索引、摘要生成等中文数据处理能力上积累了丰富的经验及资源;在数据运营方面,公司积极与客户及合作方展开数据价值服务方面的沟通;探讨数据运营方向的数据价值再挖掘。

4. 公司与中科院自动化所都有哪些合作?

朱德永:中国科学院自动化研究所是公司的前十大股东之一,自动化所有许多不同的团队在做不同的技术。公司与中科院自动化所目前的主要合作是手写文稿识别方向,并与自动化所合资成立了合资公司,把相关技术与产业化落地和应用技术方面良好的结合在一起,形成了一定的优势。公司作为即掌握多种人工智能技术又有产业化落地背景的高科技企业,拥有较多的优质客户及行业应用场景,公司将一如既往的与自动化所继续保持密切合作与交流,积极协同展开前沿技术成果转化工作。

5. 公司的数字绘画业务在 AIGC 方面有哪些结合点?

朱德永:公司数字绘画业务服务的主要人群为文创类群体,AIGC 在绘画创作上的良好表现降低了此类群体的进入门槛,有利于该业务的发展;同时,公司也在积极关注生成式绘画创作工具,以期在将来更好的为文创类客群提供 AI 类服务。

6.公司对 2023 年的营收及利润预计是怎样的?公司预期未来的增长点会在哪些业务板块?

周英瑜:营收方面,随着国内经济活力的逐渐复苏,国外通胀压力的缓解,公司对 2023 年营收预算约为 17 亿左右;利润方面,因为公司为增强新技术、新产品的竞争力,将继续加强 AI 相关技术及产品的研发投入;另外为稳固市场地位及新品上市推广需要,公司在品牌与市场投入强度会有所增强,再加上原材料采购成本可能会存在波动,这些因素对利润都会构成直接影响,为使经营节凑不变形,公司对利润的预算保持弹性。公司 2023 年一季度营收 3.08 亿,同比增长7.66%,归母净利润为-2777 万元,同比下降 17.63%,前述原因导致利润承压。

公司以“人工智能技术平台+行业数字化赛道”及“人工智能技术+数字化终端产品”满足 B 端及 C 端客户的数智化需求,形成了文本大数据、笔智能交互、人脸及生物特征识别、AI 智能终端四大业务板块;其中

1)文本大数据业务受益于数字经济、数字中国、信创产业等大的产业机会,如果经济复苏持续、政府投入到位,该业务预计会较 2022 年有所增长;

2)笔智能交互业务,因海外营收占比较高,如海外通胀得到控制,加上专业数字绘画屏产品上市,以及配有数字笔的中档产品的大力推广,该业务线有望企稳;

3)AI 智能终端业务,公司在电子纸方向的轻办公类手写记事本、教育类电纸学习本、阅读类高清便携式数字阅读本;大健康方向的柯氏音血压计;大娱乐方向的图像识别电子枪等产品的上市,以及多类型、多维度的品宣工作的助力,该业务预计会较 2022 年有所增长。公司管理层期望通过不懈努力,实现“让机器更懂你”的企业使命,实现公司长期稳健、平衡发展,回报广大投资者。

7. 公司现阶段面对的挑战和可能的风险主要有哪些?

周英瑜:技术型人工智能企业现处于市场发展中早期,具有技术含量高、研发投入大、研发周期长等特点,技术的商业化应用场景有待进一步开发。在新技术不断涌现、外加资本催化的作用下,

公司面对的主要挑战:1)国内外 AI 前沿技术的快速演进与进化;2)新进入者增多,竞争激烈;3)应用场景的定制化解决方案迭代速度快;4)相关应用市场尚不成熟且分散。

公司可能存在的风险包括:1)技术升级、市场竞争等原因,可能导致经营业绩亏损;2)部分研发项目进程及结果的不确定性较高,可能导致新技术商用化不及预期或研发失败;3)应用技术的快速迭代可能导致产品研发成本短期难以摊薄;4)商业化应用场景尚不成熟,导致营收增速较慢;5)竞争加剧,导致毛利率不稳定;6)其他风险,如宏观经济形势及政策变化、第三方电商平台运营风险、汇率风险、供应链风险、集团管控的风险、人力资源风险等风险详见2023 年年度报告第三节“管理层讨论与分析”之“十一、公司未来发展的展望。

 

汉王科技(002362)的关注点:

1、中国科学院自动化研究所为第三大股东,主营人脸及生物特征识别业务、OCR识别业务、手写识别业务、数据服务业务、笔触控与轨迹业务、智能空气检测与治理业务

2、公司以病案大数据挖掘为业务方向,着力构建文本数据检索、信息抽取、知识图谱、数据可视化等技术应用的产品及服务体系,公司参与北京协和医院360万册病历临床数据库建设项目,完成海量归档病案的文本级数据生产及应用系统建设;临床大数据科研平台已逐步上线,支持医护人员通过平台检索和调阅病案,并且可以自动提取首页信息

3、人工智能领域的先行者;公司是数字产业化的参与方,利用业内领先的文本图像识别、自然语言处理、生物特征识别、智能视频分析、智能人机交互核心底层技术为行业客户的数字化、智能化提供数据要素

5月7日,华泰证券、民生争取、万家基金、浙商证券调研汉王,当然调研的内容肯定是人工智能相关。我就把严肃的问题口语话吧,通俗易懂。

 

汉王当然强调了中科院的渊缘,强调了多模式识别、智能人机交互、自然语言理解NLP、智能试盘分析等多种自研技术。

 

公司以“人工智能技术平台+行业数字化赛道”的模式减嵌入了AI技术的产品或解决方案为人文、档案、司法、金融等行业提供服务。依托OCR、NLP技术,从数据采集到数字化提取再到知识图谱接着数据分析输出,根据客户需要定制。

 

说了这么多,就是很好解释,不是都在说大模型训练要用语料嘛,那很多有价值的非结构化数据怎么办呢?中文识别输入是汉王的强项啊,他可以帮你把所有历史文献、老旧书籍、甚至手写的难于识别的文献,转化成数字文档,再根据客户的需要,生成结构化数据。这不是妥妥的数据公司的上游铲子公司

 

随后公司又描述了自己对大模型的理解,就是此前新闻里提到的“中等规模参数、小算力的专用优化模型”,这个看了上一篇的就知道为什么。

 

针对调研问到的在文本大数据上的积累,公司就是介绍了手写文稿识别技术、多语言文字识别等自研核心技术,举例了中国第一、第二历史档案馆、国家图书馆、故宫博物院、人民出版社、人民教育出版社、高检、高法、协和医院、同仁医院、301等行业客户的数字化从数据提取、结构化处理、加以学习和训练,输出有价值的数据给客户。

 

说到这里,基本上清楚了,汉王这个小模型就是服务行业客户的,主要涉及图书馆等历史文献多的地方(也说明了汉王的核心技术,在于手写文稿的图像识别与数据生成)也就是说是铲子公司,服务那些有大量有价值的历史文献,大模型需要,又需要从一大堆纸质文献里处理出来的用户。

后面公司又介绍了数字绘画业务,其实说了这么多,绕不开汉王这么多年来的核心技术 中文识别输入和图像处理,从最早的手写笔 、电纸书、到满大街的汉王摄像头,以及我上一篇写过的虹膜识别,再结合这个调研里提到的老旧文献的数字化处理、AI绘画的工具(我记得以前有个名片王,扫描一下,就把文字存起来了),不难看出,汉王的优势就是一切图像识别和文字转换的核心技术,记得有一个大模型发布会提到可以直接识别菜单照片里的文字,还能针对图片里的菜名进行回复,那么这个技术就是汉王擅长的了。(技术原理就是从一张照片里面找出文字,并把文字提取出来,进行结构化处理和标注)

所以汉王以后的小应用,可能就集中在类似于 名片扫描王、百度识图、数字绘画等方面的应用了,且更多会看重能产生收益的细分领域。

当然说到公司最近管理层的减持,小额,苦了很多年了,汉王这家公司,很像我们股民,认认真真复盘,小心翼翼炒股,不求暴富,但求稳定复利。尤其是对员工很好,整个公司的团队也稳定、务实。

推荐阅读: