什么是LNP,众所周知,处理自然语言的关键是要让计算机“理解”自然语言,所以自然语言处理又叫做自然语言理解(NLU,NaturalLanguage Understanding),也称为计算语言学(Computational Linguistics)。一方面它是语言信息处理的一个分支,另一方面它是人工智能(AI, Artificial Intelligence)的核心课题之一。
中国的NLP厂商以NLP技术企业和互联网科技企业为主要参与者,而NLP技术企业由于深耕技术研发多年,技术先进性强,可满足不同行业下游用户的定制化需求。其中,拓尔思作为国内最早从事NLP技术研发的企业之一和中文全文检索技术的开创者,经过多年研发和应用积累,已成为国内“语义智能“技术的领军企业,业务范围覆盖金融、制造、能源、互联网、传媒、政务、公共安全等诸多领域,拥有企业级客户8000余家,在中国NLP市场中占有重要地位。
LNP在2030年内,于五大领域的市场规模极其庞大。
以上数据分别是: 虚拟数字人2800亿、智能内容处理774亿、舆情分析1571亿、智能客服5062亿、新一代搜索引擎3972亿……合计1.4万亿的海量市场规模
NLP是人工智能皇冠上的明珠 ,在语言文字信息处理方面主要有汉王科技、科大讯飞、拓尔思三家上市公司,汉王做模式识别,科大讯飞做语音识别 ,拓尔思是信息检索和文本挖掘(语音处理)。近年来,人工智能相关的领域投资备受资本青睐,如今视觉识别、伺服电机、传感器、语音处理、本体制造等环节的技术已经基本成熟。而在智能认知方面却是一个高山仰止般的存在。
国外调研公司的数据表明,最值得关注的100家AI公司中,25%的项目和自然语言直接或者间接相关。从另外一个角度,福布斯TOP50AI公司的融资中,16.2%的资金投向了NLP直接或者间接相关的领域,所以这个领域将是人工智能领域最后的投资洼地。
微软曾经提出一个口号是“自然语言是人工智能皇冠上的明珠”
拓尔思在NLP领域耕耘了二十多年, 围绕自然语言理解( NLP)、大数据采集和分析核心技术,绝大多数产品线均涉及人工智能核心技术。
拓尔思总经理施水才曾表示人工智能包含两个部分,分别是皮囊部分与灵魂部分。其中,拓尔思的发力点为后者。
目前,国内语音智能、图像智能等,仍然徘徊在弱智能阶段,要解决人工智能长期发展上的‘短板’,必须在语义智能上取得突破,这是走向强人工智能的关键”。
人工智能的发展大致分三个阶段: 第一阶段,解决计算智能相关的问题,如神经网络等;第二阶段,实现感知相关的智能,如语音识别、人脸识别等弱人工智能;第三阶段,实现认知相关的智能,如语言理解、知识获取和推理等。“从广义定义上理解,语义智能属于人工智能的高级阶段——强人工智能”。
与商汤科技聚焦视觉识别、科大讯飞聚焦语音识别等技术路线不同,语义智能是拓尔思长期以来积累的“杀手锏“。语义智能位于人工智能金字塔中感知智能(语音识别、图像识别)之后的认知智能(语言理解、分析决策)层面,通过计算机理解人类的语言来实现分析决策。语义理解相比语音识别,难度系数更高、积累时间更长、爆发时点更晚,被称作人工智能皇冠上的明珠。从技术发展的角度看,认知智能不仅需要充分利用算力、数据和算法的深度学习大模型,而且要融合知识驱动的新路线,实现基于数据和知识的双轮驱动。
拓尔思处于人工智能三层次(计算智能、感知智能、认知智能)中的最高层,有了认知能力,人工智能才会有灵魂,才算是一个真正的智能机器人。
2021年,拓尔思人工智能软件产品及服务业务同比增长51.95%至1.81亿元,自主研发的技术和产品(人工智能、大数据、安全产品、)收入占比超过80%,毛利率超过70%。整体而言,公司毛利率较上年提升4.06个百分点,达到62.13%,净利率为23.88%,盈利能力突出。
作为中国 NLP 龙头,在中外巨头如火如荼发力人工智能的潮流下,其商用爆发临界点已经到来,公司目前估值已被严重低估,有望迎来重估。