AI群英谱丨张瑞飞:提供智能语义应用的“泰岳方案”

2018-12-14

张瑞飞是神州泰岳人工智能大数据副总裁,有着10年以上的大数据及人工智能从业经验。十几年来,他在许多国际软件公司担任过要职,如惠普软件做过大客户单元总经理、Vizioncore大中华区总裁、Vmware渠道总监等。张瑞飞对人工智能的历史和现状有着自己独到的看法,他说,AI的最初理想失败了,AI的现实应用成功了。失败的是魔幻人工智能,成功的是产业人工智能。

AI的最初理想太过魔幻

张瑞飞花了很长时间来研究人工智能的发展史,他认真梳理了从上世纪50年代至今的人工智能发展历史。他认为,从数理逻辑的突破到计算机的发明应用,以及系统论、控制论、信息论等理论的建立,这都为人工智能的产生和发展打下了基础。1956年9月,著名的达特茅斯会议确立了人工智能这一概念,人工智能的发展迎来了第一次浪潮,被誉为人工智能之父的马文·明斯基在1965年乐观地说,人工智能问题将获得实质上的解决。1970年,他又说,在三到八年的时间内,我们将得到一台具有人类平均智能的机器。

但是,第一代的前辈们对算法和模型的局限性估计不足,人工智能的发展随即进入困惑期。以后人工智能又在逻辑推理和和知识库的建立上继续努力,到1980年,爱德华·费根鲍姆的“专家系统”诞生,标志着人工智能的第二次浪潮到来。大量“专家库”和“知识工程”产生,日本投入巨资开发“第五代计算机”。但技术局限仍没有突破,专家系统维护困难,使得人工智能再次进入停滞期。进入21世纪,随之IBM“深蓝”、谷歌AlphaGo 、聊天机器人、智能助理、自动驾驶等的出现,人工智能又出现了以“机器学习”为代表的第三次浪潮。

产业化发展是人工智能的必由之路

许多年来,张瑞飞一直在思考人工智能的发展之路。他认为能否带来直接和间接的经济效益,也许是衡量人工智能是否能够“落地”,能否成功的一项重要标准。这样,人工智能就能够摆脱“魔幻”,走进“现实”。

为此,他提出了自己的解决方案,他认为,和实际需求相结合,产业化发展是人工智能现实发展的必由之路。他的观点可以用三句话来概括,一是降低成本,让机器学习工业化;二是满足期望,在特定场景内实现综合技术的应用;三是实现需求,让特定技术在泛化场景成功应用。

神州泰岳立于人工智能产业化的潮头

近几年来,神州泰岳在自然语言处理和语义分析领域取得的令人瞩目的成果,成为人工智能行业的领军企业。张瑞飞在神州泰岳所做的主要工作之一,是面向公安系统,建设一个一体化的合成作战平台和“智慧公安”解决方案。在语义解析引擎、互联网数据采集、流程引擎以及融合通讯等基础能力上做扩增,最终形成一个行业可落地的应用。

张瑞飞和他的团队首先要解决的是数据的获取和处理。几年来,基于400万份公安简要案情、案事件文本等方面的有效样本,在此基础上做了向量化和特征提取,积累了2万多个专业词,可以覆盖99%的应用场景,有效提高了分类准确性和泛化能力。有了海量的数据,下一步就是属性要素的提取。经过多个项目实践,形成了包括(地址、物品、手段、特征、码号)的词向量库,他们又运用独特的方法解决多态性问题,成功地使地址具有了标准化和归一化的特点,并在采集过程中逐步深化。接下来利用迁移学习的技巧,减少在不同地区做样本模型训练的样本量。最后,通过与深度学习LSTM+CRF模型相结合,在命名实体场景过程中,进一步使用OEC语义模型(本体概念模型),把原来的处理结果进一步的优化。

通过这样的四步,神州泰岳在业内首次推出了NLP集成开发系统,把语义资源、算法体系、场景化能力等集成在一起,形成了自己独特的优势,站到了人工智能新浪潮的潮头。

张瑞飞认为,传统行业的智能化是企业的机会,神州泰岳的探索会为人工智能技术从应用落地到转化为企业盈利提供新的方案。