神州泰岳

中国声谷携手神州泰岳 推进NLP技术赋能行业应用

2019-05-20 1850
阅读提示:

作为新一轮科技革命和产业变革的重要驱动力——人工智能,已连续三年被写进政府工作报告中,“关键核心技术”更是近年来首次出现在政府工作报告中,而自然语言理解技术就是支撑人工智能得到广泛应用的关键核心技术。

过去十年自然语言理解技术已有了重大突破,在语音识别和机器翻译等领域都取得了长足发展,但在实际应用中还存在很多不足,譬如大部分“智能客服”还基本处于“智障客服”阶段。因此需要继续加强对自然语言理解技术的投入,从而让人工智能从感知智能跳跃到认知智能。

认知智能市场大有可为 NLP开放平台应运而生

从技术到产品,从产业端到市场化,NLP落地应用的探索长期以来面临着几座大山。一是NLP技术的“知名度”不足,许多人不知道该技术怎么用以及如何获取;二是学术研究与产业脱节的问题,掌握NLP最前沿技术的人几乎都在高校中,而最需要使用这项技术的人还在市场中苦苦寻觅;三是针对各个行业的语料库数据不足,导致落地时无法顺利推进。

在当前NLP产学研用仍处于被动掣肘的大环境下,中国人工智能市场的发展规模又是怎样一番景象呢?我们来看一组数据:

聚焦NLP市场:放眼全球,whatech预测2020年全球NLP市场规模将近134亿美元,而随着中国NLP市场的逐年扩大,保守估计到2020年,中国NLP市场至少占全球900亿人民币的10%,约90亿人民币,并将带动1000亿相关市场的发展。此时,正处于少年期的NLP将一展身手,大有可为。

NLP被称为人工智能“皇冠上的明珠”,也是人工智能领域最难突破的部分。中国声谷运营单位总裁祁东风表示,“作为全国首个定位于人工智能领域的国家级产业基地——中国声谷通过自然语言理解技术的市场应用倒逼基础理论和关键技术创新,走出了一条独特且可持续的发展路径,与神州泰岳、国家中文信息学会联合打造了国内首个‘NLP开放平台——中文信息(深度)处理开放创新平台’,将NLP核心技术应用向各行业各领域纵深推进。”

NLP开放平台精耕细作 将实现多场景应用落地

针对NLP的中文歧义性难题,NLP开放平台拥有独创的“本体建模技术”,把与场景相关的领域知识、NLP任务、语言资源等内容进行形式化规范描述,使得NLP场景应用实现最大化的共享;如何处理语言结构的另一难题,平台又将符号化语义与深度学习技术结合,即能有效地识别多种语言结构,实现同一意思、不同结构的归一化处理。据了解,拥有自主知识产权的智慧语义认知技术对语言结构的递归嵌套处理也表现优异,目前该平台已经具备可以识别出3层以上语言结构递归嵌套的技术,极大增强了NLP的可解释性。

“NLP纵深行业应用,需要盯准需求,贴合业务,直击行业痛点,才能打开市场,独占鳌头。”近日,中国声谷入园企业—神州泰岳副总裁李国东在以“见智见未来”为主题的2019 全球人工智能产品应用博览会上介绍,神州泰岳在人工智能语义技术拥有10余年的技术研发优势,更是中国中文信息学会唯一指定的产学研合作单位,2018年依托中国声谷的“政策红利”和自身在NLP技术上的前沿科技对NLP开放平台进行全面的资源整合、精耕细作,已在多领域推动NLP技术赋能行业应用。

公安行业首当其冲,去年神州泰岳推出了一款面向公安行业的综合应用产品——“智脑2.0”,以人工智能-自然语言处理(AI-NLP)为核心,以极速计算、实体360°全息画像、数据共享为支撑的跨警种跨网域的产品,适用于公安全警种。最重要的是,“智脑2.0”独有的公安笔录文本分析功能,能通过感知智能技术和语义智能识别,对所有警员的有效研判动作进行记忆存储及分析,把海量的公安笔录全部阅读记录,并且进行提炼、归纳,将零碎的信息关联起来,为将来一键破案做足够积累。

公安只是NLP技术落地的其中一个场景,只要有语言、有文本的地方,都能用上NLP技术。增值境外服务——智慧旅游小漫、知识产权及专利审查及服务、法务及合同审查服务、智慧招聘、中医古籍知识挖掘服务、新闻(简讯)写作、会议通知、调研报告自动写作等等。NLP平台已开放的服务涵盖16个行业领域、140多个场景和200多个服务,未来将真正实现让NLP技术赋能应用开发。

神州泰岳&中国声谷

神州泰岳是中国声谷引入的智能语义领域龙头企业,于2017年正式入园。神州泰岳在人工智能语义技术拥有10余年的技术研发优势,更是中国中文信息学会唯一指定的产学研合作单位。2018年,中国声谷携手神州泰岳在推进发展智能语义应用与生态系统建设新闻发布会上,正式发布NLP开放创新平台。早前,权威媒体《互联网周刊》联合eNet研究院发布了“2018年度人工智能企业TOP100”,榜单中收录了中国互联网、人工智能、生物识别、大数据、基因健康等多领域的知名企业,神州泰岳作为NLP引领者荣列人工智能企业百强榜单,并位列TOP18。

神州泰岳