泰岳语义工厂:要做中国的NLP Inside?

2019-02-28

正如大家熟知的“Intel Inside”广告语一样,Intel公司只做计算机的CPU芯片,不做硬盘、显示器、主板等配件,也不做计算机整机组装;“UltraNLP Inside”,泰岳语义工厂只做NLP服务,不做业务流程、界面等业务逻辑相关的开发,也不做完整的解决方案。

以“数字转型·智创未来”为主题的2019中国IT市场年会于今日在北京拉开帷幕,神州泰岳人工智能研究院首席架构师刘大双在人工智能高峰论坛上发表精彩演讲。通过对NLP技术行业应用现状、泰岳语义工厂多领域场景化NLP服务以及泰岳的技术积累三方面的介绍,他向参会领导和嘉宾深入浅出地讲解了神州泰岳NLP技术赋能行业应用开发的独特优势。

打破行业壁垒 赋能传统行业

NLP技术能力需要大量长期的研发投入和技术突破,对于以应用开发为主的机构来说,自身建立NLP能力存在的困难还是十分巨大的,包括人才的获得和成本的控制,虽然以百度为代表的BAT大厂已经赋能传统行业开放了NLP技术相关的接口和服务,但是远远不能满足市场对NLP技术的需求,更谈不上用人工智能认知技术“赋能”传统行业。

针对NLP需求的这一痛点,泰岳语义工厂强力打破NLP行业应用的技术壁垒,不仅开放基础的NLP技术服务,同时把神州泰岳数十年积累的行业典型应用场景知识、算法、模型打包成面向具体场景的服务,为企业客户和行业应用开发商提供最专业、最快捷、性价比最高的自然语言处理技术和服务。

三大类 16个行业 200余项服务

泰岳语义工厂开放包含NLP基础服务、应用场景服务和数据服务等三大类服务,涉及16个行业领域,共计200余项服务。NLP基础服务涵盖深度学习、信息抽取、情感计算、自动写作等7类,共计43个服务接口;场景应用服务涵盖了银行、政府、互联网、电商、证券、保险、企业应用、运营商等16个行业领域,共计142个场景化服务;数据服务包含语义资源服务、深度学习模型、数据资源服务、数据加工服务等5类,共计30个服务。

以文件自动化处理服务为例,泰岳语义工厂可以提供的服务类别重点,包括司法裁判文书解析、合同合规性审核、资产证券化发行说明书结构化、招股说明书结构化等,其中对司法裁判文书的解析,开发人员只需要一次调用相关服务,输入需要解析的司法裁判文书,就可得到超过40个数据项的结构化输出,召回率达到99%,准确率达到96%。

神州泰岳人工智能研究院首席架构师刘大双演讲现场

20+20的技术积累和行业理解

谈到神州泰岳的技术实力,刘大双认为,首先是积累。神州泰岳以20多年的中文信息处理研究成果为基础,结合自身在ICT运维管理方面20多年的研发经验,通过与北京师范大学等多家高等院校和研究机构合作,专注于中文语义理解领域,锲而不舍,研发了自成一派的智慧语义认知技术,在金融、公安等领域取得了良好的应用成果。这两个“20多年”的积累与完美结合,开创了中文语义处理的新局面,形成了神州泰岳在人工智能和大数据领域的独特优势。