AI群英谱丨晋耀红:一个坚持语义之路的跨界专家

2018-12-21

说起神州泰岳的人工智能,就不能不提到人工智能研究院院长晋耀红博士。在泰岳,大家都管晋耀红叫“晋博”。泰岳的博士不止他一个,大家之所以这样叫他,是因为在他身上一直有浓郁的学者气质。

晋博是名副其实的人工智能专家,自1998年以来,专注NLP领域的科研开发,已有20个年头了。从中国科学院声学研究所副研究员,到北京师范大学教授、博士生导师、学科带头人,再到中科鼎富公司的联合创始人,晋博的足迹,跨越了NLP的科研、教学、产业等多个领域,在每个领域都做得风生水起。晋博曾主持、参与过数十项国家级科研项目,主持过国家“十二五”的863主题项目,出版过专著一本,培养了多名NLP领域的博士生和硕士生。

晋博现在是神州泰岳人工智能研究院院长兼首席科学家,负责核心技术的研发,负责支持集团在电信运营商、公安、金融等行业的人工智能应用落地工作。晋博带领人工智能研究院研发的语义认知平台—OEC平台,是业内第一个具有业务建模能力,支持大数据分布式计算技术、深度学习TensorFlow的NLP语义认知平台,平台支持200多个NLP算法的调用,支持对业务知识进行建模,支持通过可视化流程构建NLP应用,使得NLP应用的开发和落地更智能、更快捷。语义认知平台已有130多项专利,获得了多个行业奖项,并已在公安、金融、运营商多个行业广泛应用。

虽然角色在不断变化,但晋博坚持NLP以语义为核心的初心一直没变。晋博在中国科学院研究的是语义的符号化,研究符号化的表示方法,研究基于符号化的词义消歧算法,以及语言结构识别算法;在北京师范大学研究的是海量文本的统一知识表示,以及大规模语义应用系统在行业中的应用。晋博认为,NLP是处理语言的,NLP处理的结果和过程,都需要具备语言的可解释性。目前深度学习技术在NLP研发中已经成为最重要的技术之一,但是,我们可以看到,深度学习对语言结构的处理能力依然很弱,将语义符号化和深度学习技术深度融合,是NLP未来的可行之路。

NLP的开放赋能,是晋博现在最关注的事情。晋博现在负责泰岳语义工厂产品的研发,语义工厂是神州泰岳即将推出的NLP民主化的SAAS平台。语义工厂将更进一步降低NLP的门槛,不仅开放基础的NLP技术,同时将把神州泰岳数十年来,在多个行业典型用户积累的应用场景知识、算法、模型,打包成面向场景的服务,服务的效果已经在行业用户中得到验证。开发者只需要一次调用,输入待处理的非结构化文本,即可输出想要的结构化数据。整个过程,无须开发者标注数据,无须调参,无须长时间训练,无须二次开发,开发者即使没有任何NLP技术背景,也可以轻松地把NLP技术嵌入到自己的应用中去。

晋耀红

神州泰岳人工智能研究院院长兼首席科学家,博士生导师,师从中国自然语言处理著名流派概念层次网络(HNC)的创始人黄曾阳教授并于2006年出版专著《HNC(概念层次网络)语言理解技术及其应用》。国家863十二五课题(2012~2015)“海量文本多层次知识表示及中文文本理解应用系统研制”的课题负责人;科技部国家科技支撑计划十一五课题(2007~2011)“中文信息处理应用研究与系统开发”之“中文智能搜索引擎核心技术和应用示范系统”的课题负责人。