一起来看看!神州泰岳&北京师范大学人工智能联合实验室年度成绩单出炉

2018-06-26

近日,神州泰岳-北京师范大学人工智能联合实验室(以下简称“联合实验室”)2017-2018年度工作会议暨学术委员会第二次会议在北京师范大学顺利召开。

2017年NLP基础研究建设,我们是认真的!

成果一:联合实验室研究并发布ngram2vec工具包,为用户提供了便捷的词向量特征接口,相关成果论文后已在自然语言处理领域顶级会议EMNLP 2017上发表。

成果二:对中文词表示效果的评价进行研究,提出了词相似、词类比、外部任务三种独创性的评测方法及相关数据集。其中,word analogy数据集包括2300多道语法推理题和9000多道语义推理题,如判断“马云-马化腾+腾讯”是否能得到“阿里巴巴”,使用词向量可进行快速、准确的词义推理。

成果三:基于卷积神经网络和循环神经网络的算法研究,成果论文已被EMNLP 2017收录,并针对中文特点进一步对比研究,可服务于不同版本的评测任务。

成果四:中文评测资源搜集和建设工作,构建了服务于文本分类和情感分析的豆瓣影评、豆瓣读书评论和京东电子产品评论数据集,每个数据集各4-5万条语料。

2017年学术成果应用转化,我们做到了!

联合实验室将北师大中文信息处理研究所深耕多年研发的HNC语义分析系统集成到了神州泰岳DINFO-OEC平台上,实现了学术成果向产业应用的转化,同时为神州泰岳提供了创新的前沿技术,提高公司在技术研究上的核心竞争力。

同时,联合实验室成员完成了4000篇金融领域新闻语料中命名实体标注及质检工作,并开展了金融领域新词挖掘工作,增加金融领域普通新词4000个,实体新词3300个,并与美国Emory University商学院吴炎彬博士、北京师范大学金融系马伟博士合作完成了金融领域知识图谱体系建设,相关工作很好地融合了自然语言处理领域知识本体建设思路和金融领域业务知识。

相关成果对于神州泰岳在金融行业的应用落地提供了坚实的技术保障。此前,神州泰岳凭借独创的智慧语义认知技术为四大国有银行中的“中、工、建”三大行提供NLP技术实施平台,与招商银行、光大银行、北京银行等多家股份制银行和城商行以及众多保险、证券公司达成合作事项,获得了金融客户的高度认可。

业界给我们的评分

2017年,联合实验室在ACL、EMNLP等国际顶级会议或中文核心期刊上发表论文18篇,其中包括英文国际会议论文6篇,中文核心期刊论文5篇。与人民大学DBIIR实验室合作发布了在业界具有影响力的Chinese-Word-Vectors、Semantic-CNN、Ngram2vec等Github开源项目,其中Chinese-Word-Vectors是目前全网最全的预训练语言向量资源,发布仅两周便在Gihub上获得超过1500星,并得到机器之心、PaperWeekly、汉语堂等媒体的广泛报道与推荐。

学术界的评分

2017年,联合实验室培养毕业博士研究生1人,硕士研究生4人,招收新入学的硕士研究生4人,目前在读研究生15人,包括博士生2人,硕士生12人;邀请北京大学俞士汶教授、国家语委靳光瑾研究员、社科院张一清教授等专家为联合实验室成员开展讲座共计6次,联合实验室成员参加国际会议7人次,国内会议8人次。2017年,联合实验室为AI人才培养贡献自己独特的力量!

联合实验室在2017-2018年中积极推动实验室在基础研究、应用成果转化、人才培养等领域的落地,完成了2017年学术委员会订立的目标。

至此,神州泰岳-北京师范大学人工智能联合实验室2017-2018年度工作会议暨学术委员会第二次会议圆满结束!