流程引擎能力中心 全栈智能监控中心 AI能力中心 能力编排中心 机器人能力中心 用户服务中心 RPA能力中心 自动化能力中心 统一采集操作中心 配置资源管理中心 数据共享中心 猎豹智维平台
身份与访问安全管理系统 Ultra-SecFort集中运维审计堡垒机系统 Ultra-ZTIAM 零信任身份服务系统
Ultra-AMR资产安全核查系统 Ultra-BMS安全基线管理系统 Ultra-DeepScanner 深度漏洞全量核查系统 Ultra-PWAnalyser 资源弱口令核查系统
Ultra-APT Detector高级网络威胁识别 Ultra-SmartSensor全流量数据采集探针 Ultra-FWAnalyser 神州泰岳防火墙策略核查系统
Ultra-SOMC安全运行管理中心 Ultra-SecSight信息安全大数据态势感知系统 Ultra-ESA企业综合安全审计系统 SecSight-SOAR安全编排自动化与响应平台
Ultra-DSM数据安全管控产品 Ultra-SmartDLP Detector数据防泄漏系统 Ultra-MSFolder个人安全文件夹系统
Ultra-SmartLxCShield容器安全防护系统 Ultra-SmartGrid网络资产智能微隔离系统 Ultra-SecCloud安全云服务平台 Ultra-SmartShield云主机安全防护系统
5G专网通信产品 EVA泛融合通信平台 高精度定位系统 宽带接入微基站 物联网传感器 EVA会议宝私有云一体机
接入节点设备 汇聚节点设备 智能温控除湿机 特高频局放传感器 超声波局放传感器 暂态地电压局放传感器 SF6气体微水与密度监测传感器 暂态地电压(TEV)超声波局放传感器
全业务可观测平台 Ultra-AIOps 企业知识共享平台 敏捷ITSM管理 数智化运营管理 数字化研发效能平台 电信业务端到端监控
混合多云管理 IDC运营管理 集约化综合网管 算网大脑 核心网运维工作台 IP运维工作台 家客业务运营支撑 政企业务运维支撑系统解决方案 CDN运维工作台 SDN控制器 电子运维管理平台
大模型MaaS平台 智能数据分析 IP网运维智能体 核心网运维智能体 知识增强 智能办公助手 智能研发
消息中台 5G消息CSP平台 渠道运营服务解决方案 一体化营销服务 短信网关
身份与访问控制解决方案 安全合规解决方案 安全威胁分析与预警解决方案 安全资产管理解决方案
特权帐号管理解决方案 一体化信息安全风险感知解决方案 安全基线管理解决方案 安全审计解决方案
安全运营管理解决方案 安全运行保障解决方案 网信办安全态势感知解决方案
泰岳安全中台解决方案 零信任安全解决方案 泰岳数据安全解决方案
AWS SMB上云服务 AWS DevOps服务 AWS架构优化服务 云原生应用开发服务 AWS账单服务 AWS上云迁移服务 AWS云上代维服务
5G通信解决方案 Nu-Comm融合通信系统 智慧园区解决方案
变电在线监测系统解决方案 变电站远程智能巡视系统解决方案 变电数字孪生站智能一体化解决方案 数字主变健康多元状态评估解决方案
社区警务便民小助手解决方案 智脑案情分析系统解决方案 警情数据分析平台解决方案
“NLP是语言与计算结合的技术。”
自然语言处理(NLP)是人工智能和语言学的一部分,致力于使用计算机理解人类语言中的句子或词语,实现降低用户工作量并满足使用自然语言进行人机交互的目的。
语法、语义、语用一个都不能少
晋耀红博士认为,在现阶段自然语言处理存在重计算轻语言的倾向,这是比较片面的。因为NLP的研究对象是语言,所以不能脱离语言谈NLP,而必须基于语言知识,同时利用计算机技术来进行NLP的处理。
语法的作用
我打小明。 狼吃羊。 网易收购Daydream公司。
动词前面的主语是“我”、“狼”、“网易”是动作的发出者,是施事,主语后的宾语“小明”、“羊”、“Daydream公司”是动作的承受者,是受事。如果颠倒过来,“小明打我”、“羊吃狼”、“Daydream公司收购网易”,那么意思就完全变了。 语序作为重要的语法手段,规定了谁是动作的实施者,谁是动作的承受者。
语义的作用
小鸟在天空中飞翔。 白菜在天空中飞翔。
第一个句子非常自然。而第二个句子虽然符合语法,却让人忍不住思考,在什么情况下,白菜才能在天上飞。这是因为“小鸟”在语义平面上具有“飞翔”的功能,而“白菜”不具备此功能。 语义歧义性是待攻克的难点。
语用的作用
有一个程序员出去买东西,妻子跟他说:“买五个桃子回来,要是看见卖西瓜的,就买一个。”结果他买了一个桃子回来。妻子非常生气。
在这个情景里面,妻子的意思是如果看见卖西瓜的,就买五个桃子一个西瓜。而丈夫误解了妻子的意思。
误解的产生及其原因是属于语用平面的范畴。
晋博士谈到,泰岳AI研究院在此方面投入了大量研究精力,最新推出的非结构化文本大数据分析挖掘平台DINFO-OEC8.0,通过其独有的专属语义模型建设能力,能够实现语义消歧、语义归一化/概念化,可解决非结构化数据处理技术中语言表达灵活、多样化的挑战难题,精准挖掘业务语义,提炼非结构化数据中业务价值信息。
计算方法是语言知识量化的手段和沟通桥梁
晋博士认为,除了语言学知识,要对语言进行全面分析,计算方法也必不可少,我们很长时间内以传统的统计学习方法为主,进入21世纪以后,基于词嵌入的深度学习方法进入了人们的视线并且迅速掀起新的浪潮。不同于之前的统计学习,其训练基于浅层的、高度稀疏的特征,并且高度依赖于人工对特征的选择。深度学习方法是基于密集向量表征做多层级的自动特征表征的学习,能够实现对特征的自动学习。正如DINFO-OEC8.0,我们集成统计学习、机器学习、深度学习等关键自然语言处理技术,针对泰岳自主研发的专属语义模型作了进一步创新与改进,集成深度学习计算能力,实现平台对大规模训练语料的学习与预测。
晋博士谈到,目前在图像识别领域,深度学习的识别准确率达到、甚至超过了人类水平;在语音识别领域,深度学习帮助语音识别从实验室走向了商用。而在NLP领域,深度学习的应用尚未有重大突破,但在文本分类、命名实体识别、词义消歧、情感分析、机器翻译领域,采用深度学习的应用均超过了当时的最优方案,取得了不俗的成绩。
语言与计算的有机结合是NLP达到实用目标的关键
在实际应用场景中,如客服热点的自动挖掘、企业关联图谱等,NLP的应用经常是多个任务协同处理,共同输出结果。如何将语言知识与计算方法有机组织到一起,如何将各个NLP任务有效结合,是NLP应用达到实用目标的关键所在。