近日,浦东新区科技和经济委员会公布了2021年度浦东新区科技发展基金产学研专项(人工智能)资助名单。传音控股和华东师范大学联合申报的项目“基于认知理解生成的开放域跨语言知识图谱构建与应用”成功获批。双方在自然语言处理、知识图谱、跨语种知识迁移等技术的系统研究和合作成果获得评审专家的认可,并将推动相关技术在新兴市场智能语音对话系统领域的落地应用。
近年来,随着深度学习技术的进步,汉语、英语等大语种自然语言处理技术日趋成熟,并在语音对话等方面获得广泛应用。但要构建一套跨越众多细分生活领域、覆盖多种语言的智能理解和对话系统,仍然面临着部分垂直领域、小语种语料不足以及对于海量数据(603138)人工标注的依赖。部分场景下数据难以获取、难以标注、难以评估且语言专家稀缺,成为行业研究难题,距离实用门槛仍有较大差距。
该申报项目聚焦在非洲、南亚等传音智能终端目标市场,深度调研本地生活与语种。基于在市场深耕多年的人力与渠道优势,传音持续低成本采集、标注语料数据,为算法模型输送海量的高质量语料,解决了小语种语料稀缺与成本高昂的问题。同时研究多形态信息抽取、低资源条件下的认知理解和推理、跨语言知识图谱构建及对齐等算法,降低对于小语种、细分领域的语料标注依赖,同等语料量下提升了语言认知理解的准确率。
项目将构建起一套跨语言的开放域服务系统,最终赋能传音智能手机的语音交互、对话等场景,以便捷实用的功能辐射用户生活、工作、出行与娱乐,形成本地化的AI内容服务生态。
除了打造非洲、南亚地区本地化多语言认知服务,构筑传音自身的产品壁垒,项目所形成的自然语言处理技术解决方案,也将持续释放“红利”,加快国内人工智能技术在海外新兴市场的渗透率及覆盖率。通过赋能行业伙伴出海,在客服、教育、IoT等多领域进行创新,项目成果将助推新兴市场行业融合、发展数字经济,以技术创造更多社会价值。
《电鳗快报》
凡注有"天津滨海网"或电头为"天津滨海网"的稿件,均为天津滨海网独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"天津滨海网",并保留"天津滨海网"的电头。
- 巨大气体巨星:热木星WASP-121b黑暗面神秘面纱首次揭示
- 研究表明:大脑中的神经元会在某些数学运算中受到特别激发
- 有史以来在单张图像中观测到的最大日珥喷发 整个太阳盘都在一张图片中
- 自加热食品中的加热包会释放出有毒气体吗?误喝了泡过加热包的水会中毒吗?
- 天文学家在星系NGC1068中心观测到宇宙尘埃环 活跃星系核“统一模型”确认
- 超强激光照射石墨烯实现高能离子加速 癌症有可能被治愈了?
- 美国威斯康星大学开发最精密原子钟 3000亿年误差仅1秒
- 国药集团自主研发生产的脊髓灰质炎灭活疫苗通过世卫组织预认证
- 我国第二台华龙一号核电站将正式投入商业运行 年发电能力近100亿度
- 夜深人静时你是否听到过弹珠落地滚动的声音?别怕!是水锤效应!