发布时间: 2019年04月24日
4月20日,第十四届中国电子信息技术年会上,“百度大脑核心技术及开放平台”荣获2018年度中国电子学会科学技术奖科技进步奖一等奖。评议认为,百度大脑突破了听觉、视觉和语言一体化的多模态语义理解技术难题,成果支持零门槛深度学习定制化训练和千亿特征的神经网络训练,打造了一个完整的人工智能(AI)技术开放体系,并通过统一人工智能开放平台向社会共享,带动了互联网行业技术创新,推动了传统行业的智能化转型。
中国电子学会科学技术奖是国内电子信息技术发展的风向标。作为新一轮科技革命和产业变革的重要驱动力量,人工智能正在给国家社会经济发展、社会生产关系变革和普通大众的日常生活带来深远影响。今年两会《政府工作报告》中首提“智能+”战略,各行各业也都掀起了运用人工智能技术推动创新发展的热潮。作为国内最早布局人工智能的企业之一,百度不断进行AI技术的研究探索和应用落地实践,并通过开放赋能,为推动AI技术应用和创新积极贡献力量。
百度大脑是百度AI技术多年积累的集大成,包含语音、视觉、自然语言处理、知识图谱、深度学习等AI核心技术和AI开放平台。从2016年百度世界大会上宣布百度大脑完成基础能力搭建和核心技术初步开放,到2018年7月百度AI开发者大会发布百度大脑3.0,百度大脑已经构建起AI全栈技术布局,发展进入“多模态深度语义理解”阶段。在应用层面,百度大脑在全面支持百度业务的同时,全方位对外开放,通过赋能开发者和合作伙伴,发展AI技术生态,加速 AI 技术落地应用并与实体经济相融合,助力各行各业转型升级。
百度从诞生之日就和AI息息相关,多年来持续大力投入AI技术研发,推动百度大脑不断取得突破。截至目前,百度大脑已获相关技术发明专利授权200余项,在国际期刊和学术会议上发表相关论文100多篇,多次在WebVision、ActivityNet、NIPS、SemEval等国际知名人工智能竞赛或测试中夺得桂冠。百度连续三年上榜全球知名科技媒体《麻省理工科技评论》“全球十大突破性技术”榜单。国际期刊《自然》评价称“百度已成长为以AI技术为重心的科技巨头”。
百度大脑扎实领先的技术实力,也在通过开放赋能深入与实体经济融合,服务各行各业和亿万用户。百度大脑已对外开放了160多项领先的AI能力,广泛应用于互联网、交通、工业、医疗、零售、金融等诸多领域。比如,在医疗领域,基于百度大脑能力打造的百度灵医,布局诊疗全流程,帮助提升诊疗效率,从而惠及更多患者;在农业领域,智能摇杆拍摄光谱可以借助图像识别技术精准估算不同田地的农药使用量,有针对性地施药杀虫,减少了用药浪费的情况,也更符合环保需求;工业应用方面,基于百度深度学习平台PaddlePaddle打造的智能零件分拣机,分拣精度可达到90%,预测速度较同类产品快20%。同时,百度大脑与政府合作,如与雄安新区管委打造智能城市、与天津市政府打造“天津智港”等,提升公共服务和城市管理能力,让AI惠及大众。
会上,百度高级副总裁、AI技术平台体系(AIG)和基础技术体系(TG)总负责人王海峰发表以《语言与智能》为题的主旨演讲,结合语言与知识相关技术的发展变化,以及百度在相关技术领域创新和应用发展的经验,阐释语言与智能的关系及技术趋势。
如何理解和运用自然语言,是人工智能需要解决的核心问题之一。当下,大数据、知识图谱、机器学习、深度学习等技术快速发展,并与自然语言处理密切结合,推动语言智能持续发展和突破,并越来越多地应用于各个行业。
他提到,近年来深度学习的崛起及其与大数据的结合,使人工智能得到飞跃式的发展。在自然语言处理领域,深度学习模型具有比传统机器学习模型更强的数据学习能力,使得基于深度学习的依存句法分析等自然语言处理系统准确率得到大幅提升。目前,深度学习领域主要有强化学习、监督学习、无/自监督学习三种学习范式,而无/自监督学习可以类比人类学习,是一种重要的学习方式。
自监督学习让基于大规模无标记语料的语言模型得到了长足的发展。近期, 谷歌、百度分别提出了无监督文本的预训练语言模型BERT、ERNIE,将自然语言处理任务的性能提升到新高度。百度提出的基于知识增强的ERNIE 模型,通过建模海量数据中的实体概念等先验语义知识,学习真实世界的语义关系。相较于谷歌 BERT基于字单元的语义建模,ERNIE直接对先验语义知识单元进行建模,并通过海量文本数据学习实体间的语义关系。这种融合知识的语义建模大幅增强了模型语义表示能力,在包括语言推断、语义相似度、命名实体识别、情感分析、问答匹配等自然语言处理各类任务上的多个公开中文数据集上,ERNIE均取得了优于BERT的效果。
依托深度学习技术的发展,语音、图像等感知技术取得了巨大进步,但认知技术的突破会越来越依赖知识,需要提升对知识和大规模知识图谱的运用。在物理世界、人类社会和网络空间中,汇聚了大量的多元、异构、多模态的数据,百度借助无标签大数据开放域知识挖掘、知识体系自动扩展、知识整合等技术,基于海量数据构建起了超大规模知识图谱。目前,百度拥有世界上最大的多元异构知识图谱,除了包含数亿实体、千亿级事实,能够满足90%用户需求的实体图谱,针对不同的应用场景和知识形态,百度还建立起关注点图谱、行业知识图谱、POI图谱、事件图谱等多种知识图谱。比如在医疗领域,能够从病历等原始文本中,抽取出实体及多元关系,并进行文本结构化,最终构建起医疗图谱,同时结合医疗大数据、医疗认知计算,应用于医疗临床辅助决策服务中。
多模态知识与语言、视觉等技术结合,发展进入“多模态深度语义理解”阶段。例如,基于知识图谱的视频理解技术,能够从视频中抽取结构化语义知识,真正“看懂”视频。
语言理解技术持续发展,并通过与知识图谱、深度学习等技术融合,正不断提高各种应用的智能化程度。王海峰在演讲中介绍,百度创新地融合知识图谱、自然语言处理及深度学习技术,研发了能够深刻理解用户意图、精准满足搜索需求、提供更丰富知识内容的智能搜索引擎,并结合语音、图像、增强现实等感知技术能力,更便捷地与用户交互,为用户提供更精准高效的信息服务。
例如,用户用自然语言搜索“林徽因的丈夫的父亲是谁”,智能搜索引擎能够理解用户的意图,并结合知识图谱以图文并茂的形式把答案“梁启超”精准呈现给用户。又如,用户搜索“上面草字头下面句子的句是什么字”,智能搜索引擎能够为用户提供“苟”的读音、笔画、释义等丰富的信息。
除了智能搜索方面的应用,百度还基于语言理解和生成技术提供智能写作等能力。智能写作适用于财经、体育、天气、热点与娱乐事件等多领域的辅助与自动写作,大幅提升创作效率。比如,基于结构化的股票数据,可以生成关于股市的快讯新闻。结合视觉技术的智能春联,可通过刷脸检测出人物性别、年龄、微笑程度、性格特征等,生成特征词,然后基于神经网络生成技术创作出应景的春联,让人工智能技术融入大众的文化娱乐生活。
智能客服是结合自然语言处理、知识图谱和语音等技术打造的行业解决方案。在智能客服场景中,基于语音语义一体化技术,百度大脑可以准确识别出用户的话语,理解用户意图,进而通过行业知识图谱的赋能理解业务流程,为用户提供相应的服务。整个服务过程流畅自然,实现了与用户无障碍沟通,提升业务效率并满足用户需求。
百度领先的语言与知识技术,不仅广泛应用于智能搜索、深度问答、对话系统、智能写作、机器翻译等领域,为广大用户提供更智能的体验,满足用户对信息和服务的需求,还通过百度大脑平台全面开放,促进行业应用和创新。
当然,自然语言理解技术也面临着数据稀疏、知识未被有效利用、结合场景的语用研究等挑战。但王海峰表示:“随着技术发展,我们会越来越深入地理解自然语言、掌握知识,推动人工智能发挥更大的价值,为人类社会发展提供更大的助力。”
在演讲结束后,王海峰还参与了“技术引领+产业引领”高峰对话,与中国工程院院士樊邦奎、中国电子科技集团公司首席科学家陆军、中科大信息科学技术学院执行院长吴枫教授、阿里巴巴技术委员会主席王坚等在内的学界、产业界人士,就人工智能技术如何推动和引领科技与产业发展进行了探讨。他表示,未来,百度还将持续发力,推动AI技术创新,为国家创新驱动发展战略和各行各业的智能化升级持续贡献力量。