- N +

王海峰:语言与知识布局要把握技术与产业两大趋势

原标题:王海峰:语言与知识布局要把握技术与产业两大趋势

导读:

  自然语言理解(NLP)素有“人工智能皇冠上的明珠”盛誉,这也意味着语言与知识等认知层面的技术突破将进一步促进AI深入发展。  8月25日,以“掌握知识、理解语言、拥有智能”...

  自然语言理解(NLP)素有“人工智能皇冠上的明珠”盛誉,这也意味着语言与知识等认知层面的技术突破将进一步促进AI深入发展。

  8月25日,以“掌握知识、理解语言、拥有智能”为主题的百度大脑语言与知识技术峰会举行,百度CTO王海峰发表主旨演讲,解读百度语言与知识技术的发展历程与最新成果,与产学研各界分享技术及产业发展趋势和展望,百度集团副总裁吴甜和百度技术委员会主席吴华分别发布百度语言与知识技术系列产品和数据集共建计划,重磅推出5款产品的新发布,全面加速AI技术大规模应用。这是一场凝聚了百度在语言与知识领域十年技术积累和产业实践的盛会,必将带来深远影响。

  语言与知识技术是人工智能认知能力的核心。2010年,百度成立自然语言处理部,在前瞻技术与产业格局上不断引领、创新,十年间已成为中国NLP发展的一面旗帜。

  峰会上,王海峰回顾,“在百度语言与知识技术的布局和发展中,我们始终在注意把握两个趋势,即技术发展趋势和产业发展趋势,并力争引领趋势。”

  纵览百度语言与知识技术发展历程,从研究方法、研究对象、研究方向、产业应用等各个层面,布局完整,不断打磨成熟,始终与应用的发展趋势、需求一脉相承,与产业接轨。

  十年来,百度大脑语言与知识技术成果丰硕,获得包括国家科技进步奖在内的20多个奖项,30多项国际竞赛冠军,发表学术论文超过300篇,申请专利2000多项。技术不断突破创新的同时,也在产品上创新探索,同时将领先的技术输出给开发者与合作伙伴,提升各行业智能化水平。

  首先,知识图谱是机器认知世界的重要基础,百度打造了世界上最大规模知识图谱,拥有超过50亿实体和5500亿事实,并在不断演进和更新。百度知识图谱应用于各行各业,每天的调用次数超过400亿次。

  其次,在融入知识的基础上,语言理解能力不断增强。2019年3月,百度提出知识增强的语义理解框架ERNIE,在深度学习的基础上融入知识,同时具备持续学习能力,曾一举登顶全球权威数据集GLUE榜单,首次突破90分大关,刷新榜单历史。基于知识图谱和语义表示,突破了阅读理解、对话理解以及跨模态深度语义理解等技术。

  第三,语言生成是语言与知识技术中的重要组成部分。基于预训练技术的成功经验,百度提出基于多流机制的语言生成预训练技术,兼顾词、短语等不同粒度的语义信息,显著提升生成效果。百度也探索了多文档摘要生成,通过图结构语义表示引入篇章知识,在单文档和多文档摘要生成效果都有提升。

  应用系统层面,对话系统和机器翻译等成绩卓著。百度提出了知识图谱驱动的对话控制技术,以及首个基于隐空间的大规模开放域对话模型PLATO等,并推出智能对话定制和服务平台UNIT,帮助开发者高效构建智能对话系统,实现规模化应用。百度翻译支持200多种语言,每天响应超过千亿字符的翻译请求,支持超过40多万家第三方应用,技术上,提出了多智能体联合学习、基于语义单元的同传模型、稀缺语种分组混合训练算法等。

  百度大脑语言与知识技术的持续探索和创新取得了令业界瞩目的成绩,同时这些技术以平台化的方式输出,赋能千行万业,持续提升产业智能化水平。

  王海峰首次发布了百度大脑语言与知识产品全景图。百度集团副总裁吴甜接续发布语义理解技术与平台文心、智能文档分析平台TextMind和AI同传会议解决方案3大新产品,同时发布了6项升级,包括智能创作平台的3个场景方案、以及智能对话定制与服务平台UNIT的3项全新升级。

  吴甜表示,“我们一直致力于将语言与知识技术凝聚成一系列技术平台和产品,在应用中产生大量价值,为广大开发者和产业实践者提供以语言与知识技术为核心驱动的系列产品。”

  百度推出的语义理解技术与平台文心,基于深度学习平台飞桨打造,依托领先的语义理解核心技术,集成优秀的预训练模型、全面的NLP算法集、端到端开发套件和平台,提供一站式NLP开发与服务,让开发者更简单、高效地定制企业级NLP模型。文心经过了大量真实应用场景的淬炼,具备优秀的工业级落地实力。

  全新发布的智能文档分析平台TextMind,基于OCR、NLP技术,以文档解析为核心能力,支持文档对比与文档审核,具备“多快好省”的核心优势,促进企业办公智能升级。

  百度大脑智能创作平台针对媒体应用场景再升级,全新推出智能策划、智能采编、智能审校三大媒体场景方案,进一步助力媒体人更快、更好地创作,可谓切中媒体人的“痛点”。

  智能对话定制与服务平台UNIT升级3大特性:更智能的任务式对话理解、极致便捷的表格问答和融合通用的新对话引擎。此次UNIT全新升级的三大能力,将进一步降低任务式对话、智能问答的定制成本,并融合通用对话能力,提升交互体验。

  全新发布的AI同传会议解决方案,覆盖会议全场景、全流程,旨在打造用户随身的“会议同传专家”。吴甜现场展示了如何只用一台电脑和一部手机快速搭建一套同传服务,只需点点鼠标、打几个字,就能快速获得专业的同传服务。

  数据匮乏、算力不足历来是语言与知识技术研发中面临的瓶颈。为突破瓶颈,百度联合中国计算机学会、中国中文信息学会发起中文自然语言处理数据共建计划——千言,解决数据稀缺问题。千言一期由来自国内11家高校和企业的数据资源研发者共同建设,已涵盖开放域对线余个中文开源数据集。

  百度技术委员会主席吴华表示,“未来,我们希望有更多的数据集作者能够参与共建千言,共同推动中文信息处理技术的进步,建设世界范围的中文信息处理影响力。我们计划在未来3年,面向20多个任务,收集和建设不少于100个中文自然语言处理数据集,覆盖语言与知识技术全部领域。”

  (百度技术委员会主席吴华(中)与中国中文信息学会副理事长兼秘书长孙乐(左)、中国计算机学会自然语言处理专委会主任周国栋(右)一起正式启动千言计划)

  吴华还发布了百度语言与知识技术算力共享计划,通过百度AI STUDIO平台提供算力支持,让广大开发者破除算力桎梏,专注于技术创新。

  十年征程,百度语言与知识技术发展历程中培养、吸引了大量全球顶尖人才。会上,百度推出以王海峰为代表的百度NLP“十年十人”,十年坚守,不忘初心,秉持“技术信仰”,勇攀技术高峰,矢志不渝致力于让机器更好地理解世界、更好地服务于人。

  正如王海峰所言,“我们致力于更好地与学术界、产业界携手,推动语言与知识技术发展,进而推动人工智能技术持续进步,为产业智能升级、社会经济高质量发展贡献力量。我们对未来充满信心,坚持研究和发展让机器掌握知识、理解语言、拥有智能,继续突破和创新,为技术和社会进步做出更大贡献。”(一鸣)

  (记者 李彦国)记者30日从吉林省新闻出版局获悉,该局根据初步调查结果,对刊发“熟蛋返生孵小鸡”论文的《写真地理》杂志做出停刊整顿、主要负责人责令辞职的处理。

  到了宋代,江南农业快速发展,迫切需要一部讲述江南农耕技术的农书来指导当地的农业生产,陈旉的《农书》应运而生。

  康熙下令在养心殿内开设西药实验室(作坊),将西方的医药技术引入国内,研制、生产中西医结合特色的御用药剂,以用于紫禁城皇室成员的疾病治疗。

  23年间,秦扬亲眼见证并参与了中国空降兵重装空投技术从弱到强的艰辛历程,先后实现重装空投技术数十项创新。

  版权保护的难点是版权作品的内容与版权确权,“授权交易等流程的割裂,数据资产易复制难确权导致侵权容易而成本极高。

  据《泰晤士报》报道,美国总统拜登和他的前任特朗普援引《国防生产法》而发布了目前的疫苗出口禁令,用于增加美国的疫苗产量。

  海洋能吸收二氧化碳(CO2),在气候调节中发挥着至关重要的作用,海洋的这一功能目前尚未得到充分了解。

  为了进一步提高二氧化钒的上述性能,俄罗斯科研人员采用了一种新的合成方法,为新材料赋予了一种特殊的微观结构:形状类似于圣诞树。

  目前在世界蔓延的主要变异株,包括英国变异株B.1.1.7,南非变异株(B.1.351,501Y.V2),巴西变异株B.1.1.248,美国加州变异株B.1.429(或CAL.20C),以及印度变异株B.1.617等。

  钻石是进行量子信息处理和量子传感的良好平台,研究团队利用钻石中晶格空位缺陷在真实的量子实验中成功展示了这一算法的能力。

  过去20年全球冰川质量损失一直在加速。研究团队利用现有的独立、高精度测量数据验证了他们的估算结果,并计算了冰川个体的体积和质量变化。

  入选中成药治疗流感循证评价证据TOP榜是:连花清瘟胶囊/颗粒、金花清感颗粒、疏风解毒胶囊、抗病毒颗粒/口服液、香菊胶囊、小儿豉翘清热颗粒、板蓝根颗粒。

  长征五号B运载火箭是专门为我国载人航天工程空间站建设而研制的一型新型运载火箭,于2020年5月5日成功首飞。

  据介绍,4月以来,我国累计新增境外输入确诊病例364例,日均新增较上月增长超过两成,外防输入、内防反弹压力持续增大。

  “麻雀虽小,五脏俱全”,核心舱除含有全套生命维持装置外,还负担了航天员初期驻留以及科研所需的全部物质条件——从居住区到科研区一应俱全。

  空间站建造任务分为关键技术验证和建造两个阶段实施,共规划12次飞行任务,计划2022年前后完成。

  4月29日11时23分,随着长征五号B遥二运载火箭直冲云霄,中国空间站天和核心舱开启飞天之旅,我国航天事业迈进空间站任务新时代。

  北京时间4月29日11时22分左右,长征五号B运载火箭搭载的“天和”核心舱在海南文昌发射中心发射升空并顺利抵达轨道,拉开了我国空间站建设的序幕。

  题:“在轨不小于15年”——带你揭开中国空间站“延年益寿”的秘密空间站在轨长寿命的秘方还有很多,比如舱体结构密封圈、壁板、各种阀门、各种管路等,都在可靠性和长寿命方面进行了巧妙的设计。

返回列表
上一篇:
下一篇:

发表评论

快捷回复:

验证码

    评论列表 (暂无评论,共7人参与)参与讨论

    还没有评论,来说两句吧...