人工智能首页 > AI资讯 > 正文

语音识别、自然语言处理、计算机视觉等人工智能技术日益成熟

2019-09-10 阅读888次

  在这种探索和思考下,“多模态”成为人工智能领域诸领军式专家和学者重点谈及的研究方向,例如,自然语言处理领域专家刘群教授在此前 与 AI 科技评论的对话 中,就曾谈及诺亚方舟语音语义实验室目前的一大重点研究方向便是多模态;德国汉堡科学院院士张建伟认为人机交互的未来是多模态共享模式;计算机视觉领域专家贾佳亚教授则在多场演讲中提出 「多模态是人工智能的未来」 这一观点。

  而腾讯作为业界关注这一研究方向的代表之一,自 2018 年 2 月就开始关注多模态方向的研究,并于 2018 年 11 月宣布探索下一代人机交互方式:多模态智能。

语音识别、自然语言处理、计算机视觉等人工智能技术日益成熟" alt="语音识别、自然语言处理、计算机视觉等人工智能技术日益成熟" width="90%"/>

  9 月 2 日,在腾讯 AI Lab 携手 Nature Research(自然科研)及旗下《自然-机器智能》、《自然-生物医学工程》两本期刊联合举办世界首届「Nature Conference - AI 与机器人大会」上,语音识别领域的领头人之一、腾讯 AI Lab 副主任、多模态虚拟人项目负责人俞栋博士更是基于其在多模态技术上的研究成果,带来了《虚拟人中的多模态合成技术》的演讲报告,以虚拟人项目为载体,向大家介绍了多模态的技术优势,并分享了腾讯 AI Lab 在这一方向上的研究和应用探索。

  会后,AI 科技评论还对俞栋博士进行了专访,进一步探讨了多模态的应用探索情况,其中,俞栋博士在将多模态这一研究方向视为迈向通用人工智能的突破口的同时,也以更加冷静的态度指出,多模态会是未来人工智能的一个非常重要的方向,但并不是全部。因为人工智能是一个很广泛的概念,我们目前对它可能只是略知皮毛,通往通用人工智能的这条路到底是怎么样的,大家都还处于一个探索状态。

  与此同时,AI 科技评论也借此机会跟俞栋博士聊了聊他领先将深度学习技术应用到语音识别领域的历史渊源、从微软研究院到腾讯 AI Lab 的职业转变经历以及其对于语音识别领域未来发展的看法。


随意打赏