人工智能首页 > AI资讯 > 正文

为什么多模态是人机交互的发展趋势?

2019-09-10 阅读888次

  人机交互走过了键盘交互、触摸交互等若干阶段,目前许多设备采用语音交互的方式。而交互模式经历每一次变化背后的驱动力,都是对人和机器之间交互的便利性、自然性以及准确性所提出的更高的要求。

  为了更好地满足人机交互的这一需求,俞栋博士指出了一个非常重要的研究方向或者说发展趋势,那就是多模态人机交互。与此同时,俞栋博士也解释了为什么多模态是人机交互的发展趋势的原因,主要有四点:

为什么多模态是人机交互的发展趋势?

  第一,多模态交互能够让人类在不同的场景下可以选择不同的模态组合进行交互,进而从整体上提高人机交互的自然度;

  第二,在多模态技术下,一个模态可以补充另一个模态的弱点,从而能够通过融合多个模态的信息,获得更精确的用户、情感、场景、和发声人位置估计;

  第三,多模态交互具有「互为监督」的优势,即当机器无法获得某个模态的明显信息时,其他模态可以为其提供弱监督信息,让机器能够持续做系统自适应调整;

  第四,多模态能够让人们在与机器的交互过程中拥有多维感觉,从而能够从视觉、听觉、触觉等多方面体会机器的情感和表达的语义。

  而除了所具备的这些优势外,俞栋博士认为,多模态交互还能够给业界带来更多的想象空间,比如可以尝试使用人机交互技术去做虚拟解说、虚拟前台、虚拟陪伴等。

  正是由于多模态交互所具备的这些优势以及所带来的这种想象空间,他也领导团队开启了虚拟人的研究项目。下面,俞栋博士也以虚拟人这项研究成果为载体,对多模态交互技术进行了详细介绍。


随意打赏