2015年12月22日 报社邮箱英文网 厦门网首页
七嘴八舌分不清谁讲话?Google靠AI分辨谁开口
2018-04-16 17:22来源:中国台湾网

  Google训练AI依据画面和声音判断说话的人。(图片来源:台湾“东森新闻云”)

  中国台湾网4月16日讯据台湾“东森新闻云”报道,人类可以在嘈杂的人群中,依据声音传来的方向辨别说话的人,但计算机可就没有这么厉害了,不过Google今天公开一项技术,让AI在混杂的影片中,分辨开口说话的对象,并且将每一个人的声音拆开成为独立音档,这项技术除了有望改善YouTube的字幕功能外,也能提升多人视频对话的质量。

  据报道,Google藉由一段表演秀视频展示研究成果,AI会将声音元素与视觉画面结合起来进行判断,简单来说,当视频中左边的人在进行对话时,他的嘴巴应该要产生对应的开阖动作,AI藉由捕捉肢体细节来判断现在说话的人物是谁,接着再通过隔离单一声音讯号并加强、其他声音降低,完成独立单一音源的工作。

  除了展示隔绝声音的技术外,Google实际示范AI与YouTube目前的自动字幕的互动状况,这项技术未来有机会帮YouTube添加双轨道的字幕显示。

  Google特别提到,他们认为这项功能在视频会议上能有所贡献,期望技术能广泛运用在Google各项产品之中。若依据Google的论述,Hangouts、Duo是有可能使用这项技术的产品名单,在七嘴八舌的视频会议中,藉由AI强化说话者的音量并隔绝杂音,会带来更好的服务体验。(中国台湾网王怡然)

展开阅读全文

责任编辑:易红秀,赖旭华

相关新闻
  • 台湾影视剧不行了?大陆愿对台湾影视产业开放

    台湾影视产业低迷已久,十多年前台湾偶像剧席卷两岸与东南亚,风光早已一去不复返。一路走来,当日本、韩国以及大陆的戏剧与节目先后大放光芒的同时,回顾台湾,戏剧与综艺节目的规模与数量却都每况愈下,陷入宛如魔咒般的恶性循环:对内是电视广告总收入下滑、对外是销售市场打不开、难以回本,影视内容的投资额度随之下修,这么制作出来的戏剧与节目品质,当然又随之降低,结果就更加吸引不了观众、也销售不出去。[详细]

    中国台湾网
    2018-04-16
  • 软硬设施真健全 台湾青年直呼在沪创业“很幸运”

     国台办、国家发改委等29个部门日前发布《关于促进两岸经济文化交流合作的若干措施》(简称“惠台31条措施”)。其中“台湾同胞在大陆投资的企业参与‘中国制造2025’行动计划适用与大陆企业同等政策”和“台资企业可公平参与政府采购”两项政策让吴昶旻心动不已。[详细]

    人民日报海外版
    2018-04-16