谷歌开发人工智能“唇读”软件的准确率是人类的3倍-罗马观察报

本篇文章639字，读完约2分钟

TNW中文站11月24日报道

谷歌的人工智能部门DeepMind正与牛津大学的研究人员合作开发世界上最先进的唇读软件，这可能比人类的唇读能力还要强。

为了实现这个目标，研究人员选择了数千小时的英国广播公司电视短片，将它们上传到一个神经网络，并训练他们的唇读软件，即根据主持人的口型识别广播内容。

结果，该唇读软件的唇读准确率高达46.8%。相比之下，基于相同的测试内容，人类唇读的准确率仅为12.4%。

这项研究是基于牛津大学之前的人工智能唇读系统LipNet。LipNet可以将视频中人物的嘴部动作与他们的线条进行匹配，准确率为93.4%。当然，准确性主要是基于一些相对简单的句子。

DeepMind的唇读软件叫做“观察、倾听、倾听、附加和拼写”。与LipNet不同，DeepMind的软件专门用于更难的长句。

为此，谷歌神经网络观看了英国广播公司约5000小时的热门电视节目，包括“晚间新闻”、“提问时间”和“今日世界”，其中包含110000个不同的句子和17500个不同的单词。相比之下，测试LipNet的句子只包含51个不同的单词。

谷歌对此表示:这项研究的目的是识别人们说话时的短语和句子，不管有没有声音。不同于以往的相关研究，它们仅限于数量有限的单词或短语，而我们的研究是针对无限的自然语言长句。

DeepMind团队认为，他们新开发的软件不仅能帮助听力受损的人，还能支持一系列其他应用，包括给电影添加注释，以及通过嘴唇运动与Siri和Alexa等数字助理交流。

来源：罗马观察报

标题：谷歌开发人工智能“唇读”软件的准确率是人类的3倍

地址：http://www.l7k9.com/gcbyw/939.html

谷歌开发人工智能“唇读”软件的准确率是人类的3倍

观察报中文网推荐资讯

郭敬明的文娱帝国：乐视股东与6家公司法人代表

蚂蚁借呗前三季度净利近45亿元不良率1%左右

中国

财务自由？你可能接受了一个假概念

拍拍贷下线拍活宝 P2P活期产品还能玩多久？

为什么在皮查伊接管谷歌母公司后，印度在硅谷的首席执行官“比比皆是”？

无接触消费扶贫，智能消费扶贫柜新布局，迎接新的经济风口

万峰“喊话”：新华保险将于2017年基本完成转型任务

【时讯】最美职校丨吉林机械工业学校

观察报中文网阅读榜

网联来了，将如何影

微信微粒贷怎么取消

想打造科技强国，“

VR全景数字营销的优势

最有安全感城市：上

别买车了共享汽车来

我国首次实现月球轨

螺杆式冷水机组百科

拿到offer别急着答应

【时讯】最新！这里

观察报中文网最近更新

极具潜力的万亿级房屋租赁市场隐藏着哪些投资机会？

引发激烈讨论：你老公收入多少？你就敢做全职太太？

中央空调什么时候买会更加适合?

大金空调在家庭智能方面有哪些创新

大金中央空调的故障代码和错误提示

观察报中文网简介