智能化唇读系统超过唇读专家

据BBC报道,谷歌最近与英国牛津大学合作开发了一套唇读软件,通过收看数千小时BBC的电视节目来开启唇读功能。令人震惊的是,该软件不仅掌握了唇语,还比唇读专家做得好。

此前,英国皇家检察院雇佣“读唇女王”杰西卡·里斯为英国唯一的官方唇读证人,根据英国警方用监控摄像机偷拍下来的嫌犯录像,用唇读翻译出录像带中嫌犯的对话,提供至关紧要的证据。她熟练高超的唇读技术,让人很难发现她是一名耳聋者。

智能化唇读系统超过唇读专家

值得一提的是,谷歌的人工智能唇读软件,学习了BBC一系列的电视节目,所有视频资料加起来约有 11.8 万句话,经过了约5000小时的训练,便迅速掌握了唇读技能。研究人员用人工智能软件对电视节目嘉宾进行唇语解读,准确率为46.8%,而专业的唇语专家在接受同样的测试时,准确率仅为12.4%。

无独有偶,牛津大学的另一独立小组也于不久前开发了一款类似的人工智能唇读软件,在测试中达到了93.4%的准确率,而人类的准确率仅为52.3%。但该测试所用的材料均为志愿者事先录制好的固定句子,没有任何复杂的事件背景可言。以测试视频当中的单词为例,这款类似的人工智能唇读的软件中有51个特殊词汇,而此次谷歌选取的BBC节目数据库却包含了惊人的17500个特殊词汇。在没有任何背景介绍的情况下直接对BBC节目的嘉宾进行唇语解读,如果完全采用人工,工作量之大无法想象,因此对于人工智能而言是一个巨大的挑战。

为了避免视频流与音频流不同步的障碍,团队采取了让计算机先学会完全同步的音视频流,掌握发音与唇形间的关联,进而自行推断音视频流中哪些画面是不同步的,再进行自动修正。

来自牛津大学里普耐特研究团队的阿萨埃尔对此技术的评价是:“我们相信人工智能唇读技术是一种非常实用的辅助性技术,比如更智能的助听器。此外,人工智能技术还可应用于外交、破案等领域,甚至可能在普及之后改变人们的生活。

人工智能业内专家称:“这绝对是建构全自动唇读系统的第一步!现有的各类庞大数据库完全可以支持深度学习技术的发展。”

本文来自投稿,不代表弱电智能网立场,如若转载,请注明出处:https://www.ruodian360.com/news/575.html

题图来自 Unsplash,基于 CC0 协议

(2)
上一篇 2016年11月30日 下午12:39
下一篇 2016年11月30日 下午7:17

相关推荐

  • 云存储技术在安防行业未来的发展前景

    随着行业的不断发展,各地项目的深化设计和建设,智能化业务普及以及主流场景化更加清晰明确,形成了对云存储的新一轮挑战。 1、智能化和数据价值差异带来的影响   (1)大规模的图片流分析的边写边读 随着2018年智能化在安防的大规模落地,针对图片的分析,视频流的结构化都变得更加普及或成为标配。在此之前视频和图片仅需保证高性能的存储进去,并不存在大规模的实时读取,…

    2019年6月26日
    002.7K
  • 怎么为人脸识别摄像机安装补光灯?

    一、摄像机的安装 1、摄像机安装高度 摄像机通常高度为1.8-2.3米,安装摄像机过程中最佳安装位置为摄像机与采集人脸平行,或者高出一些;保持倾斜角不要过大,采集人脸成功率及对比识别率将大大提高。 2、摄像机安装倾斜角度 摄像机安装倾斜角度不宜过大,最大倾斜角度为45度,倾斜角度为0度效果最佳。 3、摄像机安装光照问题 摄像机安装位置要根据光照、灯光条件适当…

    2019年4月25日
    003.0K
  • 防盗报警器中的主动红外与被动红外区别

    被动式红外探测器的工作原理及特性: 被动红外探测器是以探测人体辐射为目标的。所以热释电元件对波长为10UM左右的红外辐射必须非常敏感。被动红外探头,其传感器包含两个互相串联或并联的热释电元。而且制成的两个电极化方向正好相反,环境背景辐射对两个热释元件几乎具有相同的作用,使其产生释电效应相互抵消,于是探测器无信号输出。为了仅仅对人体的红外辐射敏感,在它的辐射照…

    2016年11月28日
    004.8K
  • ​视频门禁电源选择应注意的几个问题

    一、视频门禁报警系统简介  视频门禁项目伴随着社会管理创新的进步,对于人口尤其是流动人口的管理起到不可替代的作用,目前全国各地对于视频门禁的建设都在如火如荼的进行,已经在安 防行业中形成了一种新的市场力量。为了适应市场的需求,目前无论是门禁系统的供应商、还是视频系统的供应商,包括配套的光端机、电源等等的供应商都在根据 视频门禁市场的特定需求在优化自己的产品方…

    2016年5月13日
    002.0K
  • 2017:监控系统中IP摄像机H.265的普及我们要准备什么?

    随着视频分辨率的不断提高,毫无疑问H.265压缩是未来。对4K和更高百万像素视频的不断增长的需求推动了H.265的相对快速的采用,因为图像质量,带宽效率和存储减少的改进是H.265最大的优势。 然而,一些制造商选择采取较慢,更谨慎的方法,来生产支持H.265的摄像机,尽可能长地保护其现有产品系列。或者,其他制造商对H.265采取前瞻性方法,并正在迅速将这种强…

    2017年2月5日
    004.8K
  • 如何提升高空抛物监测技术的落地价值

    近年来,各个城市社区高空抛物行为致人伤亡事件屡屡发生,给居民带来重大安全威胁。由于高空抛物行为较为特殊,实际场景干扰因素也较复杂,因此,一直以下针对高空抛物行为的监控技术力量较为苍白,特别是由于传统的移动侦测技术,误报率较多,使小区居民造成苦不堪言,也因此被用户当“鸡肋”弃之。那么,应该如何利用AI监测技术力量赋能这一细分场景应用,大力增强对高空抛物行为的监…

    2019年6月26日
    003.2K

发表评论

登录后才能评论
关注我们