谷歌开发字幕自动生成技术 YouTube视频尝鲜
北京时间3月5日消息,据国外媒体报道,谷歌旗下YouTube表示,将为所有视频提供自动生成的字幕,为那些有听力障碍的用户提供便利。
谷歌软件工程师肯恩·哈伦斯坦(Ken Harrenstein)在新闻发布会上演示了这一技术,并从拓展易用性、跨越语言障碍到改进搜索等方面陈述了谷歌开发该技术的原因。
YouTube观众通过点击视频播放器右下角按键就能看到字幕,还能够选择与视频语言不同的语言显示字幕。哈伦斯坦本身有听力障碍,他用手语表达自己在过去的5年中一直在开发该技术。
YouTube一直在开发视频字幕技术,希望更便捷地搜索视频片断。2008年,YouTube开始允许内容用户上传自己的视频字幕。去年,谷歌开始针对加州大学伯克利分校和耶鲁大学等少数合作伙伴上传的视频推出字幕自动生成技术。
现在,YouTube针对数百万段视频推出字幕自动生成技术,最开始是为语音清晰的英语视频提供自动生成的字幕,这一举措深受有听力障碍的加州大学生欢迎。
Google研究科学家迈克·科恩(Mike Cohen)称,这一技术在不断改进,在消除噪音和地方口音影响后,该技术将更趋完美。科恩说,字幕自动生成技术依赖谷歌其它语音识别技术。
这项技术还不是尽善尽美。哈伦斯坦删除了去年谷歌高管维克·甘多特拉(Vic Gundotra)在谷歌开发者大会上的一段视频字幕。甘多特拉在谈到为每位参加会议的开发人员发放一部Android手机时说,该手机包含一张SIM卡,但字幕自动生成技术将SIM称为“salmon”(三文鱼)。
哈伦斯坦说,谷歌除了为已有的数百万段视频自动生成字幕外,还将在短期内为剩下的视频完成字幕自动生成。
YouTube观众可以自动选择观看字幕,向YouTube上传大量内容的部分公司有权选择是否在视频中显示字幕。