YouTube玩转的自动字幕,为什么被国内视频网站“

2020-04-09 栏目:行业资讯 查看()

在2017年初,YouTube已经为10亿条视频提供了自动添加字幕的服务,使用者每天的播放次数超过 1500 万次。那么这一自动字幕的功能为何没有被我们国内的视频网站“Copy”?

YouTube玩转的自动字幕,为什么被国内视频网站“

成为中国YouTube,这估计是每一家国内视频网站都曾经设想过的目标。现在,无论是从全球市场规模、还是从营收规模上来说,YouTube都已经是一个庞然大物。而在国内,至今已难以找到一家能够与YouTube实力相当,甚至说模式相似的视频网站了。

差异是如何产生的,已经成为一个可以写成商业专著的选题了。而这一次我们则关心一个更为细节的产品技术问题,那便是在YouTube上早已实现的自动字幕功能,为何没有在国内的主流的视频网站上出现?

据报道,在2017年初,以UGC起家的YouTube已经为10亿条视频提供了自动添加字幕的服务,使用者每天的播放次数超过 1500 万次,并且目前已支持全球10种语言的自动字幕加载,以及支持包括简体中文在内的上百种语言的机器翻译。那么这一自动字幕的功能为何没有被我们国内的视频网站“Copy”?

也许你第一反应会想到技术原因。也是也不全是。究竟近几年,我国在自动语言辨认上面的技术早已成熟,在视频网站上应用也许早已不成问题。

“是不为也,非不能也。”如果孟老夫子在世,可能还会说出这句话来。但原因毕竟是啥,恐怕还是要继续追问下去,而最终我们其实还是想对这些国内视频网站的新老玩家们提问下:这么“香”的技术,到底要不要学习一下呢?

自动字幕:从Goodness到Business

YouTube的自动字幕功能是在2009年由谷歌的工程师们开发的,那时离谷歌收购YouTube已经过去三年了。这一功能的初衷是,通过将视频声音转化成笔墨字幕,为全世界有听力障碍的用户提供方便。而开发这一功能的软件工程师肯·海伦斯坦也正是一位聋哑人士。

众所周知,YouTube是从用户UGC视频内容起家的,目前仍然是全球最大的UGC视频网站。当前月用户拜访数可以达到18亿,用户每分钟上传视频时长达到400小时,而且时长还在增长。

这同时意味着,有大量上传的UGC视频中是没有主动添加字幕的。这对于正常听力的用户来说,并没有什么影响,而对于有听力障碍的人来说,则相当于缺少了极其重要的音频信息。

而自动字幕的参加,则在必然程度上赞助了听障用户获取更多的信息渠道。

目前,谷歌和YouTube团队正在利用机器学习为自动字幕增加音效信息,从而更大程度地丰富音频内容的表达。通过添加如铃声、狗叫声、敲门声等音效字幕,也正是出于改善聋哑或听障人士的观看体验而进行的技术改进。

这样一项出于社会责任感和用户公平体验的技术,也带来了额外的市场推广价值。

YouTube玩转的自动字幕,为什么被国内视频网站“主动错过”?

随着自动字幕可以辨认的语种的增加,以及自动翻译功能的参加,这一项技术成为一项全球用户都可以受益的功能。好比,大量优质的英语原声知识分享视频可以通过自动添加英语字幕,再转为其他语种,供非英语区的用户观看学习。这显然对YouTube的全球化推广产生了积极的推动作用。

在每天上千万次的自动字幕的使用中,语音辨认不免会出现必然错误。但随着YouTube社区用户对这些自动字幕信息进行评论和编辑后,这些信息又会再进入机器学习的流程,西安app开发,从而赞助自动字幕系统更好地提高准确率。同时,自动字幕及机器翻译准确度的提升,又推动内容保举的精准度的提升,进一步增加用户粘性和使用时长。

一项赞助提升用户体验的AI技术,又在用户的海量数据的赞助下变得更加强大,很好地印证了“科技向善”可以带来更多意想不到的好处。

当然,这里有一点比较遗憾的地方是,如果你有机会使用YouTube的中文简体的自动翻译功能的时候,你可能并欠好理解翻译出来的中文到底在表达什么意思?

一来,可能视频中中文口语化的音频内容确实欠好翻译;二来,由于你懂得的原因,这个自动翻译的数据模型并没有得到有效的训练。

那么,自动字幕如此得天独厚的市场空白、如此巨大的应用规模,以及如此现成的技术条件,为什么没有国内的视频网站主动去使用呢?

为什么国内视频网站们“主动”错过这一技术?
扫二维码与项目经理沟通

我们在微信上24小时期待你的声音

解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流

郑重申明:勤人信息以外的任何单位或个人,不得使用该案例作为工作成功展示!