近日,Adobe公司展示了一项能够编辑录音的黑科技,该技术不仅可以使原话“改口”,还能以相同的“嗓音”创造出新的句子。
这项技术被称为“音频PS”。属于混录VoCo(音频转换)。
首先你可以输入一段音频文件,然后便可以自由编辑字段,调序增删,或者干脆直接敲进新的词句。键入新词后需略等片刻,待新的语音生成后,便可按播放键收听到编辑后的音频片段。
庆幸的是,VoCo施展超能力之前,需要先大剂量“服用”目标人的语音数据,(当前版本需要约20分钟左右长度,完善后所需时间应该会有所改善),将其分解成音素(即构成口语的每一个不同的声音元素)。在此基础上VoCo会对目标人的语言特点进行建模,理论上说应该包含目标人的语速、重音分布、怪癖等,对此Adobe方面并没有透露很多。
这项技术具备类似PS的“无中生有”的超能力。其一经提出,便引发了许多顾虑,人们担心这种无痕增删细节的技术会被不法分子所利用。
想想我们遇到过的各种电信诈骗,一旦骗子能掌握你熟悉人的语言,你还真的能分清楚么?
因此,在对待VoCo的态度上Adobe相当谨慎,虽说目前还只停留在技术原型阶段,Adobe已经在考虑如何通过“水印和甄别”来防止欺诈。
PS:这难道不就是柯南的变声神器吗?
本文来源:不详 作者:佚名