行业焦点

有感情的机器声优,Sonantic AI拟人配音技术为游戏注入情感


浏览量:2263

会哭泣的语音助手,“小团团”语音包饭碗要被抢了?

编者按:本文来自微信公众号“将门创投”(ID:thejiangmen),作者:让创新获得认可,36氪经授权发布。


Sonantic的最新AI语音技术可以将文本转化成拟人化的声音,为游戏原型的自动语音注入情感。这一“感情牌”为Sonantic迅速收获了200多家游戏公司的音频工程订单。基于现有的文本语音转换框架,Sonantic语音平台的核心是捕捉人类声音的细微差距,具体操作方法是训练机器人区分标准机器声音与听起来极似人声的机器人声音。


去年5月,Sonantic发布了一段视频,展示了其强大的AI配音技术的能力,它可以结合不同的场景配出不同的声音,甚至可以将游戏中角色“哭泣”的声音呈现得毫无人工智能的痕迹。


如果人工智能可以为文字提供情感深度,将恐惧、悲伤到喜悦、惊喜等复杂的人类情感传达出来,这一突破性进展会彻底改变游戏和电影工作室的音频工程,最终实现超现实、情感表达和可控制的人类声音。


时间退回到3年前,还记得朱亚文那句“宝贝儿”、韩雪配音的海绵宝宝哭泣吗?2018年《声临其境》的热播让配音行业进入了大众视线,一干演员一人分饰多角自带质感的声音让人印象深刻,惊呼这就是原版配音。


如果《声临其境》的声音大戏太遥远,百度地图的“小团团”语音包,林志玲的语音导航相信大家绝对“有所耳闻”!


但不可否认的是,这些让人发笑或产生情感共鸣的声音是有赖于真人声优的。


语音优化增强故事情节


更好塑造角色形象


今天介绍的Sonantic AI不仅能把文字脚本转化为语音对话,还能用AI给对话配上合适的情感。事实证明,这是制作电子游戏音频故事原型的好方法。一时之间,Sonantic收获了200多家游戏公司的订单。


公司联合创始人齐娜库雷希在接受采访时表示:“Sonantic的试点项目是面向TripleA公司的,当我们开始创建这个项目时,我们与这类型的合作伙伴进行了更加垂直和深入的合作。我们发现这些工作室选择了高质量标准,所以这真的帮助我们把这项技术带到了一个非常好的位置。”


创造“可信度”是Sonantic语音平台的核心,基于现有的文本语音转换框架,Sonantic的方法是将标准的机器人声音与听起来像人声的声音区分开来,并捕捉人类声音的细微差别。


Obsidian Entertainment公司的音频总监贝尔就曾表示,该技术能够帮助像他那样的游戏公司缩短制作时间、减少生产成本。贝尔表示,他的团队向Sonantic的API发送一个脚本后,得到的不是机械的语音输出,而是一个生动的人类对话。贝尔说语音方面的优化增强了在游戏中讲好故事的能力。


库雷希欣慰地说:“在开发的早期能听到一些反馈真的很有用。”


通过Sonantic把使用脚本生成的声音植入游戏的非玩家角色中非常简单。库雷希说,这么做的目的并不是要让配音演员失业,相反它在创作早期就为创作者提供了一个可读、可审查的脚本,方便制作者倾听对话,在听起来不恰当的时候及早地修改它。


Obsidian是 The Outer Worlds(中文名:《天外世界》)的制造商,也是微软Xbox游戏工作室的子公司。为了演示其语音点播技术,Sonantic发布了一个demo视频,突出了它与Obsidian的合作关系。其他目前使用Sonantic的公司还包括Splash Damage和Sumo Digital。


定制化声音模型

不会被替代的配音演员


Sonantic创建声音模型是通过与经验丰富的演员合作来完成的。用户可以从现有的语音模型中挑选或定制新的声音。Sonantic的语音技术,能够根据性别、个性、口音、音调和情绪状态,来塑造准确的角色类型。


Sonantic的工具帮助音频工程师制作出更好的游戏和电影


Sonantic的正式发布是在去年发布测试版之后,当时发布的视频名为《Faith:第一个会哭的人工智能》。


值得一提的是,电影和游戏工作室并不是Sonantic平台的唯一受益者。Sonantic技术采入演员的声音来创造变化。通过把自己的声音变成一个有形资产,演员也间接将他们的时间和才华最大化。也就是说在Sonantic用户的项目——包括开发、前期制作、制作和后期制作中使用了演员的声音模型,该演员都能产生一笔被动收入。


“这项技术并不是用来代替演员的,”库雷希再次强调。“Sonantic的技术对游戏的早期开发很有帮助。TripleA级游戏的制作可能要花上10年时间。因为他们会不断地迭代,所以他们一般在早期阶段就会邀请演员加入。他们使用文本语音转换是过去几十年的行业标准,而我们已经发明了一种方法,可以帮助演员们远程‘身临其境’。这有助于从一开始就在游戏中加入高度现实的声音,帮助制作人感受故事的弧线、填补节奏、理解真正需要改变的地方。这样他们的迭代周期才能继续快速发展。”


使用Sonantic的结果是简化了生产流程,团队将不需要召回演员来重新拍摄或编辑声音。库雷希说:“一些工作室告诉我们,他们每个月可以为团队节省一周的制作时间。”


“我从未听到这样的AI语音”

听听创始人的故事


库雷希拥有语言和语言治疗的背景,她在2018年遇到了联合创始人约翰·弗林。弗林随即演示了这项技术。


“当我听到他的Sonantic样本时,我觉得这太疯狂了!”库雷希说,“这比我听过的任何文本转换语音都好。”


在弗林演示这项技术之前,库雷希曾听到过的所有文本转语音都是平铺直叙的,听起来就像机器人对话一样枯燥。“以前的技术并没有捕捉到声音的高低,我通过寻找声音的高位和低谷改变了它,并试图让算法更多地关注音调起伏,”弗林谈到。


“去年我们的人工智能哭泣时就被赋予了真实情感,真正的关键是关注语言上的细微差别,悲伤时声音的颤抖,愤怒时的用力。我们尝试了深入建模,添加了细节并将它们叠加起来,声音就开始获得能量听起来非常现实。”


未来,Sonantic AI语音技术可能会扩展到除游戏外的其他领域,有望在配音市场正式分一杯羹。不久的将来,也许每一个明星都会选择留下自己的声音遗产,导航、音响、Siri、Alexa的声音将会更丰富起来~


From:VentureBeat;编译:Shelly


https://venturebeat.com/2021/03/02/sonantic-uses-ai-to-infuse-emotion-in-automated-speech-for-game-prototypes/


Illustration by Maria Shukshina from Icons8