还记得电影《Her》吗,人工智能(AI)萨曼莎以美妙的声音与主人公共同谱写了温暖治愈的恋曲。在真实世界中,随着技术不断进步,AI 声音已逐渐媲美人类,不断融入各个领域、千家万户,在陪伴人们的同时扩展每个人的能力。

微软 AI 语音全面布局,已实现多个情景落地-最极客

近期,微软 AI 语音晓晓受邀演绎了作家英蓓尔意境唯美的诗歌作品《童话》,晓晓不仅以恬静纯美的声音朗诵诗歌,还借助 AI 谱曲进行唱作,陪伴读者度过美好的睡前时光。

在评论区,不少读者为晓晓是机器人感到惊讶:“AI 主播的声音真甜美”、“歌也是晓晓唱的吗?真好听”、“晓晓的声音晚上给孩子讲故事应该不错”……

IT之家获悉,微软语音晓晓唱作的《童话》为 AI 谱曲。微软 AI 能力不仅支持根据歌词自动谱写诗歌旋律,并考虑到现代散文诗的格律不甚工整,格外注重旋律与歌词的匹配度。

微软智能语音团队利用微软亚洲研究院在 AI + 音乐方面的一系列研究成果,包括歌词 / 旋律创作模型(SongMASS)、基于曲式结构的旋律生成模型(StructMelody)、基于押韵和节奏建模的歌词生成、基于海量音乐数据的预训练等,打磨创作出美妙的音乐。AI 作曲能力有潜力辅助行业人士提高音乐创作的效率,带来更多灵感。

通常,真人朗读一本书需要数周甚至数月时间,且受限于人员、时间、环境、技术等因素,有声读物目前在国内所覆盖的内容和数量有限。

为满足不同领域用户的有声内容创作需求,微软设计了 AI 有声内容创作平台 —— 基于微软 Azure 云认知服务语音合成平台 Speech Studio,用户不需要理解平台的技术逻辑,就可以用尽可能少的步骤,利用平台上丰富的 AI 语音,自主创作满足不同需求的声音作品,合成一本有声书的效率大大提高,且能够 7*24 小时不间断生成。

例如,用户只需输入文本,有声内容创作平台就可以对角色和情绪进行预测,推荐合适的声音、情感、韵律、发音演绎。用户也可以根据自己对文本的理解进行调优,创作令人满意的声音作品。平台提供的中文语音包括晓晓、云希、云野、晓涵、晓萱、晓墨、晓睿等,覆盖不同性别、年龄、性格。

微软 AI 语音团队表示,不需要写代码,人人都可以通过微软 AI 有声内容创作平台制作有声读物。目前微软 AI 有声内容创作已在聊天机器人、有声书朗读、影视自动配音、游戏等多情景落地。

来源:IT之家