微软 AI 语音全面布局，已实现多个情景落地-最极客

还记得电影《Her》吗，人工智能（AI）萨曼莎以美妙的声音与主人公共同谱写了温暖治愈的恋曲。在真实世界中，随着技术不断进步，AI 声音已逐渐媲美人类，不断融入各个领域、千家万户，在陪伴人们的同时扩展每个人的能力。

近期，微软 AI 语音晓晓受邀演绎了作家英蓓尔意境唯美的诗歌作品《童话》，晓晓不仅以恬静纯美的声音朗诵诗歌，还借助 AI 谱曲进行唱作，陪伴读者度过美好的睡前时光。

在评论区，不少读者为晓晓是机器人感到惊讶：“AI 主播的声音真甜美”、“歌也是晓晓唱的吗？真好听”、“晓晓的声音晚上给孩子讲故事应该不错”……

IT之家获悉，微软语音晓晓唱作的《童话》为 AI 谱曲。微软 AI 能力不仅支持根据歌词自动谱写诗歌旋律，并考虑到现代散文诗的格律不甚工整，格外注重旋律与歌词的匹配度。

微软智能语音团队利用微软亚洲研究院在 AI + 音乐方面的一系列研究成果，包括歌词 / 旋律创作模型（SongMASS）、基于曲式结构的旋律生成模型（StructMelody）、基于押韵和节奏建模的歌词生成、基于海量音乐数据的预训练等，打磨创作出美妙的音乐。AI 作曲能力有潜力辅助行业人士提高音乐创作的效率，带来更多灵感。

通常，真人朗读一本书需要数周甚至数月时间，且受限于人员、时间、环境、技术等因素，有声读物目前在国内所覆盖的内容和数量有限。

为满足不同领域用户的有声内容创作需求，微软设计了 AI 有声内容创作平台 —— 基于微软 Azure 云认知服务语音合成平台 Speech Studio，用户不需要理解平台的技术逻辑，就可以用尽可能少的步骤，利用平台上丰富的 AI 语音，自主创作满足不同需求的声音作品，合成一本有声书的效率大大提高，且能够 7*24 小时不间断生成。

例如，用户只需输入文本，有声内容创作平台就可以对角色和情绪进行预测，推荐合适的声音、情感、韵律、发音演绎。用户也可以根据自己对文本的理解进行调优，创作令人满意的声音作品。平台提供的中文语音包括晓晓、云希、云野、晓涵、晓萱、晓墨、晓睿等，覆盖不同性别、年龄、性格。

微软 AI 语音团队表示，不需要写代码，人人都可以通过微软 AI 有声内容创作平台制作有声读物。目前微软 AI 有声内容创作已在聊天机器人、有声书朗读、影视自动配音、游戏等多情景落地。

来源：IT之家