配音行业又要瑟瑟发抖了谷歌发布最新文本转语音AI模型

你可能不敢相信，现在一毛钱出头就能定制情绪拉满的专业声优。就在刚刚，谷歌发布 Gemini 3.1 Flash TTS这款文本转语音AI模型，主打导演级控制，语音情感、节奏和音色都能轻松调节。

核心黑科技就是 200多个音频标签，在文本里嵌入指令，温柔缓慢、热情兴奋，甚至笑声和停顿都能精准调控。很多人觉得文字转语音都差不多，但它是被评为最具吸引力象限的狠角色，兼顾高品质与性价比。

盲听评分高达1211亿，是目前最自然、最富表现力的模型，同时支持70多种语言及美式、英式等口音原生适配。

无论是 有声书、虚拟主播还是APP语音都能轻松驾驭，关键是性价比极高——预渲染每分钟仅需4.3元。企业用户和普通用户都有对应接入渠道，内置SY水印 防伪造可溯源，使用合规更安心。

从呆板朗读到精细调控的语音表演，AI语音 的天花板再次被刷新。

文章版权归作者所有，未经允许请勿转载。

配音行业又要瑟瑟发抖了 谷歌发布最新文本转语音AI模型