亚马逊推新一代AI语音模型Nova Sonic，捕捉语气、语调变化和节奏

2025年4月9日 243

采集

亚马逊近日推出了一款新型 AI 语音模型 ——Nova Sonic，旨在提升其语音助手 Alexa + 的性能。Nova Sonic 被设计用于本地处理语音并生成自然流畅的回复，标志着亚马逊在语音识别技术领域的又一次突破。

亚马逊推新一代AI语音模型Nova Sonic，捕捉语气、语调变化和节奏插图

Nova Sonic 采取了一种全新的整合方式，将语音理解和生成的能力统一到一个模型中。这一创新不仅简化了语音应用的开发过程，还能根据语音输入的声学背景（如语调和风格）来调整生成的语音响应，从而实现更加自然的对话。Nova Sonic 甚至能够理解人类对话中的细微之处，包括说话者的自然停顿和犹豫，能够在适当的时候等待说话，并优雅地处理插话情况。

例如，在一个虚拟旅行助手的对话中，当客户从兴奋转为担忧时，AI 的语气会随之变得更加安抚，帮助客户获取相关的价格信息。此外，Nova Sonic 还能为用户的语音生成文本转录，使开发者能够利用这些文本调用特定的工具和 API，从而构建更为强大的语音 AI 代理。

根据亚马逊的介绍，Nova Sonic 在速度、语音识别和通话质量等关键指标上，与 OpenAI 和谷歌的领先语音模型相匹敌。该模型已通过亚马逊的 Bedrock 开发平台向开发者开放，亚马逊声称其成本比 OpenAI 的 GPT-4o 低80%。虽然 OpenAI 也提供了一种更为实惠的选择 ——GPT-4o-Mini，但 Nova Sonic 的推出无疑为市场带来了更多选择。

Nova Sonic 的最大亮点之一是其在复杂环境下的语音识别能力。这意味着，在嘈杂或干扰的背景中，该模型依然能够有效地识别用户的指令，并进行准确回应。此外，Nova Sonic 还具备高效处理用户请求的能力，能够灵活地将请求路由到不同的 API，实现更快速的响应。

亚马逊的 SVP 兼首席科学家 Rohit Prasad 表示，Nova Sonic 的推出不仅是技术的进步，也是公司在人工智能领域持续创新的体现。他提到，随着语音助手在日常生活中的应用越来越广泛，提升语音识别的准确性和响应速度显得尤为重要。

作为智能家居的核心组成部分，Alexa + 的表现直接影响用户体验。通过引入 Nova Sonic，亚马逊希望能够进一步提升用户与设备的互动体验，提供更加自然、流畅的对话能力。

官方博客:https://ift.tt/K60YVtL

划重点:

🌟 Nova Sonic 是亚马逊新推出的 AI 语音模型，旨在提升 Alexa + 的性能。

💰 该模型的成本比 OpenAI 的 GPT-4o 低80%，为开发者提供更多选择。

🔊 Nova Sonic 具备在复杂环境下的语音识别能力，能够快速准确地处理用户请求。

Comments | NOTHING

空空如也！

亚马逊推新一代AI语音模型Nova Sonic，捕捉语气、语调变化和节奏

迈向“人机共生”，你准备好了吗？2025外滩大会发布“AI十问世界”

NotebookLM推出新功能"Discover Sources"：革新信息收集与研究体验

OpenAI再创佳绩！全球企业用户突破百万，席位数量超700万

迷路森林5小时，ChatGPT成救星！AI导航的真实案例！

印度初创企业 Ziroh Labs 推出可在普通设备上运行的 AI 系统

OpenAI 完成重组：从非营利到营利，AI 未来更具潜力

亚马逊推新一代AI语音模型Nova Sonic，捕捉语气、语调变化和节奏

迈向“人机共生”，你准备好了吗？2025外滩大会发布“AI十问世界”

NotebookLM推出新功能"Discover Sources"：革新信息收集与研究体验

OpenAI再创佳绩！全球企业用户突破百万，席位数量超700万

迷路森林5小时，ChatGPT成救星！AI导航的真实案例！

印度初创企业 Ziroh Labs 推出可在普通设备上运行的 AI 系统

​OpenAI 完成重组：从非营利到营利，AI 未来更具潜力

OpenAI 完成重组：从非营利到营利，AI 未来更具潜力