MY NEWS
首页 AI 归档 搜索 收藏 RSS
← 返回首页
AI·模型 TechCrunch 2026-05-21 1 min read ★ ★ ★ ★ ☆

Stability AI发布可创作6分钟歌曲的新音频模型

阅读原文 ↗

Stability AI 推出 Stability Audio 3.0 小型模型,支持在设备端运行,可生成长达两分钟的音频轨道,并扩展至6分钟的完整歌曲。该模型在音频生成质量和效率上取得突破,适用于音乐创作和音频内容生产。


核心要点

  1. Stability Audio 3.0 小型模型可在设备端运行,无需云端依赖
  2. 模型可生成长达2分钟的音频轨道,并组合成6分钟的歌曲
  3. 支持多种音频风格和乐器组合,提升创作灵活性
  4. 模型在生成速度上显著提升,实时性更强
  5. 适用于音乐制作、播客、游戏音效等场景

正文

Stability AI 发布了其最新的音频生成模型 Stability Audio 3.0 的小型版本。该模型专为设备端运行优化,能够在本地硬件上高效运行,无需依赖云端计算资源。

主要特性包括: - 生成长达2分钟的连续音频轨道,通过组合可形成6分钟的完整歌曲 - 支持多种音乐风格和乐器配置,用户可通过文本提示控制生成内容 - 生成速度显著提升,接近实时响应,适合交互式应用 - 模型体积较小,适合部署在移动设备和嵌入式系统中

该模型在音频质量上保持了 Stability AI 一贯的高标准,能够生成清晰、连贯的音乐和音效。Stability Audio 3.0 的发布进一步降低了音频内容创作的门槛,使个人创作者和小型团队能够快速生成专业级别的音频素材。


关联概念

  • Stability AI
  • 音频生成模型
  • 设备端AI
  • 音乐创作工具

可操作项

开发者可尝试在本地设备上部署 Stability Audio 3.0 小型模型,通过 API 或开源代码进行测试,生成自定义音频轨道,并评估其在音乐制作、播客或游戏音效中的应用效果。


原文: Stability AI releases a new audio model that can create 6-minute songs
自动加工于 2026-05-21 01:56

#Stability AI#音频生成#AI模型

更多 AI·模型 文章

AI·模型 Hugging Face Daily Papers 2026-05-23 ★ ★ ☆ ☆ ☆

WorldKV:通过世界检索和压缩实现高效的世界记忆

WorldKV是一种无需训练的框架,通过世界检索和压缩技术,在保持视频扩散模型一致性的同时提高吞吐量。

阅读全文 →
↗
AI·模型 Hugging Face Daily Papers 2026-05-23 ★ ★ ☆ ☆ ☆

你只需要最小的RLVR训练:通过秩1轨迹外推LLMs

具有可验证奖励的参数轨迹表现出低秩结构,可以通过简单的线性回归方法进行有效外推,在减少计算需求的同时表现出卓越的性能。

阅读全文 →
↗
AI·模型 Hugging Face Daily Papers 2026-05-23 ★ ★ ☆ ☆ ☆

π-Bench:评估主动个人助理代理在长视界工作流中的表现

个人助理代理(如OpenClaw)的发展凸显了大型语言模型在支持用户日常生活和工作中的潜力。然而,现有基准测试很少评估代理在多轮交互中识别和响应隐含用户意图的能力。为此,本文引入了π-Bench,一个包含100个多轮任务和5个特定领域用户角色的基准测试,用于评估主动式个人助理代理。

阅读全文 →
↗
AI·模型 Hugging Face Daily Papers 2026-05-22 ★ ★ ☆ ☆ ☆

HRM-Text:超越规模的高效预训练

HRM-Text 是一种新型高效预训练方法,用分层循环模型(HRM)替代标准 Transformer,将计算解耦为慢速策略层和快速执行层。通过 MagicNorm 和预热深度信用分配稳定深度循环,并仅使用指令-响应对进行训练。1B 参数模型仅用 400 亿 token 和 1500 美元预算,在 M…

阅读全文 →
↗

MY NEWS · AI 自动运营 · SORA