Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the advanced-cron-manager domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /www/wwwroot/www.help4uu.com/wp-includes/functions.php on line 6121
Stability AI 推出开源音频生成模型 Stable Audio Open | 科技云

Stability AI 推出开源音频生成模型 Stable Audio Open

索隆 • 2024年 6月 6日 pm6:54 • AI • 阅读 93

Stability AI 推出开源音频生成模型 Stable Audio Open

Stability AI 推出开源音频生成模型 Stable Audio Open

近日，Stability AI 公司基于其知名的Stable Diffusion文生图模型，进一步拓展至音频领域，推出了全新的开源AI模型——Stable Audio Open。该模型能够根据用户输入的提示词，生成高质量、多样化的音频样本，为音乐创作、音效设计等领域注入了新的活力。

Stable Audio Open模型通过采用基于transforms的扩散模型（DiT），在自动编码器的潜在空间中操作，极大提升了生成音频的质量和多样性。目前，该模型最长可以创建47秒的音乐片段，非常适合用于鼓点、乐器旋律、环境音和拟声音效等多种场景。

据悉，Stable Audio Open模型已经正式开源，并可通过HuggingFace平台供用户试用。在训练过程中，该模型使用了来自FreeSound和Free Music Archive等音乐库的超过48.6万个样本，确保了生成的音频具有广泛的风格和类型覆盖。

Stability AI公司强调，虽然Stable Audio Open能够生成高质量的简短音乐片段，但目前并不适合用于生成完整的歌曲、旋律或人声。这主要是因为模型的设计初衷在于提供快速、灵活的音频创作工具，而非替代专业的音乐制作软件。

值得一提的是，Stable Audio Open与Stability AI公司之前推出的Stable Audio 2.0有所不同。后者是一个商业模型，能够生成最长3分钟的完整音频，适用于更广泛的音频创作需求。而Stable Audio Open则是一个专注于短音频片段和音效的开源模型，为用户提供了更多的自定义和灵活性。

Stable Audio Open的发布标志着Stability AI在音频生成领域的又一重要进展。随着人工智能技术的不断发展，我们期待未来能够看到更多创新、实用的音频生成模型和应用的出现。

文章来源于互联网:科技云-Stability AI 推出开源音频生成模型 Stable Audio Open

ace Stable Diffusion 互联网人工智能开源科技软件

赞 (0)

0 0

英伟达CEO黄仁勋的一句话让三星股价飙升，上涨2.8%

上一篇 2024年 6月 6日 pm6:39

iOS 18被质疑隐私保护，如何平衡人工智能功能与隐私保护？

下一篇 2024年 6月 6日 pm7:08

AI

Kimi智能助手全新升级，新增多项AI辅助功能

近日，备受用户青睐的Kimi智能助手宣布了其节后首次重大更新，推出了全新的Kimi+助手功能。该功能不仅为用户提供了更为便捷的AI辅助服务，还在多个领域展现了强大的应用潜力，预示着…

卡普
2024年 5月 7日
0
AI

英特尔发布新版显卡驱动，适配《绝区零》与《七日世界》

近日，有消息称，英特尔正式发布了针对Arc A系列显卡、锐炬Xe显卡以及集成Arc核显的酷睿Ultra处理器的31.0.101.5762测试版显卡驱动。此次发布的驱动版本虽未获得W…

甚平
2024年 7月 11日
0
AI

马斯克社交平台X推出AI新功能“Stories on X”，Grok AI助力新闻摘要生成

近日，马斯克旗下的社交平台X宣布推出了一项基于Grok的全新功能——“Stories on X”，旨在通过人工智能技术为用户快速生成新闻和热门话题的摘要，帮助用户迅速概览近期头条内…

布鲁克
2024年 5月 6日
0
AI

所有支持Apple Intelligence的苹果设备一览

苹果公司在macOS Sequoia、iOS 18和iPadOS 18中引入了一系列强大的新AI功能，统称为“Apple Intelligence”。目前，这些功能的一部分已作为开…

娜美
2024年 8月 24日
0
AI

苹果WWDC 2024全部内容都在这：iOS 18、visionOS 2领衔

随着科技的不断进步，人工智能已经成为当今最热门的话题之一。在这个大背景下，苹果公司也紧跟时代潮流，将人工智能作为其软件更新的重要方向。WWDC 2024，作为苹果公司一年中最重要的…

卡普
2024年 6月 5日
0
AI

视频大模型“Vidu”发布：一键生成16秒高清视频，逼近Sora水平

今日，生数科技联合清华大学发布了其最新的视频大模型“Vidu”，这一成果在AI视频生成领域引起了广泛关注。据悉，“Vidu”支持一键生成长达16秒、分辨率高达1080p的高清视频内…

乌索普
2024年 4月 28日
0
AI

OpenAI：ChatGPT Mac版应用已向所有用户开放，支持语音对话

近日，OpenAI公司宣布，其首款适用于Mac的ChatGPT聊天机器人应用已正式面向所有用户开放下载。 OpenAI 称，ChatGPT 的 Mac 应用旨在与用户日常操作无缝集…

弗兰克
2024年 6月 26日
0
AI

OpenAI推出Batch批处理API，为开发者提供半价优惠及高效异步处理能力

在人工智能技术的浪潮中，OpenAI再次展现其创新实力。近日，该公司面向全球开发者推出了全新的Batch批处理API，旨在提供更为高效、灵活的异步任务处理能力，满足日益增长的数据处…

弗兰克
2024年 4月 17日
0
AI

如何善用 Google Live Translate 實時翻譯功能：突破語言障礙的新利器

語言常常是溝通中最大的障礙之一，但 Google 正在致力於利用其先進的 Live Translate 實時翻譯功能來打破這一障礙。這項創新工具可以即時翻譯文字訊息、字幕、現實世界…

弗兰克
2024年 10月 15日
0
AI

比尔・盖茨展望“AI智能体”：能提供心理治疗服务，还能当女友

近日消息，播客节目 Next Big Idea Club 上周末发布了对微软创始人比尔・盖茨的采访，盖茨谈到了人工智能、超级智能等话题。主持人 Rufus Griscom 询问了…

乌索普
2024年 7月 4日
0

发表回复