Suno V4 更新了啥,以及 AI 音乐的未来|Bolt观点
更新时间:2024-11-28 18:04 浏览量:12
AI明星创业公司Suno自成立起就在音乐生成领域独树一帜,其光环加持的创业团队、不断惊艳用户的模型效果、现象级的产品传播方式,以及可观的融资体量,都反映了用户以及市场对AI音乐方向的关注。但似乎最近有一段时间没有听到AI音乐领域的重大进展消息了。上周Suno发布了V4版本,基于该更新版本生成的音乐内容在海外媒体上被广泛关注和讨论。我们使用了V4版本的Suno产品,在此分享本次Suno更新的内容以及对AI音乐发展的思考。
Part.01
V4的核心更新
此次Suno的V4更新正如其宣传中所说的Better Audio,Better Lyrics,Better Song Structures。简而言之,允许用户生成音质更高、更好听、时长更长(4分钟)的音乐内容,体现在:
1. Remaster功能:用户可以根据之前版本生成的音乐作品再重新生成,在确保歌词及旋律大体不变的情况下提升音质。但这并不是传统意义的音频超采样或者EQ调节,而是通过V4模型基于原有音频的重新生成。
2. 音质飞跃式的提升:比对V4与V3.5的生成结果,可以感受到,除了人声明显清晰自然外,乐器的声音也清晰了很多,另外配器方式与和弦和声都有变化与改进,声音的层次更分明。在V3.5里还是能听出来人声是AI生成的,有一种不稳定的机械感和口齿不清,但V4生成的内容,可以说真的很难听出是AI生成的(当然还是仅限英文,中文就露馅了)。所以从生成结果看,此次V4的发布确实体现出了很大的进展。
3. ReMi歌词助手:这是一个由AI驱动的歌词创作工具。在Custom模式下,用户可以通过ReMi协助歌词创作,生成更有创意并且更符合音乐性的歌词内容。体验下来,对这个功能的整体感受是:用户来描述想要创作的歌词内容,ReMi来负责为用户生成满意的歌词。
图|Suno V4 更新介绍
Part.02
还有哪些好玩的
Suno一直在推出和更新有趣的音乐创作玩法,在这半年内陆续发布了很多有意思的功能,其中部分能力也因为此次V4更新得到了加强:
1. Cover 翻唱:用户可以通过该功能上传或者录制音频,然后一键生成该歌曲的翻唱内容,支持各种不同音乐风格。之前比较火的通过一些非音乐的录音(比如敲打声)生成歌曲的内容就是通过该功能实现的。
2. Persona 曲风复用:相当于给歌曲建立一个Persona,用户可以复用音乐中的核心元素,如人声、曲风等,并在其他不同的歌曲创作中使用,并保证该部分核心元素在生成中的一致性。该功能在某种意义上使得AI音乐专辑发布成为可能。
3. Suno Scenes 多模态生成:该功能允许用户上传照片和视频,并根据该内容生成一段30秒的音乐。抛开生成质量,这个玩法加速了Suno在短视频以及社媒上的传播。
图|Suno V4 更新介绍
Part.03
AI音乐的未来与可能
1. 短期内仍然面临版权压力:高质量的音乐生成模型依赖高质量的音乐音频数据,论数量,全球音乐大概在千万量级,这其中相当大比例的版权都有所归属。从今年6月开始,Suno和Udio就卷入了三大唱片公司的版权诉讼,目前也还没有结论。不可否认的是,版权相关问题在一定程度上会导致该领域创业者产品化及商业化节奏有所放缓。但我们相信,新技术所代表的新生产力一旦展现了其价值,一定还是会以某种形式持续发展下去,这个博弈的过程也会催生出新的监管体系以及利益分配机制。
2. AI工具的去技能化:音乐创作具有很强的专业性,这里面很高的一个门槛是“技能”,小到如何让一个乐器发声,大到系统性的乐理学习及专业的录音混音流程。每一步都会“劝退”一部分用户,当然每一部分也都有专业的从业者深耕多年。但AI的发展带来的最大变化,是让从前只能做0分的用户通过语言表达就能做出及格的作品,让用户跨过了“技能”的鸿沟,这是一个巨大的生产力提升。但是否仅仅这样就够了,Suno的探索,一定程度上告诉我们或许未必。在极致易用以及精准高质量之间也仍然存在着鸿沟,他们之间本身也有trade-off。去技能化后可能诞生新的技能需求,它大概率不会是纯提示词工程,而是会建立在新的交互形式甚至新的音乐场景之上,相信这也是Suno等AI音乐领域创业公司最关心的事情。
3. 原生的AI音乐创作者:目前粗浅估计,在AI音乐生成工具的辅助下,音乐内容的生产效率会提升2个数量级,并且随着模型效果的不断提高以及工具产品的发展,音乐创作质量也会提升。这个过程中可能产生会诞生出(目前其实已经有了)一批原生的AI音乐创作者,并且这个群体的数量一定会比原有的音乐从业者群体大很多——因为未来的他们其实就是今天的音乐爱好者,也基本就是你我这样的个体。如何服务好这个群体,无论对内容创作工具、分发平台,抑或可能诞生一个新的内容载体(短视频Plus)来承载这部分的增量,都是值得思考的命题。
4. 新的智能乐器形态:全球乐器市场大概在400亿美金规模,支撑这个巨大市场的客户大部分在忍受着学习乐器的痛苦(或者早已放弃了)。我们买乐器的目的是为了玩音乐,享受亲历音乐创作和演奏所带来的情绪价值。但阻碍用户的也是前述提到的“技能”门槛,这个门槛如果能被结合AI的新硬件解决,也会是个有意思的探索方向。
Suno V4的版本发布可能意味着AI创作音乐进入了一个全新的阶段,普通用户不仅仅能创作出一个听起来相对完整的歌曲,而且也是具备相当专业性的音乐作品。这一改变不仅缩短了从创意到成品的距离,也进一步模糊了专业音乐创作者与普通音乐爱好者之间的界限,让每个人都有机会通过简单的操作表达自己的音乐灵感。这背后也可能隐藏着巨大的商业机会,毕竟,谁不想成为下一个Spotify呢。