AI 大模型的风终于以极为「丝滑」的姿态刮到了华语音乐领域!
AI 大模型的风终于以极为「丝滑」的姿态刮到了华语音乐领域!
4 月 2 日,国内首款、也是唯一公开可用的 AI 音乐生成大模型昆仑万维「天工 SkyMusic」邀请测试拉开序幕,引发如潮般的好评!
流畅的编配,好听的旋律,尤其是逼真、甚至充满情感的人声,「天工 SkyMusic」生成的作品丝滑到让你怀疑是否来自于 AI 大模型。借助「天工 SkyMusic」,哪怕你是「小白」同样可以把灵感转化成动听的歌曲。
那么如何才能用「天工 SkyMusic」创作出一首自己的专属歌曲呢?下面,跟上我们的节奏,一起体验一把「音乐制作人」吧!
图片由天工 AI 生成
找到「天工 SkyMusic」
在使用「天工 SkyMusic」之前,我们首先需要通过 App Store 官方应用商店或者「昆仑万维集团」公众号获取下载链接,安装「天工」APP。
安装完成之后,在 APP 界面的上方找到「音乐」入口,点击即可进入「天工 SkyMusic」进行音乐创作。此外,在首页中你还可以发现其他人生成的好歌,也可以在「灵感指南」板块找到更多的音乐灵感。
需要注意的是,目前「天工 SkyMusic」仅支持内测。不过不用担心,4 月 17 正式上线后,「天工 SkyMusic」将面向全社会免费开放。届时,无论是专业的音乐创作者,还是热爱音乐的普通用户,都可以通过下载「天工 AI」APP,亲身体验音乐制作人的快乐了。
写歌的第一步,从写歌词开始
经过以上简单的「工具」准备之后,接下来我们便可以开始用「天工 SkyMusic」写歌了。
点击界面中的最醒目的「开始写歌」按钮,跳转页面后我们可以看到歌名和歌词的输入框。
此时如果你已经有写好的歌名和歌词,可以直接复制粘贴到里面,在写歌词的时候一定要记得对仗工整且押韵!
但如果你没有歌词,只有一个简单的「灵感」怎么办呢?不用担心!你完全可以把自己的想法填进去,点击右下角的「AI 写词」,剩下的交给 AI 就好了。
比如此刻你正在人民广场吃炸鸡,心里却有些难过,我们看看天工 AI 会如何帮你用歌词表达:
当然,我们也可以在歌词中添加结构名称,告诉 AI 这首歌曲我们想完成的结构,当前支持【前奏】、【尾奏】、【主歌】、【副歌】、【间奏】、【桥段】。
在填入这些信息的时候一定要用括号囊括在内!
选择参考歌曲,确定风格
创作一首完整的歌离不开「词曲混编」四大步,写好歌词之后,接下来我们便要让 AI 帮助我们完成后三步。
在「天工 SkyMusic」正式开始工作之前,我们需要为创作的歌曲选择一首参考曲目,确定歌曲的基调。
例如我们刚才写好歌词的《我在人民广场难过的吃炸鸡》,我们点击创作歌曲界面最下方的「选择一首歌曲作为生成参考」,我们这首歌可以选用南拳妈妈的《下雨天》作为参考歌曲,最后点击「生成歌曲」会生成三首原创歌曲,可以选择最好听的一首进行下载分享。
在选择参考歌曲时,我们可以根据自己不同的心情、感受、喜好,选择不同的歌曲,在参考歌曲选择页面中,点击「全部」旁边的筛选图标,便可以筛选不同情感的歌曲用于创作。
到这里,一首专属于你的歌曲就创作完成了。
下载分享与二次编辑
在创作完成之后,我们便可以在「我的作品」中看到歌曲。歌曲卡片可以直接试听,并且能够一键下载和分享。
在每一个歌名的右上角有一个编辑按钮,点击之后即可进入最初的歌词填写与「参考音乐选择」页面,对该歌曲进行二次编辑。
One More Thing:灵感制造机
除了上述的写歌能力之外,「天工 SkyMusic」更大的意义或许在于对音乐灵感的发现和寻找。在添加参考歌曲时,除了可以添加现有的歌曲,还能够自己上传。
此时,如果你手边有一把吉他或者钢琴,甚至是清唱录制一段超过十秒的音频之后,「天工 SkyMusic」会迅速在你刚才的风格之上生成新的三种旋律,更神奇的是几乎可以完美还原你刚才录制的声音。
虽然「天工 SkyMusic」目前尚处于内测初期阶段,但切实地激活众多音乐爱好者对音乐创作的热情,也让更多用户在音乐创作的过程中探索乐趣。
未来还将进一步融合音乐生态并不断打磨完善,为用户带来更多创新且专业的功能,让「天工 SkyMusic」持续为每一位用户降低音乐创作门槛,也辅助专业音乐人拓宽音乐创作边界,共同促进音乐风格的融合创新,助力每一个人更好地创作音乐,尽情表达个性与情感。
关于「天工 SkyMusic」
「天工 SkyMusic」采用音乐音频领域类 Sora 模型架构,Large-scale Transformer 负责谱曲,来学习 Music Patches 的上下文依赖关系,同时完成音乐可控性;Diffusion Transformer 负责演唱,通过 LDM 让 Music Patches 被还原成高质量音频,使得「天工 SkyMusic」能够支持生成 80 秒 44100Hz 采样率双声道立体声歌曲。这套模型架构在处理视频、音频和音乐领域效果极佳。昆仑万维团队也将在后续逐步迭代和添加新的能力,让模型具备多模态的情感理解与表达能力。
来源:互联网