新音乐产业观察原创文章,未经授权谢绝转载
作者|朱力克
伴随AI技术的高速发展,有个话题会时常被热议:人类如何与AI协作创造更大价值?ByteMuse的音乐创作故事,或许能带来一些启发。
也许你还太不了解ByteMuse,但大概率听过她的歌,毕竟在网上她已是小有名气的节日爆款歌手。
就在刚刚过去的8月,她的七夕主题单曲《爱若星辰》上线一周,就在抖音累积了2.8万次的使用量,超过万次的播放量。9月2日,最新中秋主题单曲《明月颂》也华丽丽地上线了。
依然是纯熟的古风词曲,明亮轻快的演唱,制作中还夹带些顽皮的小心思,但ByteMuse确是火山语音旗下一位实实在在的AI音乐人。与纯人工或者AI创作不同,她尝试以AI为主、人工为辅,通过人与机器合作完成一首歌的词曲创作、编曲到演唱的全过程。《明月颂》的创作,先提供了一些关于思念的词汇和韵脚,由AI生成第一版歌词,再经过几轮修改,将古风、晦涩的词藻进行更通俗的表达,最终的娃娃音效果也是由AI演唱的。
AI与人类互相启发,实现1+1大于2的成果,也能让AI创作更具备人类的情感和灵魂,这是ByteMuse的AI音乐创作之道。从最初的尝试到《明月颂》,ByteMuse诞生至今已近一年的时间,她如何激发人和机器之间的灵感火花,成绩又究竟如何?
01AI成为节日爆款的触发点
年国庆假期刚过,说唱歌曲《不想上班》上线十天,就喜提抖音音乐飙升榜第二名和热歌榜第八名,并有几十万使用量和接近1亿的播放量。
这首歌就是ByteMuse和独立音乐工作室BCDStudio协作共同完成的:AI完成词曲演唱,BCDStudio和95后音乐人廉羽辰参与编曲和制作;旋律动机致敬了莫扎特《第四十交响曲》,以说唱形式诉说上班族心中的苦与愁,歌曲一出即引爆了网络。大名鼎鼎的BCDStudio曾创作过《就这》、《Feeling》以及《ChuDesu!》等大热BGM,可谓最强人工智能与最专业音乐工作室强强联手,双方接连迸发出创意火花,此后每逢重要的节日或节点,总能看到ByteMuse和BCDStudio的新作。
年圣诞节,一首《圣诞下雪啦》成为不少网友晒圣诞节的标配BGM;年春节的《AI群星拜大年》、五一假期的《五一快乐》都被网友加入了节日歌单。之后的作品中,明显能感觉出ByteMuse在创作技术上的不断精进。年六一儿童节,ByteMuse一口气推出三首风格萌萌哒的歌曲:《摇摇车》《喵喵》以及《sunnykitty》。《摇摇车》仅18秒的伴奏部分就融合了四种曲风,音乐充满律动,设计更加俏皮。
在刚刚过去的年毕业季,ByteMuse又推出主题歌曲《六月》,词曲融合了青春、夏天、梦想、回忆等毕业意向,加入了流行乐队的编配手法,演唱上也充分发挥了人机共创的特长:用真实人声打底,再将人声转换成AI小哥的声音,将人声的感情和温暖的音色融合在一起。
火山语音团队(字节跳动AILabSpeechAudio智能语音与音频团队)自年成立以来,一直专注研发行业领先的AI智能语音技术。ByteMuse作为团队旗下的AI音乐人,命名源自数据计量单位“Byte”字节和象征灵感、科学与艺术的希腊缪斯女神“Muse”,本就一种科技和人文的奇妙结合。
一系列人工与AI协作的节日歌曲,不仅取得了不错的播放数据,还激发了用户的视频创作欲,更在明星、大V的参与下实现了小范围的破圈。演员马丽就在抖音上用《不想上班》创作了BGM,杨钰莹、李承铉等明星也采用《圣诞下雪啦》为配乐,晒出自己独特的圣诞节。
02AI为主、人工为辅:或为艺术创作之道
一直以来,在诸如音乐等艺术创造性行业中都有个发展方向:AI替代人完成很多基础、重复、启发性的工作,人则负责完善创意部分。从火山语音歌曲创作流程图中能看到,一首歌曲的制作被拆分为词/曲动机诞生、完整词曲生成、歌声合成、编曲混音等不同环节,人更多参与创意环节。
*火山语音歌曲创作流程图
一首歌源于最初的创作动机,动机也是启发作品的灵感来源。实践中,人通过确定主题、风格、关键词启发机器;机器则通过学习生成完整的歌词、旋律,甚至完成演唱。根据歌曲的需要,人和AI在不同环节的参与度可以灵活调整。例如ByteMuse与虚拟偶像团体A-SOUL成员向晚合作的《晚笑话》中,我们看到的并不是简单的取代,而是不同维度创意的交织与迸发。
02:17歌曲由向晚作词与演唱,ByteMuse来负责作曲与伴唱;AI根据A-SOUL的风格,创作的旋律结合了二次元、RB、说唱的元素;同时在伴唱中,AI小姐姐温柔的声线搭配上晚晚酷炫的嗓音,让整首歌曲的表现力更加丰富。
在AI改编古诗创作儿歌的尝试中,背后的共创逻辑则更为复杂。古诗学习作为低龄语文教学中很重要的一环,改编可以帮助小朋友更好理解和记忆,虽然不少音乐人都尝试过将古诗改编成歌曲,但用AI生成儿歌还是首创。
改编中,AI除了学习常规的旋律、和弦创作之外,还要学习把握“中国特色”。比如了解五言和七言旋律节奏型、符合中国风的和弦进行、以及由“宫商角徴羽”构成的中国五声音阶;在演唱时,AI还要学习发音的最佳时长,使演唱的效果更加真实。
人工的辅助则让AI锦上添花。火山语音团队背后的音乐专家们,则根据自身在创作实践中积累的作曲经验,为AI拟定规则,在音符密度、跳跃程度、音符跨度、声音厚度等更高层次提升AI的学习和创作能力,这让AI可以更理解古诗背后的情感并通过音乐正确表达出来。合作中,AI既稳定可控又具备个性,和人类创作相互启发。机器学习与专业音乐人结合的创作算法,将人类的智慧赋予AI,又让AI的输出更具备人类的情感和思考能力。
整个流程,先有古诗做歌词,再由专家拆解成音乐情感和AI学习目标,最后达到AI自动生成,整套可控的智能音乐创作系统一旦成型,创作效率就能显著提高。目前AI根据古诗创作的儿歌有上百首,在平台上线短短一个月就收获了超过5万小朋友的参与打卡。
00:4503被AI激发的神奇创意层出不穷
伴随AI激发更多神奇创意,人与AI相互配合的优势也得到充分展现。年大年初一,CCTV-17频道黄金时段播出了新年特别节目《年画画年》,其中的配乐就是由火山语音团队根据节目的“年画”主题操刀创作的。
02:48年画的绘制需要耐心,需要放慢速度,背景音乐的选择要与这个过程相吻合。AI则在吸收了人类创作者的灵感和情感之后,通过快速计算为团队探路、试错,最后的成品找到了很好的平衡点,背景音乐与主持人讲述的年画故事相得益彰,又不会喧宾夺主,让观众能一直沉浸在节目的讲述中。
其实早在年的程序员节,央视纪录片《码农的异想世界》的同名主题歌曲也是AI词曲编唱的,这是一首偏电音风格的歌曲,主歌的男生说唱和副歌的电音女生,都是由AI实现的。
01:55两个与央视合作的案例中,AI都包办了词曲编唱整条链路。这种合作模式未来有着广阔的应用前景:首先AI创作可以生成没有版权纠纷的音乐。
《年画画年》原定配乐无法确定版权来源,无法获得正式的授权,在这种情况下导演开始商讨用AI技术生成配乐的可能性。在为视频、节目选择配乐时,往往付出了极高的沟通成本,也未必能够解决问题;但如果选择让AI来发挥,版权问题就无需过多担心了,还能积累出自己的原创曲库。
其次,AI创作可以灵活适应不同场景的需求。AI团队可以通过多个维度去控制音乐生成,例如和声、节奏、速度、旋律起伏、配器等,让成品符合配乐的需求,而且效率极高。像《年画画年》这么复杂且高质量的配乐,AI仅仅两天时间便完成了,导演组在初次听到曲子时评价:“我们都震惊了”、“我认为我们不会提出修改意见”。
第三,AI创作可以方便地与多媒体业务结合。优质的AI创作可以达到速度和质量的平衡点,让技术真正实用起来。就像把古诗创作成儿歌一样,未来AI音乐也可以应用于视频、有声小说、游戏等场景的配乐需求,服务于更多受用户喜爱并有意义的项目。
从ByteMuse的实践中我们能看到,AI的存在,使人类创意工作的可能性被极大地拓展了。一种稳定、可控,且能和人类互相启发的共创模式,很可能是未来解决AI和人类相处之道的一种默认选择。
火山语音,字节跳动AILabSpeechAudio智能语音与音频团队,长期以来面向字节跳动各大业务线以及火山引擎ToB行业与创新场景,提供全球领先的AI语音技术能力以及卓越的全栈语音产品解决方案,包括音频理解、音频合成、虚拟数字人、对话交互、音乐检索、智能硬件等。为抖音、剪映、飞书、Pico等业务提供了领先的音频理解能力,并适用于短视频、直播、视频创作、办公以及穿戴设备等多样化场景;为番茄小说、畅听及国际化业务提供高质量、多样化的AI朗读能力,打造了成熟的精品AI有声书方案等,通过火山引擎开放给外部企业。目前团队的语音识别和语音合成覆盖了多种语言和方言,基于端到端框架研发了高准确率、低延迟的语音识别、语音唤醒以及高拟人语音合成方案,多篇技术论文入选各类AI顶级会议。
-全文完-