今年1月底,Google公布了一款叫做MusicLM的作曲AI,它可以通过输入自然语言来生成音乐;也可以输入画作生成,实现从美术到音乐的转换;甚至可以用旋律(例如口哨声、哼唱声)作为条件,生成符合描述风格的音乐。
人人都有机会成为作曲家?
研发团队向我们展示了MusicLM的强大之处。
比如,输入一段描述性的自然语言:
“The main soundtrack of an arcade game. It is fast-paced and upbeat, with a catchy electric guitar riff. The music is repetitive and easy to remember, but with unexpected sounds, like cymbal crashes or drum rolls.(街机游戏的主要配乐。它节奏快,乐观,带有朗朗上口的电吉他即兴演奏。音乐重复且易于记忆,但又有意想不到的声音,比如钹碰撞或鼓声。)”
那么MusicLM就会给你这样一段音乐:
不仅如此,MusicLM对人声的生成效果也很自然。
“Slow tempo, bass-and-drums-led reggae song. Sustained electric guitar. High-pitched bongos with ringing tones. Vocals are relaxed with a laid-back feel, very expressive.(慢节奏,低音和鼓主导的雷鬼歌曲。持续电吉他。带有铃声的高亢班卓琴。人声轻松,给人一种悠闲的感觉,很有表现力。)”
MusicLM对这段文本的理解:
当然,此前也有过AI生成音乐的技术,但其作品往往时长短且声学场景单一,实用的意义不大。研发团队认为MusicLM有能力解决这一痛点,它可以生成长时间的音乐内容,并且保持连贯性。
最令陀螺君感到惊艳的一点是,MusicLM可以结合图像与文本的描述来创造符合条件的音乐。
事实上,文字与音乐的对应关系是模糊的。不同的人对同一段音乐的感受或许会相去甚远,而图像与文本结合似乎能够为使用者的表达增加准确度。
让我们来看看MusicLM是怎样理解世界名画的:
可以感受到,MusicLM对于一些模糊度很高甚至抽象的文本描述,也可以给出基本符合我们认知的音乐。虽然这目前仅是一款实验性的AI,但是以其展现的阶段性成果与潜力来看,大规模的AI音乐生成应用也离我们不远了。
与AI绘画所产生的版权争议不同,根据Google的论文我们得知,训练MusicLM所用的材料皆来自于Free Music Archive,这是一个无版权音乐库。MusicLM的训练包含了500多万段音频,总时长约28万小时。
从美术到音乐,AI加持让游戏制作更亲民
或许在音乐专业领域,AI生成还不足以加入市场竞争,但从游戏行业的角度出发,类MusicLM的AI音乐生成应用即将成为很多公司与从业者的福音。
首先是显而易见地降低游戏制作成本,让一些实力不那么雄厚的公司有机会优化资源分配,拿出更多资金去做其他方面的事情。
而对于独立游戏、小成本游戏来讲,AI音乐生成更让一些“门外汉”的制作人有机会实现自己心中所想。
还记得陀螺君此前介绍的《神之天平》吗?上班族KEIZO利用自己几乎全部的业余时间,花费多年打造这样一款游戏。其中游戏内的音乐大部分是免费的素材,而在浩如烟海的素材库中挑选、比对,找出符合游戏场景的曲子是一项繁琐且庞大的工程。
虽然KEIZO的精神值得学习,但无谓的付出与辛劳是我们不愿看到的,也不是每一个“灵感”都能等待那么久。
高效,准确,低门槛,是AI音乐应用之于游戏制作的意义。
当然,AI音乐不会也不能取代真正的音乐作曲家。在陀螺君看来,AI生成的音乐在未来会更像“工业产品”,在此我们可以借用知乎网友的一段话:
好的音乐总是能在听众期待的范围内制造一些不符合主流的“意外”,而AI生成的结果总是趋向主流的,稳妥折中的。(陀螺君认为这个道理也同样适用于AI绘画。)
那么,如果一款游戏对音乐的需求是音效,是背景,是其他内容的“装饰”,在不久的将来AI音乐一定会满足。而那些需要以“听觉享受”为卖点的游戏,比如音游,似乎还是仰仗作曲家更好一些。
总的来说,AI音乐已经基本能够满足游戏制作一般性的需求,它甚至可以抬高游戏行业内音乐制作的下限,但是距离触及上限,协助人们产出诸如《最终幻想》《八方旅人》之类的游戏,还有很长一段路要走。
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息
110777025(手游交流群)
108587679(求职招聘群)
228523944(手游运营群)
128609517(手游发行群)