全球消息！谷歌AI练习生写了首歌，网友听完心率都低了

当前位置：首页 > 资讯 > >正文

全球消息！谷歌AI练习生写了首歌，网友听完心率都低了

来源：站长之家时间：2023-05-01 10:19:31

声明:本文来自于微信公众号量子位（ID:QbitAI），作者:杨净衡宇，授权站长之家转载发布。

一段话整出一首歌，甚至是男女唱（跳）rap的那种。

男女说唱音频:00:0000:30

(资料图)

谷歌最新模型MusicLM一经推出就惊艳四座，不少网友惊呼:这是迄今听到最好的谱曲。

它可以根据文本生成任何类型的音乐，不管是根据时间、地点、年代等各种因素来调节，还是给故事情节、世界名画配乐、生成人声rap口哨，通通不在话下。

比如这幅《呐喊》（Scream）

在一段摘自百科的说明提示下，它生成了这样一段音乐。

（蒙克在一次幻觉经历中感受到并听到了整个自然界的尖叫声，它的灵感来源于此，描绘了一个惊慌失措的生物，既像尸体又让人联想到精子或胎儿，其轮廓与血红色天空的旋涡线条相呼应。）

ViT（Vision Transformer）作者在听过一段关键词含“平静舒缓”“长笛和吉他”的生成音乐后，表示自己真的平静下来。

也不免有同行表示，这对我来说比ChatGPT更值得关注，谷歌几乎解决了音乐生成的问题。

毕竟MusicLM背靠280000小时音乐的训练数据库，事实上从现释出的Demo来看，MusicLM的能力还不止如此。

还可以5分钟即兴创作

可以看到，MusicLM最大的亮点莫过于就是根据丰富的文字描述来生成音乐，包括乐器、音乐风格、适用场景、节奏音调、是否包括人声（哼唱、口哨、合唱）等元素，以此来生成一段30秒的音乐。

即便说的只是那种说不清道不明的氛围，“迷失在太空”、“轻松而悠闲”;又或者是直接用在一些实用场景上，比如“街机游戏配乐”、给绘画配乐等。

除此之外，MusicLM具备长段音乐创作、故事模式、调节旋律等方面的能力。

在长段音乐方面，它能完成5分钟即兴创作，即便提示只有一个词。

比如仅在Swing（摇摆）的提示下，听着真就有种想马上下班去跳舞的冲动。(bushi)

而在故事模式中，不同的情标记甚至可以精确到秒的生成，哪怕情境之间完全没有任何联系……

游戏中播放的歌曲（0到15秒）——河边播放的冥想曲(15到20秒)——火(0:30-0:45)——烟花(0:45-0:60)

更让人惊艳到的是，它还有很强的实用性功能。

一方面，它可以将旋律的提示结合进文本提示当中去，这样一来可以更精细地来调整音乐。有点改甲方爸爸需求那味了。

另一方面，它还能根据具体的乐器、地点、流派、年代、甚至是音乐家演奏水平等文本来生成。

背后生成模型MusicLM

但有一说一，AI生成音乐模型不在少数，谷歌自己此前也推出有类似的模型AudioLM。

此番MusicLM究竟有何不同?

据研究团队介绍，贡献主要有三个方面:

生成模型MusicLM。

把方法扩展到其他条件信号，如根据文本提示合成的旋律，并生成5分钟的demo。

发布了首个专门为文本-音乐生成任务评估数据集MusicCaps。

首先，MusicLM正是基于谷歌三个月前提出AudioLM模型的拓展。

AudioLM不需要转录或标记，只需收听音频，AudioLM就能生成和提示风格相符的连贯音乐，包括钢琴音或人声对话等复杂声音。

而最新的MusicLM，就是利用了AudioLM的多阶段自回归建模作为生成条件，且以此为基础进行拓展，使其可以通过文本提示来生成和修改音乐。

它是一个分层的序列到序列（Sequence-to-Sequence）模型，可以通过文本描述，以24kHz的频率生成音乐，并在几分钟内保持这个频率。

具体而言，研究团队使用了三个模型来用来预训练，包括自监督音频表征模型SoundStream，它可以以低比特率压缩一般音频，同时保持高重建质量。

还有语义标记模型w2vBERT，促进连贯生成;音频文本嵌入模型Mulan，它可以将音乐及其对应的文本描述投射到嵌入空间（以消除在训练时对文本的不同需求），并允许纯音频语料库上进行训练，以此来应对训练数据有限的难题。

训练过程中，他们从纯音频训练集中提取MuLan音频标记、语义标记和声学标记。

在语义建模阶段，他们用MuLan音频标记作为条件来预测语义标记。随后在声学建模阶段，又基于MuLan音频标记和语义标记来预测声学标记。

每个阶段都被建模为一个序列-序列任务，均使用单独解码器Transformer。

在推理过程中，他们使用从文本提示中计算出的MuLan文本标记作为调节信号，并使用SoundStream解码器将生成的音频标记转换成波形。

在280000个小时的训练后，MusicLM最终学会了保持24kHz的频率生成音乐，哪怕用来生成音乐的文本非常绕口。

类似“迷人的爵士歌曲与令人难忘的萨克斯独奏和独奏歌手”或“柏林90年代低音和强烈的电子乐”之类的。

研究团队还引入了一个高质量音乐数据集MusicCaps来解决任务缺乏评估数据的问题。

MusicCaps由专业人士共建，涵盖5500个音乐-文本对。研究团队公布了这个数据集，方便大伙进一步的研究。

这么一套操作下来，通过定量指标和人工评估，MusicLM在音频质量和文本契合度等方面都优于此前的音乐生成AI。

不过，谷歌研究团队说了:目前没有对外发布MusicLM的计划。

原因很简单，除了训练过程中难免出现的样本质量失真，最最关键的还有2点。

一来，尽管MusicLM在技术上可以生成合唱和声等人声，但是仔细听来，生成音乐的歌词，有的还勉勉强强听得出是音乐，有的根本就是无人能听懂的外星方言。

再者，研究团队发现系统生成的音乐中，约有1%直接从训练集的歌曲中复制——这已经足以阻止对外发布MusicLM了。

此外，还有批评者质疑，在受版权保护的音乐素材上训练AI模型到底合不合理。

不过团队在论文中介绍了下一步动向，主要关注歌词生成、改善提示文本准确性以及提高生成质量。

复杂音乐结构的建模也将成为团队的重点关注方向之一。

音频生成AI

这个研究的背后团队，是谷歌研究院。

共同一作Timo I. Denk，是谷歌瑞士的软件工程师，每天的工作就是利用ML进行音乐理解。

在这里多说两句，MusicLM的论文中，研究团队提到，MusicLM在质量和提示依从性方面都优于以前的系统。

“以前的系统”包括哪些?

一个是Mubert，已在Github开源API，是一个text-to-music的AI，系列产品有根据既有标签生成音乐的Mubert Render、听歌软件Mubert Play等。

还有Riffusion，它建立在AI绘图的基础上，但将其应用于声音。

换句话说，Riffusion的工作原理是首先构建一个索引的频谱图集合，上面标记代表频谱图中捕获的音乐风格的关键字。

在频谱图主体上训练时，Riffusion就用Stable Diffusion的同一个方法——干预噪音，来获得与文本提示匹配的声波图像。

还有针对音乐制作人和音乐家的 AI 音频生成工具Dance Diffusion，OpenAI推出的可自动生成音乐的ML框架Jukebox……

要咱说，别成天盯着ChatGPT了，AIGC下一个风口万一是音乐生成呢?

参考链接:

[1]https://google-research.github.io/seanet/musiclm/examples/

[2]https://arxiv.org/pdf/2301.11325.pdf

[3]https://techcrunch.com/2023/01/27/google-created-an-ai-that-can-generate-music-from-text-descriptions-but-wont-release-it/

（举报）

X 关闭

最近更新

全球消息！谷歌AI练习生写了首歌，网友听完心率都低了

2023-05-01 10:19:31

资讯
韩红“咏生”演唱会超级音效经典新编-每日时讯

2023-05-01 09:08:06

资讯
当前简讯:主体围护结构施工基本完成

2023-05-01 08:20:15

资讯
艾迪药业现3笔大宗交易合计成交180.00万股世界新消息

2023-05-01 06:49:53

资讯
最近王小帅mp3下载mp3_最近王小帅mp3下载世界微动态

2023-05-01 06:04:28

资讯
理查利森本赛季英超因庆祝得到2张黄牌，比他的联赛进球数还多

2023-05-01 02:20:30

资讯
属蛇的和属兔的合不合属兔和属蛇的相配吗

2023-04-30 22:08:55

资讯
全球快消息！税控盘购买分录购税控盘最新会计分录

2023-04-30 21:18:14

资讯
今明两天全国大部天气晴好，假日后期需留意降雨！_天天观天下

2023-04-30 20:11:45

资讯
“五一”假期出行：公路迎来客流高峰假期将持续高位运行-今日播报

2023-04-30 18:51:06

资讯
巴基斯坦总领事感谢中国海军：协助200多名巴方人员从苏丹撤离

2023-04-30 17:50:04

资讯
手机和电脑连接不上怎么办

2023-04-30 16:58:35

资讯
外交部领事保护中心提醒出境中国游客加强安全防范

2023-04-30 15:08:39

资讯
邮政月饼任务_邮政月饼

2023-04-30 14:12:46

资讯
世界短讯！五一坚守｜茶黄隧道预计五月初双洞贯通

2023-04-30 13:13:58

资讯
“停车引导卡”帮找车位地图上标注景区周边停车场位置

2023-04-30 11:57:32

资讯
【环球速看料】完工倒计时！桂林国际会展中心最新进展→

2023-04-30 11:24:23

资讯
全球今日报丨海南劳务派遣怎么办理

2023-04-30 10:36:59

资讯
华为Wi-Fi 7比Wi-Fi 6快4倍！真机实测网速狂飙4.3Gbps 最资讯

2023-04-30 09:42:10

资讯
每日消息!大巴黎VS洛里昂首发曝光：拉莫斯坐镇，维拉蒂领衔，梅西姆皇冲锋

2023-04-30 09:04:27

资讯
中华全国集邮展览首次在昆举办

2023-04-30 07:24:59

资讯
浙江舟山至湖南岳阳“江海直达航线”首航抵达城陵矶港

2023-04-30 06:08:21

资讯
苦咖啡剧情介绍_苦咖啡简介即时

2023-04-30 04:54:20

资讯
u盘的启动盘怎么删除怎么删除u盘启动盘

2023-04-30 01:46:56

资讯
90后女生要去IPO敲钟了

2023-04-29 23:12:18

资讯
中超-孙国文中横梁国安0-0逼平泰山新赛季难求一胜

2023-04-29 22:00:49

资讯
全球热讯:也开头的成语_一开头的成语

2023-04-29 20:59:49

资讯
天天微资讯！飞机维修专业就业前景_飞机机电设备维修专业就业前景

2023-04-29 20:02:42

资讯
【视频】摸你黑的“泥”到底是什么？解码“娘布落”制作过程

2023-04-29 19:00:29

资讯
私人订制迅雷下载 MP4_私人订制迅雷下载-天天报道

2023-04-29 18:02:46

资讯
天天通讯！魔兽世界声望指令_魔兽世界声望

2023-04-29 16:49:59

资讯
蒋天海到东方豪苑检查消防安全：抓好隐患整改确保小区安全

2023-04-29 15:14:53

资讯
【天天快播报】青岛：审批“瘦身” 激活假日文旅市场

2023-04-29 15:00:53

资讯
华为P60系列机型推送更新：优化拍摄体验、系统性能每日视讯

2023-04-29 13:53:35

资讯
2023年04月29日云汇锡周报：长江有色锡周均价209700

2023-04-29 12:45:28

资讯
庞统连环计介绍_庞统连环计讲解

2023-04-29 11:42:07

资讯
沁阳市民政局开展“宜居靓家园健康新生活”爱国卫生月专题活动全球热消息

2023-04-29 11:00:24

资讯
环球新消息丨初三励志语录中考加油句子100字

2023-04-29 10:14:52

资讯
天天快看点丨拧紧节前安全阀武陵区交通运输综合行政执法大队开展“五一”节前安全检查

2023-04-29 10:01:15

资讯
团结奋斗开新局喜迎工会十八大·劳动者之歌 | 一“丝”不苟的“时光匠人”

2023-04-29 08:36:49

资讯
上海三校生高考可以考哪些学校_上海三校生报考学校环球速讯

2023-04-29 07:53:20

资讯
伊朗外长：伊朗和沙特将在数天内互相重开大使馆焦点

2023-04-29 06:57:00

资讯
清咽滴丸怎么吃正确吃法是什么_清咽滴丸怎么吃

2023-04-29 06:05:32

资讯
环球速讯：高频喷射式点胶阀_关于高频喷射式点胶阀简述

2023-04-29 04:45:49

资讯
云南省昭通市2023-04-29 00:21发布大风蓝色预警

2023-04-29 03:03:18

资讯
拜仁公布亚洲行部分行程：首站前往日本，7月29日对阵川崎前锋

2023-04-29 00:54:03

资讯
手机版wps横向求和_手机版wps横线怎么打天天通讯

2023-04-28 23:02:48

资讯
「大爱港城今周网红」最美托举！四位救人好心市民获“天天正能量奖”

2023-04-28 22:15:48

资讯
世界新消息丨“五一”假期临近多地旅游热度提升

2023-04-28 21:42:57

资讯
通策医疗2022年营收净利双降 2023年业绩增长目标不低于25%

2023-04-28 21:13:16

资讯
快资讯：孙兴慜已为热刺打进144球，超越迪福排在队史射手榜第6位

2023-04-28 20:13:36

资讯
小红书联合英特尔、天猫小黑盒，聚焦职场生活，细化办公新趋势

2023-04-28 19:38:08

资讯
美军两架阿帕奇直升机在阿拉斯加州相撞致三死一伤_环球时快讯

2023-04-28 19:07:57

资讯
提醒大家：50岁后，不管有多少存款，也千万别做“3件”糊涂事！天天快资讯

2023-04-28 18:45:57

资讯
全球播报:腾讯清仓？华谊兄弟去年净亏近10亿元，一季度营收增七成

2023-04-28 18:03:11

资讯
当前快播：3月我国国际收支货物和服务贸易进出口规模同比增长2%

2023-04-28 17:35:00

资讯
「微李」和解内幕：微念付费获李子柒品牌经营权；弃网红经纪业务全球观速讯

2023-04-28 17:10:39

资讯
教育部体育卫生与艺术教育司原司长王登峰被提起公诉_聚焦

2023-04-28 16:46:01

资讯
天天动态:黑色衣服掉色怎么处理（如何解决黑色衣服掉色）

2023-04-28 16:30:41

资讯
广西梧州消防通报一槽罐车起火：火势被扑灭未造成人员伤亡

2023-04-28 15:47:30

资讯
江西师范大学专业分数线（江西师范大学专业）焦点精选

2023-04-28 15:27:35

资讯
【焦点热闻】2022年 | 和辉光电营收41.91亿，净利亏损16.02亿

2023-04-28 15:06:54

资讯
领取失业金对退休有影响吗？领了失业证有什么坏处？

2023-04-28 14:21:26

资讯
宝马正在研究独立车型焦点播报

2023-04-28 13:43:51

资讯
未闻孔雀是夫子家禽的意思闻的意思未闻孔雀是夫子家禽的意思_今日要闻

2023-04-28 13:20:09

资讯
环球关注：心锁女装搭配流行的双腰牛仔短裤

2023-04-28 12:45:31

资讯
时讯：《了不起！舞社》第二季杨丞琳演绎女将风范

2023-04-28 12:07:33

资讯
这种调味料，加热后有毒、会致癌？你可能被骗了太多年…… 天天观点

2023-04-28 11:54:51

资讯
朱芊曦逆转张本美和，见招拆招的能力，独步乒坛

2023-04-28 11:09:15

资讯
天天速讯：关注丨“五一”期间长沙各大医院门诊安排

2023-04-28 10:51:46

资讯
英雄联盟拉美区推出点券分期付款，提供3/6/9/12期四种选择

2023-04-28 10:23:45

资讯
南京大屠杀又添新证

2023-04-28 10:19:08

资讯
口子窖2022年营收51.35亿净利15.5亿董事长徐进薪酬356.01万

2023-04-28 09:40:02

资讯
中国越野鞋行业市场规模及未来发展趋势

2023-04-28 09:21:27

资讯
告别Win10 微软确认系统不再更新 2025年结束支持

2023-04-28 08:52:01

资讯
关注：国米北看台球迷：意杯半决赛抗议活动并非因为欧冠球票销售问题

2023-04-28 08:18:57

资讯
林高远陈幸同太争气！无缘世乒赛后，横扫日本冲击首冠，国乒尴尬-当前热议

2023-04-28 07:28:39

资讯
世界热讯:大创项目申请书范文(10篇)

2023-04-28 06:35:51

资讯
以青春之名赴北辰之约北辰区首届文旅消费季启动

2023-04-28 04:48:47

资讯
都江堰和秦始皇陵哪个修建的年代更早一些都江堰和秦始皇陵哪个修建的年代更早

2023-04-28 02:02:51

资讯
【天天新要闻】紧张！没想到，柳州这个小生命，以这样的方式来到人间

2023-04-27 23:55:26

资讯
焦点快看：晋控电力2022年营收202.2亿总经理师李军薪酬56.26万

2023-04-27 22:43:06

资讯
打开网上支付功能_计算机网上怎么支付老是弹出网上支付提示怎么设置都不行有谁

2023-04-27 21:57:53

资讯
世界地球日是哪一天呢_世界地球日是哪一天_每日动态

2023-04-27 21:20:58

资讯
华联股份2022年营业收入11.2亿元同比减少8.02% 每日视点

2023-04-27 20:54:57

资讯
爱，就是一场接力！

2023-04-27 20:15:28

资讯
淘宝中奖套餐（淘宝中奖）

2023-04-27 19:17:57

资讯
中法联合演绎《搜神传》同名故事 |《紫玉烟沉》春秋乱世，浮萍众生，爱恨离失

2023-04-27 18:47:27

资讯
环球速讯：京东家电家居首次亮相AWE 全景式揭秘家电家居一体化战略

2023-04-27 18:16:16

资讯
全国疫情防控形势总体平稳短期内出现规模性疫情可能性小

2023-04-27 17:34:42

资讯
当前滚动:C4D渲染太慢怎么解决，为什么我的C4D老是崩溃？

2023-04-27 17:14:42

资讯
犀牛看市0427：三大指数齐涨军工医药持续走强人工智能退潮

2023-04-27 16:51:06

资讯
数不尽！真的数不尽！-天天观速讯

2023-04-27 16:40:12

资讯
当前观察：天全县TQ2023-5号地块国有建设用地使用权拍卖成交结果公示

2023-04-27 16:12:13

资讯
今日讯！博山农商行：新媒体数字化营销平台

2023-04-27 15:29:11

资讯
-67%！《极限竞速：地平线4》史低折扣限时开启！世界热消息

2023-04-27 15:01:58

资讯
外国公司或将加入恒生指数哪些公司最有望晋升“蓝筹”

2023-04-27 14:39:16

资讯
【汇正财经】极电光能全球首条1GW产线开工，钙钛矿迎重大里程碑

2023-04-27 14:16:56

资讯
星穹铁道下载破2000万启程庆典4月30日开幕_世界今热点

2023-04-27 13:33:30

资讯
指令语言式

2023-04-27 12:54:31

资讯