新春走基层|为灵感装上AI蹄铁,让创作一骑绝尘
2026-02-20 上海

姜涛在“模速空间”工作。

青年报·青春上海见习记者 王馨怡/文 吴恺/图(除署名外

“绝尘”,古意指骏马飞奔,足不沾尘,形容速度之快、境界之高无人能及。在这个人工智能技术不断冲击人类认知边界的时代,我们不禁要问:在未来的赛道上,一骑绝尘的究竟是拥有无限算力的人工智能,还是拥有温热灵魂的年轻人?

在上海徐汇滨江,“模速空间”作为全国首个大模型创新生态社区,也是无数年轻人梦想起航的地方。自由量级便入驻于此,这支只有几十人的创业团队,打造出了“让灵感即刻成歌”的AI音乐App音潮。

日前,青年报专访了自由量级的CTO兼执行CEO姜涛。在他关于“速度”与“温度”的讲述中,我们找到了一些答案。

日行千里

当创作不再需要漫长的跋涉

故事的起点,源于八年前的一份心意。

2017年,姜涛想送妻子一份特殊的结婚纪念日礼物——一首完全由他原创的歌。彼时,生成式AI的浪潮尚未席卷而来,用AI创作音乐更像是天方夜谭。尽管姜涛有着哈工大的技术背景,在大厂深耕多年音频算法,但当他试图用那时的技术去创作时,面对的是一条支离破碎的“流水线”。

“当时还没有端到端模型,更像是在做填空题。”姜涛回忆道,那时用技术创作音乐的流程极其繁琐:先由模型生成旋律,再基于规则约束去匹配和弦,反复回调直至两者勉强契合;编曲基于规则驱动,但离不开专业音乐人提供的规则库与模板支撑;而填词用的还是早期大语言模型,它能写出短句,却很难理解主歌、副歌的起承转合。

“虽然每个环节都有AI参与,但它不懂结构,最后合成出的歌声更是充满了冷冰冰的‘机械味’。”为了让这首歌拥有“人的温度”,姜涛最终只能把AI当做辅助,自己租用录音棚,请录音师,亲自演唱并反复打磨。几千元的投入、三年的制作周期,才勉强将那份心意化为一段音频。

“那时候我就在想,音乐创作的门槛太高了,只有受过长期专业训练的‘少数人’才能进入。”

后来,姜涛亲手推倒了这堵墙。

姜涛和同事们在一起。

2024年,姜涛抓住端到端音乐生成大模型的技术契机。他组建起一支兼具算法实力与音乐素养的跨界团队,于2025年4月正式入驻“模速空间”,潜心打磨底层技术。

2025年9月,自由量级传来捷报,其自主研发的“音潮音乐”大模型正式通过国家互联网信息办公室备案。这意味着,这支团队拿到了面向市场规模化商用的“通行证”。

从最初的V2.0到如今即将上线的V3.0,团队采用独特的AR+NAR混合架构,解决了音乐生成中“超长上下文”的连贯性难题。“早期的模型,我们还在纠结它生成的音质是否清晰;到了2.5版本,我们在解决‘AI感’的问题,让它听起来像人唱的;而到了现在,我们开始追求‘抓耳度’和‘音乐性’,希望它不仅能听,而且好听,甚至能带来惊喜。”如今在音潮App中,创作一首歌的时间被大幅压缩。用户不再需要懂乐理,甚至不需要会写歌词。一段文字、一张照片,按下生成键,AI便能在瞬间完成作词、作曲、编曲、演唱到混音的全部工作。通过强大的对比学习模型,音潮App还可实现多首歌曲的曲风、情绪、音色、唱法、配器的融合,让歌曲迸发出全新的生命力。

记者尝试上传了一张随手拍摄的流浪猫照片,不到一分钟,一首名为《守候》的流行风格歌曲便流淌而出。女声温柔,歌词精准捕捉了喧嚣城市中那份默默的陪伴。

“过去,音乐创作是少数人的专利。而现在,AI正将创作的权利交还给每一个人。”姜涛的手机里藏着很多用户的故事:常年在公路上奔波的卡车司机,用AI的歌声把曾经只能写在烟盒上的诗传给远方;痴迷徐志摩散文的中年人,终于能把那些沉默的文字,变成耳边流淌的歌。在如今,AI像一块新蹄铁,让创作的马蹄变得轻盈迅疾。

跨界合鸣

万马奔腾的“协奏曲”

如果说单个的大模型是一匹独行的快马,那么在“模速空间”,我们能看到万马奔腾的生态图景。

作为全国首个大模型创新生态社区,“模速空间”正迈向3.0阶段,着力构建世界级的创新生态,实现从“孵化企业”到“孵化产业”的跃升。自2023年9月揭牌以来,这里持续将算力、数据、合规与融资等要素,转化为“随手可用”的公共服务:通过“算力生态超市”实现“下楼即买、按需即用”,叠加高频的合规辅导与供需撮合,让企业在园区内便能完成从技术到应用的快速试跑。

“音潮音乐”大模型。App截图

“在这里创业最大的好处,就是‘上下楼就是上下游’。”姜涛表示,作为入驻企业,自由量级所在的这栋楼里,聚集了上下游产业链的各类AI公司,物理空间的聚集也催生了奇妙的化学反应。日前,同在“模速空间”的飞瀑智能正在探索与自由量级的合作,他们设想为旗下的机器人安上一颗“懂音乐的心”。在不久的将来,当机器人通过摄像头捕捉到主人眼角的疲惫时,它可能不再机械地播放曲库里的音乐,而是调用模型,现场编创一首带有治愈色彩、节奏舒缓的原创歌曲。

类似的跨界合作正在“模速空间”不断发酵。有的企业做智能魔镜,设想通过分析用户的肤质和精神状态,推送相应的疗愈音乐;有的教育科技公司计划将AI音乐引入课堂,让孩子们通过与AI协作来学习乐理知识。这些愿景,正在一步步变为现实。

商业应用之外,姜涛同样重视技术在文化传承中的可能性。在数据训练中,团队特意加强了对中文语境和方言的优化。“英文歌曲往往以‘音素’为单位,而中文有声调与呼吸感,如果直接用海外的模型生成中文歌曲,往往会严重‘水土不服’,听起来极不自然。”

AI生成的歌曲。App截图

自由量级不仅攻克了中文发音与适应性的难题,更在尝试保护那些濒临消失的声音。“中国有很多少数民族剧种或地方戏曲,可能只有几万人甚至几千人还在听,留存下来的录音片段极为稀缺。传统的数字化手段很难修复,但大模型可以通过‘学习’仅存的录音,掌握其核心的唱腔和韵律风格,从而生成新的内容。”

姜涛描绘了这样一个场景:未来的年轻人,可以用AI生成地道的上海话Rap,或者用四川话演绎赛博朋克风格的说唱;而那些古老的羌笛、失传的曲牌,将在代码的滋养下,以一种全新的姿态“重生”。

伯乐与千里马

AI时代,年轻人的核心竞争力何在?

随着AI能写诗、作画、编曲,一种焦虑情绪在青年群体中蔓延:人,会被AI远远甩在身后吗?

“以前我们说,世有伯乐,然后有千里马。”面对这个问题,姜涛给出了一个颠覆传统认知的答案,“但在今天,我认为AI才是那匹日行千里的马。而我们每一个人,都是决定方向、筛选价值的‘伯乐’。”

在他看来,AI的价值在于极大地释放了“试错”的成本。他打了个比方:以前一个创作者可能有100个灵感,但受限于精力、技能和时间,他只能小心翼翼地挑最稳妥的一个去执行。“而现在,AI拥有了惊人的执行力,它可以瞬间帮你把这100个想法全部变成半成品。你需要做的,不再是机械式地埋头苦干,而是运用你的审美、你的直觉,从这100个结果中,挑出那个最能打动人心的作品。”那么,当工具的门槛被彻底拉平,每个人都能制作原创音乐的时代,什么才是当代青年“一骑绝尘”的核心竞争力?姜涛给出了三组关键词:心态上拥抱,兴趣上深耕,审美上提升。

“首先是心态上的拥抱。”姜涛认为,技术浪潮不可逆转,抗拒只会导致滞后,AI应被视为拓展能力边界的得力助手。“早期接触并驾驭它的人,往往能更快地适应新规则。它能帮你快速建立框架、验证猜想,让你从重复劳动中解放出来,去思考更本质的问题。”

“其次是兴趣上的深耕。”在他看来,AI的潜能需要高质量的指令来激发。“只有真正热爱并深耕某个领域,你才能提出好问题。”一个深谙乐理的创作者,能精准地告诉AI调整的需求,从而引导它创造出令人耳目一新的作品,也更容易从众多生成结果中,一眼认出那个最具潜力的版本。

“最后,是审美的提升。”姜涛强调,AI能生成海量内容,但“什么是好的”这一判断权,始终在人手中。“在AI时代,学乐器依然非常必要,但不是为了像复读机一样演奏,而是为了构建内心的‘审美标尺’。AI可以模仿99%的规律,但那剩下的1%,是由非线性的、因人类情感波动而产生的‘弦外之音’,让旋律有了重量。”

丙午马年,万象更新。当算法为创作装上新的“蹄铁”,人类理应成为那个从容的伯乐。不用跟机器比拼速度,而是骑在AI的马背上,以更从容的姿态,去探索那些未曾抵达的情感深处与艺术高峰,一骑绝尘。

青年报·青春上海见习记者 王馨怡/文 吴恺/图(除署名外)

来源:青年报

返回上页 回到首页

青年报社 版权所有

总机:021-61176117 | 广告热线:021-61173717 | 违法和不良信息举报电话:021-61177819 / 61177827 举报邮箱:services@why.com.cn    测试版