“我越有东西”。看到YCY成为第一位明星AI歌手后,有用户在微博上发文赞。
用户赞了一首《超越AI》唱的粤语歌《走人生路》。艾学习并还原了YCY的音频特征,然后用她的声音唱了这首粤语歌。目前这种模拟人声的AI技术已经明显偏离了“机械感”,仿佛真人在唱歌。
《超越AI》发行方酷狗音乐表示,未来将陆续推出更多风格各异、特色突出的AI歌手。这些AI歌手将专注于“超级订阅”频道。这是酷狗在AI落地的最新尝试。《超越AI》的推出,是希望借助明星的影响力,让“AI歌手”这个功能被更多人所知晓和喜爱,打破一些小众歌曲的圈子,让好音乐得到更多的关注。同时希望给音乐行业带来更多的想象空间空,让AI技术真正服务于音乐人,满足音乐用户的需求。
AI歌手背后的黑科技
作为《创造101》最出名的明星,大部分人对YCY的第一印象是,她因为学不会唱歌跳舞,在节目里哭了。
但现在,“超越AI”可以轻松学会一首歌,用和专业歌手一样的能力唱出来,甚至是粤语歌。
这背后是酷狗阿波罗声音实验室多年的潜心研发。站内官方信息显示,阿波罗声音实验室是酷狗音乐的先锋团队,负责声音技术和智能音乐技术的研发。在声音合成、声音再现、音乐识别、音乐内容理解等技术领域有着诸多开创性的研究和深厚的积累。实验室开发了一系列创新技术,如个性化声音合成、音频指纹、封面识别、音轨分离等。,并开发了很多产品功能,如酷狗唱歌、听歌、多声道播放等。,并致力于为用户带来更好的音乐和娱乐体验。
据该技术负责人介绍,《超越AI》演唱的歌曲是由自主研发的阿波罗声音引擎合成的。该技术采用深度神经网络模型,能够高度还原和再现音频特征,合成出逼真传神的歌曲,而粤语歌曲的合成技术更是业内首创。“我们自己开发了粤语合成系统,把粤语和普通话结合起来,只需要提供普通话的录音数据就可以合成粤语歌。”
唱歌不同于普通的声音,有更复杂的高低音转换、演唱风格、多种语言等模式。所以AI音乐是算法和艺术的交叉,要解决机器不擅长学习的个性化和审美化倾向,需要灵活采用多种技术手段。酷狗的AI歌手在这方面有所尝试,并已落地。比如《超越AI》的歌曲列表中,有一首《最美的期待》是周笔畅原唱的,需要扎实的唱功来表达感情。通过AI技术,可以用YCY的声音叠加原唱周笔畅的唱功,副歌甚至采用真假音转换,呈现高音甜美、音高适中、低音稳定的特点。
据了解,Beyond AI涵盖了“声纹提取”、“多语种语音合成”、“多情感语音合成声学模型”等多项先进技术,已申请11项发明专利。酷狗的技术负责人表示,目前他们正以虚拟歌手演唱、训练、RD为重点,积极探索AI技术的多个应用场景,如明星AI歌手、用户自建AI歌手等。
目前,“超越AI”能演出20多首热门单曲,包括《体面》、《白月光》、《朱砂痣》等不同流派的民族歌曲,以及《buff中的行走人生之路》、《爱》等粤语歌。音乐库列表每个月都会更新。
酷狗持续创新
2022年,互联网制造商增加了在RD的投资,音乐行业也是如此。酷狗音乐所在的腾讯音乐集团财报显示,2021年,腾讯音乐集团为了扩大在产品和技术创新方面的竞争优势,大幅增加了RD投资。
近年来,酷狗在音乐研究和创新方面做了很多尝试。去年10月,酷狗围绕“音乐荒”问题推出了“一键音乐搜索”功能,应用了AI音乐技术。音乐爱好者可以有针对性的收集乐谱,也可以自主上传乐谱。自推出以来,已有100多万用户要求进行音乐交流。
去年底上线的酷狗蝰蛇音效和多轨功能,是国内首个可以同时实现歌曲智能分轨和多轨播放的功能,为不同的曲目增加3D空听感。作为音频领域的一大创新,酷狗蝰蛇音效多声道功能赋予了音乐空在听觉上的跨感和方向感,可以让声音准确地三维环绕听者的耳朵空,还可以实现对任何音乐中人声、各种乐器等不同音色的音轨进行分离或单独控制。
此外,酷狗还推出了“歌曲吉格集”产品,集“词、歌、编、唱”于一体的“原创”功能。通过人工智能辅助作曲和歌词,“音乐小白”还可以创作歌曲。
目前在线音乐行业已经从高速增长转为存量竞争,但仍在继续扩张。艾媒咨询数据显示,2021年中国数字音乐市场规模达到428.9亿元,同比增长20.03%,预计2022年将达到482.7亿元。其中,艾媒咨询分析师认为,在技术的推动下,中国数字音乐市场的规模正在不断扩大。
线上AI歌手,酷狗音乐相关负责人表示,AI语音与音乐行业的结合,可以给行业带来更多的想象空间空,让AI技术真正服务于广大音乐人和音乐用户,让技术真正推动产业发展。酷狗也将继续在技术领域投入。