很难准确定义胡昌然。
这位清华大学电子系2014级本科生,外号“呆萌”,实则相当帅气。虽出身理工科,长期埋首电子线路间,但却明显“跑偏”,练就了一身好舞艺,是清华大学国标队队员、演出达人;也弹得一手好琴,从三四岁自己爬上琴凳开弹,早早已钢琴八级达标,最喜欢在下雨天开着窗户即兴弹上一段,雨的味道让他安心,音乐让他痴迷,殊不知,这些高高低低的音符已为他奏响创业之路的序曲。
虽然胡昌然一度认为大学生创业不靠谱,一心想走文艺路线。但如今作为DeepMusic创始人,他最终还是走上了“AI+音乐”的创业路……人生,总是这样不经意间就转了个弯,有时因为一件事,有时则是因为一个人,这个人就是清华大学计算机系副研究员胡晓林。
2016年,AlphaGo横空出世,以4∶1的总分战胜韩国围棋大师李世石。这一消息瞬间让人工智能成为人们谈论的热点,也成了胡晓林及其实验室研究的对象之一——如果说人工智能在分析决策领域的能力已可和人类相抗衡,那在没“绝对最优解”、被认为是人类最后“制胜高地”的艺术创作领域呢?于是,一项研究AI生成音乐的DeepMusic项目就此而生,胡昌然因其既懂音乐又懂计算机也在机缘巧合下加入了这个项目。
但这是个未知的旅程,且无经验可循。“让AI利用深度学习创作音乐是国内人工智能在音乐领域的‘尝鲜’,不像别人搞计算机视觉有海量完善的数据库可参考,我们可能连数据都没有,更谈不上让机器去训练、学习。” 事实上,胡昌然也始终在问自己,机器是否真的可以写出可比肩甚至超越人类的艺术作品,但他还是选择了这条少有人走的路。
最初,DeepMusic团队本以为可以把大量语言处理的模型、技巧等直接拿过来用,但大家渐渐发现,和语言不同,音乐不是单一序列在时间顺序上的叠加,而是有旋律、和声和节奏多个立体维度,因此,建立一个可训练的模型并非那么简单。
有时,走错一步换换小零件就能解决,抑或换一个数据库,但更有甚者,要把整个模型都换掉;有时,折腾了几个月,最后证明这个方法行不通,白费了力气。百转千回,团队差不多花了半年时间才做出第一支DEMO(demonstration的缩写,示范代码、样片),并凭此获得了当年微软校园菁英计划第一名,初尝了甜头。但好景不长,团队成员由于出国研修、繁重的课业项目等种种原因愈发聚少离多,一些技术骨干也暂别了团队。
但胡昌然留下来了。在胡晓林的鼓励下,他牵头把这个项目继续下去,更想把它推出实验室,推向市场,“音乐创作从确定风格、写谱、编曲、配乐……是个很长的链条,DeepMusic一方面可减少创作中一些重复性的工作,让人专注于创造性工作;另一方面可降低专业门槛,让普通人也能轻松创作音乐,享受音乐”。
于是,经过一段时间的调整,DeepMusic被重新激活,但很快又被卡住了。继第一支DEMO后,机器生成的音乐水平在很长一段时间内都没提高,缺乏整体性,缺乏歌唱性。
“怎么办?还能怎么办?只能不断去尝试,这个不行就试另一个。”胡昌然似乎已经习惯了这样那样的沟沟坎坎。在他看来,科研也好,创业也罢,是个螺旋式上升的过程,“不是说这个难点克服了就成功了,而是有数不清的难点,走一步再走一步……是个很难熬的过程”。
那时的胡昌然,除了上课,就是泡在实验室,加班加点地写代码,时常深夜才回寝室,尽管如此,成效仍不佳。后来在一次组会上,胡晓林提出是否可以像某个图像生成模型一样,自顶向下,分阶段的生成音乐,一下子点醒了胡昌然。
他和队友们从头开始。如今,DeepMusic可让即使没任何音乐基础的用户都能通过便捷地选择乐曲时长、风格、演奏乐器和情绪等标签后在短短数秒钟内得到他们所需的个性化音乐,并凭此一举囊括了清华大学第35届挑战杯特等奖、清华校长杯十强等荣誉,同时获得了300万元的天使投资。
但这远不是结束。
胡昌然认为,“最后能作出成就的,一定是少数人走过的路,一定是所有人都往右拐时你往左拐。有时你会觉得很孤独,但如果你相信自己做的东西是对的、有价值的,那就不用在意。”所谓,坚持下去不一定能成功,但坚持下去才有机会成功。