魔性AI写歌神器 | 对话AI音乐创业CEO郭靖

2019-05-05 15:45:45 浏览数 (1)

创作文字并分享 → Twitter 创作图片并分享 → Instagram 创作视频并分享 → Snapchat、快手、抖音 创作音乐并分享 is the Next BIG Thing

3位分别来自腾讯、迅雷、沈阳音乐学院小伙儿:一个抠产品,一个琢磨技术,一个创作音乐。团队叫:时域。

郭靖,数学系,目前负责团队的产品打磨,是这个AI音乐初创产品的创始人。

· 探索期 ·

为寻个人身份认同

春芳:为什么会从之前的公司辞职离开?基于怎样的思考?

郭靖:内因是一个逐渐形成的心理过程。少年感的丧失,不再赤诚了。很多灵感不复存在。

偶尔看到小时候喜欢的动画、电影、音乐、文学,以前总觉得从感知上天然拥有它们,比如来自宫崎骏作品的共鸣是非常底层的,来自于童年的源代码,那时候却感觉这种拥有逐渐在变成旁观,美的东西在离你远去,美反而会让你喘不过气来。这其实是没有找到自己热爱的事,没有由此获得一种天然的身份认同感,没这种身份认同的人会变成空心人。

外因是世界上每天在发生全新的事情,新的科技、浪潮、思想每天在涌现。我当时有一种作为互联网从业者自发的优越感,有时候看到老家一些以前的朋友,还在为传统的营生奔波。我觉得那样很悲哀,整个世界整个时代最伟大的浪潮最神奇的变化都与你无关。某天我突然反思,也许几十年后互联网就是传统行业了,新的浪潮是什么,它发生的时候会不会与我无关?如果是,就太可怕了。

再加上一直以来我小舅都是我的人生导师。从我成年以来对我价值观和思考方式的塑造起到很大影响。那段时间,我经常找他聊天,我俩都是学理工的,他跟我聊正态分布,说你看那些分布中的outlier,都是在3个sigma之外的,人的选择也是,如果想成为outlier,不可能依靠一个平庸的选择做到。他鼓励我去探索。

春芳:辞职之后去做了什么?

郭靖:2015年辞职,刚开始的想法很简单,就是想去优秀创业者聚集的地方跟优秀的人聊天、请教,用假装面试、知乎勾搭、跑会场、直接敲门等各种方式,跟很多优秀的科技创业者聊天请教。同时看书、在线学习...

2015年12月,从小舅那边了解到硅谷有个创业学校叫Draper University(是特斯拉投资人Tim Draper创立的,3个月周期,聚集18-28岁有想法的年轻人到硅谷,让硅谷的成功创业者和投资人给他们上课)。我觉得这刚好是我当时特别需要的,能近距离跟全世界最优秀的科技创业者们交流,比在北京更好。于是我就申请了。

2016年底回国开始第一次创业ChatBot,到2018年中基本宣告失败。

2018年8月,开始做AI作曲这个项目。

· 创业时 ·

不懂乐理,也要创作音乐

春芳:为什么会想到做AI音乐?因什么而起呢?

郭靖:来自于对上次创业(ChatBot)失败的反思。

首先在技术突破对创业时机的选择上:上次创业是做Chatbot在汽车行业的应用。一年多的时间当中,我们逐渐发现所谓的AI技术突破,并不是像直观理解的那样,跟人工智能有关的所有事情都齐头并进的突破。比如人们可能会认为AI围棋都能赢世界冠军了,那对话自然也没问题,为什么连那么简单的任务式对话系统用起来都跟智障一样呢?

其实这一波的AI技术突破实际是深度学习技术加大规模计算力的突破,带来的模式识别能力的突破,所有人类大脑感知层可以识别的模式,用这套技术也许都会有大的效率上的颠覆。比如人脸识别、语音识别等等。

但是逻辑推理、常识计算、知识工程这些跟对话极其相关的领域,其实都没有突破,因此真正有意义的任务式对话系统所需的必备技术都还没有看到苗头,这时候做Chatbot创业timing是不对的。但跟模式识别直接相关的大场景都已经有很多人在做了,比如人脸识别、语音识别、鉴黄等。

模式识别突破间接相关的事情有两类。一类是决策,主要是由于模式识别突破后对状态更好的抽象化,导致很多场景的状态从无穷变得有穷,可以被强化学习,比如下围棋、打游戏、自动驾驶;还有一类是内容生产,生成模型可以看做是模式识别的反向,就是对数据中模式的模仿。这和模式识别是一脉相承的。这两类事情都应该是产品化最有机会的。

另外我对通过技术手段降低内容生产的门槛,从而让普通人通过内容表达自我,并形成分享和社交的UGC大逻辑在审美上天然的认同。我认为人的能力会再次从多元走向一元,当很多简单或复杂但标准化、程式化的事情被AI取代,人的核心价值就变成了创造能力以及对人类本身的共情能力,只有这些目前看来是不可替代的。

当复杂问题被封装,通过简单的接口对接,人的价值会逐渐”去工具化“,而回归最原本的灵感、创造力、同情能力。我相信拥有创作灵感和艺术冲动的人数远比拥有创作能力的人要多,但为什么大部分人的创作能力没有涌现出来,有很大的原因来自”工具门槛“,比如一个人有很好的审美,灵感,创意,但是不会用笔,或者不会用PS,所以无法产出美丽的画作。

我认为”工具门槛“会越来越低,”君子不器“,人不应该因为自己是专业的工具使用者而有价值,工具帮助人疏导出 ”创造力“ 这一核心价值。因此我们做的事情是想要极大的降低 ”音乐创作“ 这件事的工具门槛,让有灵感有想法的普通人也可以将创作冲动变成完整作品。

UGC=降低创作门槛--赋能普通人--形成分享社交,这个大逻辑通常能催生伟大产品,比如twitter(文字),instagram(图片),快手/抖音(视频),真正的音乐UGC还不存在。

最后,我认为音乐是一种很纯粹的数据形式,所有一切情感全部承载在抽象的数据格式当中,《GEB》这本书讲到巴赫音乐当中的递归与多层级自相似的奇妙形式。音乐跟数学有天然的联系,我也是个音乐爱好者,搞过乐队,写过歌。团队目前有两个很优秀的音乐人。

春芳:在团队里,你的角色是……?

郭靖:我首要是负责找到优秀并相信同样愿景的人,组建团队;然后是定义问题、设定阶段目标及里程碑;核心能力是把技术产品化,找到应用场景。

▌iBrandUp:

2018年8月成立的时域三人小团队,距离当前,也才不到五个月,而他们今年内给自己设定的目标是完成A轮。

据郭靖透露,他们天使轮投资股东是:前百度的首席科学家张栋、晨兴资本、彩云科技、快手。其中,晨兴资本是国内最顶尖的美元基金之一;彩云科技帮助他们进行AI一线研发;快手是UGC社交的顶级产品;张栋是AI领域的顶级专家。所获资源都称得上是当前投资界和AI领域的 “红人” 们。

目前存在的最大困难可能就在于:既懂AI,又懂生成模型,还要懂音乐的群体目前还太小众。当然主要因为当前还不是AI的主流应用场景,大批量标准化的人才还未及形成。那些有跨界之勇,又有灵性的人呐,欢迎来撩!

无论如何,借用郭靖的话来说:他们基本凑到了一波最合适的投资人,剩下就看他们自己的了。

0 人点赞