文/CSDN焦燕
整理/AI科技大本营(rgznai100)
7 月 22 - 23 日,在中国科学技术协会、中国科学院的指导下,由中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办,CSDN、中国科学院自动化研究所承办的 2017 中国人工智能大会(CCAI 2017)在杭州国际会议中心盛大召开。
CSDN现场消息,22日下午的“智能金融论坛”圆桌会议精彩纷呈。此次会议由蚂蚁金服人工智能部技术总监李小龙主持,上海交通大学计算机系教授邓小铁、中国香港智能金融科技有限公司(FDT-AI)联合创始人兼CEO柳崎峰、乔治亚理工学院金融学教授Alton M. Costley主席Sudheer Chava、普林斯顿大学运筹与金融工程系助理教授王梦迪、中国香港中文大学计算机系副教授张胜誉等专家参与讨论。
此次圆桌会议分为两个环节,首先是主持人和嘉宾的问答环节,然后是观众自由问答环节。
主持人李小龙表示,随着大数据和人工智能的迅猛发展,金融领域的智能化逐渐得到学术界和工业界的高度重视,并且取得了一系列重要进展,成为金融科技(FinTech)领域的重头戏。智能金融重点要解决的问题包括:
- 如何运用大数据、云计算和人工智能来降低金融成本,提高支付、投资、贷款、理财、保险、事件分析、客服等各个方面的自动化和智能化水平,从而提高金融效率并普惠更多的人群;
- 如何采用大规模机器学习和海量数据结合,利用深度学习、增强学习、图计算、知识图谱等前沿方法,有效识别风险,提升金融风控能力;
- 如何应用博弈论进行金融市场机制和定价设计,在公平合理的基础上激发市场活力等等。
几位嘉宾就以下几个话题进行了探讨:
- 在人工智能领域的应用方面,中美之间的区别;
- 用增强学习在网上进行量化交易时对交易系统造成的影响;
- AI在保险方面应用的问题;
- 在金融领域,基于大数据的分析方法与传统的经济学分析方法的不同;
- AI是否能够预测股灾;
- 在金融领域,未来AI的应用能够达到一个怎样的程度。
以下为此次圆桌对话内容实录,CSDN在不改变原意的基础上进行了整理。
主持人、嘉宾问答环节
李小龙:我想问一下Chava教授,在基于大数据分析或者AI在金融领域的应用方面,您认为美国和中国有什么区别?
SudheerChava:根据我的观察,从历史上来说,在美国银行和监管都比较强,中国可能相对比较弱。从目前的金融科技来看,与美国相比,中国已经实现了超越。
李小龙:王梦迪老师讲将机器学习用于高频交易,柳崎峰老师做教育的软件。我的问题是,如果有一天所有的人都用增强学习进行网络上的量化交易时,这个系统会发生什么问题,是否系统会面临很大的挑战?
王梦迪:这个问题还是邓老师的范畴,是多个玩家的博弈系统。当每个玩家都用在线调整的方式调整自己的策略,是否会收敛到它的纳什均衡,这是一个博弈论范畴的问题。
从学术来讲,其实有非常漂亮的理论收敛性证明。在某些情况下,确实能够保持稳定性。
但是实际操作中,因为有的玩家或者是交易员他们可能会提前得到信息,有的个体或者是散户得到的信息比较少。我们可以想像,这个系统可能永远都不会达到我们想像中非常公平的均衡,而是提前获取信息的那一方会更容易得利。即使大家用的是同样的算法,这时公平性的瓶颈就在于谁能先拿到信息。
从整个网络的复杂性来讲,有的玩家跑得快,有的跑得慢。但是整体上如果能够保证好信息的流入和流出,还是可以在一定范围内保持稳定性和均衡性的。
李小龙:待会儿再请邓老师讲讲,因为这也是他的专业。我们先请柳老师谈谈您的观点,如果您的教育软件让所有的交易员或者是学生用上,他们都依赖于这个交易的工具去炒股和投资,最后会不会有一些稳定性的问题?或者说白了,这个钱到底最后谁来赚?
柳崎峰:
- 如果只从我们公司的角度看问题,很简单,谁先做谁就赚钱。
- 从全社会的角度看,确实会出现这样的情况。但是也不用太担心,为什么?因为市场是无法假设的,也就是说,你所用增强学习探索的随机空间和增强的一些策略,在市场中是一个很小的因素。
比如说中国的股市是一个政策市,即使全市场的人都在做一件事情,如果早上十点钟发一个文,整个市场就被扰乱了。纳什均衡在哪里呢?那是另一个层次上的纳什均衡了。
邓小铁:其实前面两位老师说得对,确实最后起作用的是信息。知道的信息越早,越能够最快地选择最优秀的策略。
关于这个具体的问题,我曾经考虑用过Tracking的策略,Tracking在机器学习里是一个很好的方法论。它在得到最优和收敛的速度加快这两方面有特别突出的效果。
我们当时就是问了同样一个问题,如果大家都收敛,都用同样的方法会怎样?tracking Model有一个很好的特点,即它把整个市场作为一个对手,它的策略就是整个市场的平均值。
大家的策略都一样的话,每个人面对的平均值都是一样的。在这个环境下,达到最优。照这样的分析,大家的近似值都差不多。这在经济上是一个平等的世界。
张胜誉:中国可能用算法交易的不到30%,还是以散户为主。现在美国大部分是算法比算法,机器比机器。当然,高频和中低频不太一样,高频可能跟信息流动速度非常相关。
我觉得,大家用增强学习的时候,虽然用法、门派都一样,但功力可能还是有不同。所以最终一定是有人赚钱,有人赔钱的。
再一个,策略的选取可能还与资金的体量相关。所以我觉得到一定的水平之后自然就达到了平衡。但是在中国可能是不一样的,包括政策和一些突发的情况等。
李小龙:下一个问题还是问张老师,因为他在AI加保险场景上的应用有很多的经验。我们蚂蚁把AI和保险做了很好的场景化的结合,像图像定损,像车险分的精准定价,还有智能理赔。您是否认为在预期的时间内,AI可以在保险方面能够起到一个颠覆性的作用?
张胜誉:我觉得不管是不是有颠覆性,但肯定会在相对短的时间内有很大的改变。
因为据我了解,目前很多的保险公司,尤其是在国外,要到客户的数据是比较简单的。比如说在中国香港买一般的保险,它只要性别、年龄、是不是吸烟。可以想见,这跟个体化的差异根本没有用。
我想,这方面有巨大的空间。据我所知,中国现在大的保险公司已经非常认真地在做一些很大的突破性的变化。所以从这个角度来说,我觉得他们在很努力地从医疗、健康、财产等各个方面整合数据,希望用这些数据从以前的以模型为主转换成以数据为主的方式,大刀阔斧地往前走。
Sudheer Chava:AI会冲击保险。
举个例子,如果把IOT的物联网数据拿下来的话,比如一些开车的方式、房间里的温度等,对保险公司的定价和理赔都会非常有帮助。所以我觉得AI在大数据结构下一定会改变保险这个产业。
李小龙:基于大数据的金融分析,与传统的金融学的分析方法有什么大的区别吗?
Sudheer Chava:总的来说,虽然数据量变得很大,但是我感兴趣的是从结构里面找到原因。所以,虽然方法上有一些变化,但是其本质应该还是一样的。
柳崎峰:我的体会是人工智能、大数据的方法是基于数据的,传统的经济学是基于模型的。
基于数据的意思是我有一些数据,然后从这些数据里面去推断一个函数,接着在一个测试集上去测试这个函数的拟合度,这是机器学习的一个过程。
这个最大的挑战是金融机构不接受这样一个过程。因为训练出的模型是个黑盒子,不可解释。即使是一个线性的模型,features scale如果不一样的话,那么weight大小就没有什么意义。非线性的模型和深度学习就更加不可解释。这是现在人工智能大数据在金融里面应用的一个非常大的障碍。
这里面的一个观点实际上是需要更正的,真正的智慧体一定是黑盒子,就像我们每个人的大脑就都是黑盒子。但是如果算法是一个黑盒子,它就是不可原谅的,这是需要突破的。
传统的经济学办法是基于模型的,但是这个模型不是机器学习的模型,是基于大脑想像出来的模型。它分析的是一个原理,推完原理之后,就是揭示运行规律。当有足够的话语权,大家都认为规律成立的时候,后续产生的数据慢慢地就会适应这个模型,这是我对传统分析方法的一个理解。
我曾经和一位研究经济学的老师交流,他是做高频交易的。我问他高频交易的方法赚钱还是不赚钱,他说不知道。我说你不知道,那在研究什么呢?他说他的目的是为了揭示高频交易的运行规律。这是完全不同的两个角度,而我们就是比较功利,光想着赚钱。我觉得这两个互补,是一件很有意思的事情。谢谢。
邓小铁:我想起了我刚做报告的时候,实际上发现了经济学的一个弱点。
贝叶斯模型下贝叶斯的假设是已知的,我们并没有问他是怎么知道的。而实际上我们今天偏偏就在问他是怎么知道的。
我们是通过数据来发现他的理论规律的,或者非常极端地说我们不需要理论规律,我们只需要机器构造一个模型出来,我们不知道这个模型是什么样的,但是在一些情况之下,它是能够成立的。
但是实际上抛开这个极端的情况,机器学习是有其逻辑在里面的。它的逻辑虽然不是非常精确,但是是有一定的相关性。
我们不知道数据就去学习,通过学习我们得到分布。虽然是假的,但是我们还用它。用了以后,得出来的结论是机器学习能够基本达到最优。但是买家用最大的努力去博弈的话能够得到2倍的盈利。
所以,在严格的分析下,可以得出很精确的结果。在其他的情况下,可能分布不一样,可能得出来的机制稍微不同。
机器学习可以证明它的收敛性和稳定性,能够描绘出一个基本的框架,实际运行中也比我们以前用的经济学的方法要好。
总之,经济学有很大一部分,需要用深度学习的方案来替代和优化,同时人工智能将会对将来的经济学有一个革命性、颠覆性的改造。
李小龙:我们能否用AI预测股灾,能否告诉我们下一个股灾是什么时候发生?
张胜誉:人类历史上到现在,股灾也没有那么多次。如果有人告诉你AI能预测股灾,那么你得看它是真正预测正确了一次相信呢,还是三次预测对了两次你相信,这里有个算法评估的问题。
所以AI到底能不能预测大的股灾?好像在这方面的经济学上,经常看到的文章是,它对过去的事情可以进行很好地预测,对于未来的事情就不一定了。
王梦迪:机器学习的假设是之前的数据能够一定程度上对未来有一定的拓展意义。在这种情况下,如果系统是稳态的话,就能够预测未来。
股灾完全是另外一件事情,但是并不代表完全不能预测。其实有一些机器学习以外的数学或科学的方法能够对预测股灾起到一定的帮助。
股灾是什么?是可能突然之间30%、50%甚至是80%的人觉得熊市要来了,大家同时想卖出,这时候就发生股灾了。
这其实是复杂网络上面的一个相变问题,并不严格属于机器学习的范畴,但也可以运用机器学习的方法进行预测。即我们怎样对信息的传播进行建模?
类似的例子是现在我们的数据技术已经可以很好的预测什么情况下一个传染病会大规模爆发,这本身是物理上的一个相变的概念。
或者从另外的一个角度来说,有两个种群竞争,我可以非常好地预测到底哪个种群一定会胜出,这用的也是基于大规模网络和由很多小个体组成的群体进行的一个相变的预测。
在物理上,什么是相变呢?这些分子,它们之间的作用,怎么一下子从水变成了冰?甚至是从冰直接汽化?这些都是复杂网络的相变。这种相变其实是可以科学建模和预测的,并且曾经有人用物理系统的相变解释过曾经的几次大的股灾。
所以我认为从科学和技术的角度来讲,股灾并不是完全没办法预测和解决的,但是不仅仅局限于机器学习的方法。
柳崎峰:我补充一些信息。
股灾就是一个数据样本不足的问题,解决这一问题最好的办法是选择粒度。在顶层回答不了股灾发不发生的问题,但是你要看很多的信息,比如群体,个体的运动规律,社会的基本面,方方面面的细粒的信息拿进来,有了丰富的数据量后,很多你不能做的事情就能做了。
如果仅用价格预测大幅度下跌的价格的走势,怎么能预测得准呢,因为都没有回测数据。
我举一个很相关的例子。我们知道期权定价公式是Myron Scholes教授提出来的,他关注的是长尾、左尾和右尾。
我们在管理资产的时候,都想在大跌的时候少跌点,赚钱的时候尽可能多赚点,然后其他时候稀里糊涂就可以了。那问题就来了,我们优化的目标是什么?是左尾和右尾。但是问题在于尾部没有什么数据,根本就没有统计意义,然后怎样克服这个问题呢?因为它有2000多支的期权的价格走势去推断现货、股票的左尾和右尾,虽然有一些差别,但也丰富了一些信息。
我讲这个其实是要借鉴Scholes教授的思路,当无法搞定数据稀缺的时候,可以从别的地方想办法搞一搞,从而丰富数据。要么是在垂直方向把粒度打得非常细,增加数据,要么水平方向抓数据。这样数据多了,整个机器学习的事情才能往下做进去。我相信数据多了能做出好的结果,对于股灾的预测我还是抱有乐观的态度。
Sudheer Chava:股灾属于小概率事件,严格来说确实非常难预测。但如果数据的颗粒度可以足够细的话,结合AI的模型,股灾是有可能被预测出来的。
邓小铁:股灾真的太难预测了。
有机器学习的话,我觉得它能加强我们思想的能力,比如经济学里面也有许多这样的理论。以前我们只是对非常具体的、非常特殊的理论下面建立这套理论。动态系统的话,我们也有很多动态系统的理论,什么时候会收敛,什么时候会发散,什么时候是完全不稳定的。
过去我们只有理论的分析,有了机器学习的框架之后,我们可以构造出各种可能的人机交互框架,从而使机器来帮助人类。
这里有一个与股灾相类似的例子,就是在Alpha Go的故事里面,李世石下了一手奇怪的棋后,它就崩溃了。股灾可能与这个有点类似,机器学习能帮助我们更快地发现股灾。李世石和很多人下,也给很多人造成了“灾”。
我想,机器学习的方案对我们发现股灾、修正股灾会有更大的帮助。
柳崎峰:我补充一点,一个是预测准不准确,还有一个是能不能执行。
我举个例子。比如说,你预测到股票市场不好了,但是你执行不了,因为股灾的时候你卖不出去,千股跌停。那么在做量化的时候,很多人就将股灾的数据去掉了,说这是小概率的事件的数据,就不要测了,这样的话曲线就特别好。但是如果加上的话利润就全被吃掉了,经常是这样的。
所以,能不能执行这是一个很重要的问题。但是执行靠什么?靠交易系统的整个机制,比如说你可以对冲,或者是统计一些相关性的套利等。
总之就是预测准确是一回事,能不能执行又是另一回事。
李小龙:我们知道,现在智能金融如火如荼,各大公司都在投入很大的力量。希望各位老师能否预测一下,假设我们智能金融做到一定的程度,我们可以让机器来投资,理财,购买保险,贷款。最终,我们是把金融全部交给机器来控制,还是说我们能够达到某种程度上的平衡?因为我们有各种各样的因素,比如说监管。
邓小铁:我会希望机器帮我做这件事情。
作为一个科学家,我希望能有一个机器学习的大脑帮我做投资。因为许多事情机器已经在做了,人类和它比的话,很多事情要想得深一步。因为深度学习,它深到那么多层之后能够想的东西已经比我们能想的多很多了。
李小龙:这样的话,可能就会有一个矛盾。一方面人们希望机器能为自己做得越来越多,但深度学习本身是不可解释的,想总结出什么规律的时候可能比较困难。还有像邓老师刚才说的Alpha Go突然崩溃了,那么我们在大力推广AI在金融领域应用的时候,怎样预防AI可能面临的问题和缺点呢?
张胜誉:我觉得可能有一个过程。机器学习在越来越多的方面走进我们日常的生活,不管是直接还是间接的影响。
比如数据多样性以后,在征信的时候会带来很多便利。我以前从来没有使用过小黄车,但是因为我的芝麻信用的分数够了,第一次它就让我骑,不用交押金。明显它用的是以前的,而且是非常少的数据。对于我个人来说,在支付宝已经有的数据是非常少的,但是它已经可以推断出一些信息。
从这方面可以看到,AI能够通过金融,逐渐地影响我们的生活。
但是另一方面,可能会有一些不是完全技术上的事情。比如说做个性化推荐,帮助一个大型国有银行进行个性化理财产品的推荐,这里还是会有一个监管的问题,你不只是需要跟客户解释,还要跟政策解释。我想如果处理的合理的话,是可以解释的通的。但是可能会是一个缓慢的过程。
邓小铁: 监管是很重要的,由此我联想起来另外一个事情,这跟金融方面是相关联的。在金融上,AI建议做一件事情之后,我们能不能有一个法官,来说这样做好不好,会有什么影响。或者说我们有大的网络后,你该不该做这件事情。
柳崎峰:我觉得人工智能是可以帮助我们做很多事情的。
- 第一点就是硬件,比如说人脑有一千亿的神经元,而我们的GPU和硬件现在还没有到这个量级。当达到这个量级之后,再来看人工智能能帮我们做什么。
- 第二点,从认知的角度,可能要借鉴脑科学。比如人可以举一反三,机器现在还做不到,它的原理到底怎么回事,这些问题突破以后,就可以做很多事情。
- 第三点,对投资来讲,人工智能目前也可以做很多的事情,比如智能投顾。现在中国市场是散户主导,他们迫切需要投资顾问,但目前这个岗位只有300万,而我们需要3000万的投资顾问。所以剩余的就需要智能投顾来服务。同时智能算法在设计的时候需要考虑多样性的因素,这样才会避免产生很大的问题。
我还是相信人工智能能带给我们很多有意思的事情。
王梦迪:我是一个技术乐天派,我非常相信技术的发展会给全社会带来很多我们想不到的好处。
比如从量化交易的角度来讲,原本它只属于少数华尔街的量化对冲基金和少量的明星交易员。但是现在量化交易其实已经进入千家万户了,在包括像支付宝和很多新兴的金融科技公司的帮助下,很多人已经可以直接利用这些交易策略,相当于把每个人跟计算机联系起来,已经变成超人了,形成了很大的公平。
另外像张老师所说的,比如说他可能没有留下过什么交易记录,但是小黄车还能打开。
我觉得我们不用特别惧怕技术,其实越强大的技术,它一定是以一种润物细无声的方法进入我们的生活,在人们意识到它之前,它已经在帮人们做非常多的事情了,我相信这些技术会让我们的生活变得更好。
SudheerChava:AI就像任何技术一样,都有两面性。
- 好的方面,比如说股票交易。AI把很多数据收集起来加以利用。如果有交易的话,可以把数据和历史记录拿过来,这样产生的交易对市场更公平。
- 不好的方面,如果把AI用在借贷市场,有些模型不一定找得到。比如在征信过程中,不同的人群之间,可能因为年龄、性别这方面的数据以前不一等能找得到,但是AI可能会利用这些特征。这样的话,从社会角度来说,对某些年龄、性别的人不一定有好处。
所以在用AI的时候,要想办法减少这方面的偏见,减少对某些人群的一些不利的因素。
李小龙:我总结以下各位嘉宾对这个问题的回答。大部分都是对AI在金融领域持乐观的态度,Sudheer Chava教授提到如果利用不好的话,如果产生偏见的话,就会造成社会的不平等。但总体来说,大家还是持乐观态度的。
观众问答环节:
Q1:自然语言识别的模型和刚才王老师提到的强化学习有什么关系,本质有什么区别?强化学习用到自然语言识别上,是否能够进一步地提高它的精确率?谢谢。
王梦迪:自然语言学习和增强学习本质上是两个非常独立的问题,但是增强学习在与自然语言相关的很多应用上都有非常好的效果。
比如现在很好的一个应用是可以做基于自然语言学习的一个对话框。相当于我可以把自然语言处理的一些语义模型拿过来,用增强学习的方法跟真人产生一段对话,在这里面产生对话的这个动态过程是由增强学习主导的。但是里面用到的在技术上的成分可能需要用到自然语言本身的语义模型。
你刚才问的问题其实是说是我们到底在解一个技术问题的时候需要用到多少先验的专业知识。
我觉得是这样的,一旦说到机器学习,甚至增强学习,很大程度上我们强调的是,这些技术是不基于之前的模型的。比如说我今天讲控制论,控制论需要我把系统用微分方程的形式表达出来,现在不管我们是解围棋,游戏或者自动驾驶,并不需要写微分方程,因为写也写不出来,实在是太大了。
所以说现在的一个已经有突破点的是,我们可以把原来模型解释不了的这部分做好做强,但这并不代表以前积累的模型经验是完全没有用的。我觉得这个问题或许是不破不立的,也许一开始建立认知我们需要模型,一段时间后发现数据觉着不需要模型,但是再过一段时间,我们又可以回去拥抱模型,发现这些都是解释得通的。
这不仅仅是在自然语言学习里面,即使是在其他领域,包括医疗、制药,甚至是在物理方面。在这些科学的领域,现在已经很多的科学家发现可以试图不完全基于模型,而用数据的方法得到一些模型看不到想不出的事情,但之后再怎样发展,我们拭目以待吧。
谢谢。
Q2:我想先问一下邓老师。我是学数学的,“纳什均衡”以前就有了,现在有一个“进化博弈论”的提法,为什么我们还是讲“纳失均衡”呢?
邓小铁:用均衡这个词比较简洁一些,进化博弈论有可能走在一个循环上,或者是走到一个不收敛的动态轨迹上。
Q3:请问一下王教授,您提到有些算法现在基本上可以脱离GPU做CPU,脱离了话,我们的算法在多大数据集上可以做到,泛化能力还是一样的吗,还是会有削弱?另外你们用GPU的话,你们能把GPU的平均应用率用到多少?再一个,比如你搭了一个板子的话,你的CPU和GPU是一个怎样的配比?
王梦迪:关于CPU和GPU的问题,我不是说GPU不好用,如果能用GPU当然是GPU比较快。
我刚才说的是算法的软件,算法层面上提高得非常快。同样的一个游戏,本来要很多核的GPU,但是现在算法提高到一个CPU就可以解决,但是实践中要实现更大的问题的话那肯定是用GPU。
就是这样。谢谢。
Q4:请问一下中国香港中文大学的张教授。您刚才提到的有一个效用,效用就涉及到用哪个指标来度量,因为你用的Feature和其他不一样的话,怎样保证你的是有说服力的?
张胜誉:所谓社会效率,就是把每个人的效用加在一起,用什么样的Feature达到最大化社会效率的其中一个目标。
Q5:请问李老师,因为我在阿里待过,马云老师讲的服务人,为什么您讲的是服务20亿人?
李小龙:因为我们是服务全球,不仅仅是聚焦在中国,包括整个阿里经济体是一个大的战略——全球化。阿里是让全球20亿人在我们平台上进行交易,让天下没有难做的生意。
Q6:我想问一个游戏的问题,刚才王教授说游戏中增强学习训练人工智能。想请问王老师,目前在单agent和多agent的问题上有哪些新的突破和瓶颈呢?
王梦迪:现在多agent没有特别突出的成果。多agent一定是一个很有趣的问题,比如下棋可以下,但是打桥牌呢?怎样定义团队合作。团队合作怎样衡量,现在并没有好的评估标准,这个要回归到博弈论,来评估什么是好的团队合作。然后才能说算法上我们可以把这个实现好。但是现在这不是一个相对有很多的机会可以被发掘的领域。谢谢。
Q7:请问王老师,您现在研究的方向中,目标是什么,比如在游戏中怎样训练人工智能,想达到什么样的目标,解决什么样的问题?
王梦迪:游戏是最简单的例子,相当于一个测试平台。最终我们是想解决实际中包括医疗、金融更大的问题。我自己的目标是想开发出越快越好的算法。
Q8:我在某银行的总部工作,我发现金融市场真正的系统仍然是应用的是古老的系统,还有常规的客户关系管理。我认为唯一有用的人工智能就是数据挖掘。在强人工智能没有得到真正的突破之前,机器学习的用处很有限,我很悲观。我想听听各位老师的意见。
邓小铁:我知道传统的银行系统用了很多年,要替代的话是很难很难的,因为安全的事情,不能够给客户造成损失。这也许是技术金融可以起来的一个机会,只要用的人足够多了以后,可能会有颠覆性的改变。我觉得这对传统的金融系统来讲,是一个很大的威胁。
柳崎峰:很高兴听到不同的声音。有一句话叫:不积跬步无以至千里。做事情一步一步来,在银行系统里面有很多是比较老的传统,但是也有很多事情也是可以做的。如果在银行里面把数据挖掘做好,我觉得数据挖掘已经基本把人工智能、大数据全涵盖了,也是挺让人振奋的。
还有从长远来看,银行未来一定是云服务的,之前的系统都要被替代掉。时间尺度是多少年我不好讲,但是一定是会这样。
王梦迪:没有特别成体系数据这个问题,不光在银行有,银行数据还是相对成体系的。我们在跟医院合作,你会发现医疗的数据更加没有结构,当然这些是有记录的。还有医院和银行之外没有记录的但很重要的数据。所以,我自己觉得,一个技术的发展需要很多其他技术的铺垫,这都需要一点点技术突破来慢慢推动的。
Q9:刚才王梦迪老师讲到很多增强学习在投资之类的应用,但是刚才柳老师又说因为它的不可解释性,会妨碍在金融中的应用。我想问一下,现在在实际情况中,基于增强学习的投资模型,有没有大规模的应用?
另外,机器学习算法是有一定的随机性的,这种随机性会不会影响它在金融领域的进一步应用?
柳崎峰:真实答案我们是不知道的,因为金融是个封闭的行业,如果一个算法work的话是不能告诉你的。
所以我们只能从原理上来看,如果原理、应用场景清楚,你可以去推断它到底是用了还是没用。其实包括传统的软件行业,很多的软件工具在大的投行里面是非常好的,但是我们却不知道。
我个人的理解它是有应用的,包括对冲基金、量化基金。但是从国内来讲,很多机构即使是有,也处于一个初步的探索阶段。
张胜誉:因为市场本身是随机的,所以即使你用一个确定的算法也会产生随机的效果。在量化投资里面最重要的就是想低风险高收益,但是这个是成正比的,需要做一个选择。
增强学习现在大家聊得很多,从历史来看的话,很多在线算法都可以看成是一些特殊的增强学习的方式。一般来说,增强算法已经在量化投资里有很多,不同的公司有不同融入的程度,有的公司完全是用机器交易的,有的是一部分用机器交易的。
Q10:您好,我是在机构做交易的,我们做的量也比较大,我们是中国的几个比较大的做市商。
我想问一下柳教授,在中国做智能投顾有一个很大的问题在于,大部分的资产配置是在非标以及流动性非常差,信息非常不公开的市场。现在我们说的的智能投顾指的是流动性好,散户集中的二级市场以及小的期货或者是股票、基金。
但是实际上大量的资产,比如说现在私募十万亿的规模,其中8万亿是非标的,信托十几万基本是融资性的资产。那么我们怎样做真正意义上的智能投顾?
柳崎峰:先讲怎样匹配,这不单是数据问题,还有用户的行为心理和理财素养的问题。比如零风险、高回报,这是我们FDT在做的事情,在教育用户风险认知意识,怎样教育呢?让他去模拟操盘。这个风险交易是行胜于言的,是一个长期的过程。我们公司虽然是小公司,但是立志参与加速去散户化的过程。
关于非标的问题,银行大部分确实都是非标。我觉得分两步走。
- 第一步就是先做我们能做的事情。先把能做的事情做掉,把公募基金的投资组合给它做掉。股票的投资组合反而更重要。因为有一个奇怪的现象,就是一说投资组合就要基金做,实际上智能投顾可以随便定义,但是核心是吃掉方差。对于一个股民来讲,让智能投顾把他的波动吃掉,形成相对稳健的资金收益曲线,我认为这是对金融风险市场非常重要的一件事情。
- 第二步是对非标的资产,很多它的风险没有权益类那么高,紧迫性没有那么重,但是想分析能不能做到?也能够做到,但是分析的方法不像智能投顾那样做一个二次凸优化的就能解决掉。那么你就要对这个非标数据资产的关联,还有宏观经济的形势,那些非结构化的数据放在一起去做。但是目前国内做得比较少,但是国际上已经有人做这个东西,包括债市,这些也是非常有意义的。但是现在还有很多空白,所以这就是我们人工智能大展拳脚的地方。