当人工智能的机器人开始学会炒股票,你是学金融还是学IT?

大家好,欢迎关注首席投资官,我是首席君。最近被布置了两个作业,一篇题目是涨财商,一篇题目是中国科技被低估了吗?这两篇作业本来风马牛不相及,而且作为一个财经UP主,显然第一篇更适合我。但是刚好,我所熟悉的领域,还真的能把这两篇作业一起交了,这个领域就是:人工智能与投资。这是一个杂糅了大数据技术、人工智能技术在投资领域的应用。

2016年3月,阿尔法狗与围棋世界冠军、李世石进行进行了一场人机大战,并且以4比1的总比分获胜;随后又以3:0战胜了世界冠军柯洁大魔王,深度学习技术一鸣惊人!世界惊呼:人工智能时代来了!当吃瓜群众们在为科技狂欢的时候,资本市场上的金融大鳄们已经在开始,尝试利用人工智能实现研究、分析、风控和投资了。

当人工智能的机器人开始学会炒股票,你是学金融还是学IT?

2008年金融危机过后,美国传统金融机构还在忙于应对公众巨大的信任危机和严苛的监管政策之际,以Betterment和Wealthfront为代表的“智能投顾”创业公司成长起来,它们通过互联网信息技术手段,降低投资门槛,为用户提供个性化、低费率、透明化、便捷化的财富管理服务,成为行业一股清流。智能投顾利用大数据分析、量化模型及智能算法,根据投资者个人收益和风险偏好,提供相匹配的资产组合建议,并完成投资交易过程,再根据市场变化动态调整,让组合始终处于最优状态的财富管理服务。这种业务在国内有一个时髦的名字,我们称之为智能投顾。

2013年:Kensho公司基于云计算在硬盘上设置了9万个变量,包括企业业绩、经济指标、政策变化、风险参数等,容纳了6500万个计算机语言,通过大数据分析和机器学习,自动探知最新新闻,把金融分析师平均耗时40小时完成的报告在几分钟内自动完成,并提出综合性解决方案。

当人工智能的机器人开始学会炒股票,你是学金融还是学IT?

2016年:美国智能投顾,资管规模从256万到882亿美元不等,总规模已经近1218亿美元,“智能投顾管理的资产规模从2010年以来复合增长率超过80%”。 根据My Private Banking预测,未来几年智能投顾行业将保持高速增长态势,预计2020年全行业资产管理规模将达1.6万亿美元。

国内数字化投顾产品主要爆发于2014-2015年。智能投顾所需数据包括信用数据、金融数据、用户支付行为数据等。截至2016年6月,中国已使用网络理财用户达1.05亿,据BCG预测,2020年中国资管规模约174万亿,按3%的渗透率计算(参考美国),2020年中国智能投顾管理资产规模或超5万亿,按平均0.2%管理费水平计算,收入规模超过104亿。很多IT出身的技术工程师,尽管对于金融投资完全外行,但是依靠爬虫抓取交易端口,通过高频交易,在短时间内快速的将收益固定下来,也实现了造富神话。

过去,我们在华尔街的交易大厅里看到的是熙熙攘攘的交易员,和不停变换数字的电子屏,而现在,空空荡荡,什么也没有了。因为在资本的眼里,交易员这东西本身就是个BUG,他们干的活儿从某种角度上说,和工地上搬砖的民工没有什么区别,工人是把砖搬来搬去,而交易员是把资金从账户里划来划去。但是养活一个交易员要花的钱可以养活几十个搬砖的工人,这就让华尔街的资本家十分的恼火!干的活差不多,凭什么我花的钱要比包工头花的多几十倍?投入产出比被严重拉低了!所以通过大数据技术和人工智能技术来取代交易员的计划被提上了日程。要说人工智能,在前沿科学中绝对算得上是一门时髦的科学,唯一遗憾的是,无数科学家搞了几十年,所谓的人工智能一直维持在人工智障的水平,直到深度学习技术的出现,改变了这一切。

什么叫深度学习?这东西要是展开了说可以写出好几本书,但是简单来说,就是工程师模仿人脑的“神经网络“建立一个类似的学习策略,也取名为”神经网络“。过去的人工智能,只有输入和输出两层,所以输入问题之后得到的答案通常令人啼笑皆非,但是深度学习技术提供了更多的逻辑层,AI的逻辑层越多,所思考问题的深度就越深,得出的答案也就越靠谱,目前的技术已经可以做到500个逻辑层。说到这里,一定就会有小伙伴眼前一亮!是不是说只要增加更多的逻辑层,拥有高度智慧的人工智能程序被开发出来只是一个时间问题呢?很遗憾,并不是。因为科学家们发现,200个逻辑层之后,效果就会开始衰减,实验表明,500个逻辑层的AI,并没有比300个逻辑层的AI更聪明。但是这已经是人工智能里领域里的一大进步了,至开发出来了。所以既然可以下围棋,当然也可以管账户,华尔街的资本家比工地上的包工头有钱的多,所以那些倒霉的交易员就这样失业了。

当然,这种机器吃人的过程比较血腥残忍、少儿不宜,所以我们来讲点欢乐的。做过券商投研的小伙伴们可能都被投研报告毒打过。这是一项极为不人道的行规,一入投研深似海,一年365天,甭管什么日子,每天得交一篇投研报告,美其名曰:“投研规范化训练”。你可以假想一下,周末和女朋友逛街约会看电影的时候,心里还得惦记着,今天的作文还没写。多闹心?但是自从有了智能投顾之后,一切都开始变得与众不同。对于机器人来讲,投研报告这种范式感极强的作文,别说一天一篇,一天一万篇都不是问啊!于是AI在投资银行和卖方研究中,自动生成报告。研究员只需选择符合其需求的模板确定主题与关键信息,以及报告呈现形式,便可生成基本内容。而且投行分析师可以进行校对与人工二次编辑,加入有价值的观点与结论,实现科学偷懒。

量化交易从很早开始就运用机器进行辅助工作,分析师通过编写简单函数,设计一些指标,观察数据分布,而这些仅仅把机器当做一个运算器来使用。

直到近些年机器学习的崛起,数据可以快速海量地进行分析、拟合、预测,人们逐渐把人工智能与量化交易联系得愈发紧密,甚至可以说人工智能的3个子领域:机器学习、自然语言处理、知识图谱,贯穿量化交易的始终。

量化交易分析师们对财务、交易数据进行建模,分析其中显著特征,利用回归分析等传统机器学习算法预测交易策略。这种方式有两个主要弊端,其一是数据不够丰富,仅限于交易数据,更重要的是它受限于特征的选取与组合(Feature Engineering),模型的好坏取决于分析员对数据的敏感程度。此外一种做法是,模仿专家的行为,选择某一领域的特定专家,复制他们的决策过程,并导入可重复的计算框架。

全球最大的对冲基金桥水联合(Bridgewater Asspcoates)早在2013年就开启一个新的人工智能团队,该团队约有六名员工,由曾经供职IBM并开发了认知计算系统Watson的David Ferrucci领导。据彭博新闻社报道,该团队将设计交易算法,通过历史数据和统计概率预测未来。该程序将随着市场变化而变化,不断适应新的信息,而不是遵循静态指令。而桥水基金的创始人也曾公开表示,其旗下基金持有大量多仓和空仓,投资120种市场,持仓组合高达100多种,并且以人工智能的方式考虑投资组合。

当量化交易分析师发现数字推测模型的局限性后,开始考虑引入新闻,政策,社交网络中的丰富文本并运用自然语言处理技术分析,将非结构化数据结构化处理,并从中探寻影响市场变动的线索。率先使用自然语言处理技术的人工智能对冲基金的是今年6月份在伦敦新设的对冲基金CommEq。CommEq的投资方法结合了定量模型与自然语言处理(NLP),使计算机能够如人类一样通过推断和逻辑演绎理解不完整和非结构化的信息。除此之外,也有采用自然语言处理技术的金融科技公司,如由李嘉诚与塔塔通讯投资的Sentient Technologies运用自然语言处理,深度学习(Deep Learning)等多种AI技术,进行量化交易模型的建立。

其中最为知名的是号称”取代投行分析师“的投资机器人——Kensho。Kensho是一家致力于量化投资大众化的人工智能公司,旗下有一款产品Warren被称之为金融投资领域的“问答助手Siri”。Kensho结合自然语言搜索,图形化用户界面和云计算,将发生事件关联金融市场,提供研究辅助,智能回答复杂金融投资问题,从而加速交易时间,减少成本,用动态数据与实时信息,及时反映市场动态。这一技术也被广泛运用于风控与征信。通过爬取个人及企业在其主页、社交媒体等地方的数据,一来可以判断企业或其产品在社会中的影响力,比如观测App下载量,微博中提及产品的次数,在知乎上对其产品的评价;此外将数据结构化后,也可推测投资的风险点。这方面国内的很多互联网贷款,征信公司都在大量使用自然语言处理技术,例如宜信,闪银等。另外一些公司则利用这些技术进行B端潜在客户的搜寻,如Everstring,并将信息出售给其上游公司。

不过,老外这些看起来非常高大上的技术,在国内并没有掀起什么浪花,究其原因,还是因为国内的人工智能技术发展的太快,自然语言处理在老外那里刚刚起步,在国内就被深度学习给弯道超了车。你们以为,听语音自动上字幕的语音识别技术是自然语言处理吗?根本不是,深度学习算法更加简单粗暴的用声纹算法,就直接得出了想要的结果。国内的科大讯飞,和字节跳动,都是这个领域的引领者。尤其是字节跳动,其内容识别与分发的核心算法,连美国人都眼红。

机器学习与自然语言处理的技术经常会在一些意外(如“黑天鹅”事件)发生的时候预测失败,例如911、熔断机制和卖空禁令等等。人工智能系统没有遇到过这些情况,无法从历史数据中学习到相关模式。这时候如果让人工智能管理资产,就会有很大的风险。此外,机器学习擅长发现数据间的相关性而非因果性。很有名的一个例子是早在1990年,对冲基金First Quadrant发现孟加拉国生产的黄油,加上美国生产的奶酪以及孟加拉国羊的数量与标准普尔500指数自1983年开始的10年时间内均具有99%以上的统计相关性,1993年之后,这种关系莫名其妙的消失了。这就是由于自学习的机器无法区分虚假的相关性所导致的,这时候就需要专家设置的知识库(规则)来避免这种虚假相关性的发生。

当人工智能的机器人开始学会炒股票,你是学金融还是学IT?

知识图谱本质上是语义网络,是一种基于图的数据结构,根据专家设计的规则与不同种类的实体连接所组成的关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。就金融领域来说,规则可以是专家对行业的理解,投资的逻辑,风控的把握,关系可以是企业的上下游、合作、竞争对手、子母公司、投资、对标等关系,可以是高管与企业间的任职等关系,也可以是行业间的逻辑关系,实体则是投资机构、投资人、企业等等,把他们知识图谱表示出来,从而进行更深入的知识推理。目前知识图谱在金融中的应用大多在于风控征信,基于大数据的风控需要把不同来源的数据(结构化,非结构)整合到一起,它可以检测数据当中的不一致性,举例来说,借款人张三和借款人李四填写的是同一个公司电话,但张三填写的公司和李四填写的公司完全不一样,这就成了一个风险点,需要审核人员格外的注意。

而以投资关系为例,知识图谱可以将整个股权沿革串起来。我们用康得新财务造假事件举例:康得新是一家上市公司,每年都会有专业的会计师事务所为其出具无保留意见财务报告的。财报报告没问题,而康得新出了问题,那答案就只有一个,签字的会计师参与造假了。所以作为投资者第一个反应就是,这个会计师、以及会计师事务所还出了那些财务报告?是不是也是假的?我手里有没有这些公司的股票?要不要抛掉?而要回答这一串问题,只需要一个知识图谱!

金融搜索引擎的背后核心技术是高质量的知识图谱和大量的业务规则,帮助实现联想、属性查找、短程关系发现。探索引擎,如分面浏览器,也是在知识图谱的基础上,则提供了人机协作的界面,让人对数据的探索过程可以很方便地被记录、迭代、重用。

此外推荐系统也非常有用,帮助金融用户聚焦在关键数据上,更省时省力地做投前发现和投后跟踪。其中语义搜索就是提供不同类型的查询(比如企业、基金、事件等),如智利地震对铜期货的影响,中东危机对整体货币市场的影响等。再将信息切片后再聚合,提供纵览的可视化元素,比如影视传媒相关定增的平均市值和融资市盈率。语义搜索将复杂查询交给用户完成,如寻找VR的上游企业,当搜索提供不了准确上游的信息时,会推荐摄像头的企业给用户,并提供一个方便的交互界面,交给用户去进行一些复杂的过滤。

传统投资顾问需要站在投资者的角度,帮助投资者进行符合其风险偏好特征、适应某一特定时期市场表现的投资组合管理。而这些工作都需要以大量昂贵的人工方式完成,所以财富管理服务也因此无形的提高了进入门槛,只面向高净值人士开设。

但是智能投资顾问(robot advisor)正在以最少人工干涉的方式进行投资组合管理,管理你的资产的可以是一排计算机,而你也不用是高净值人士。并且智能投顾在以更强大的计算机模型运用人工智能的技术对大量客户进行财富画像,以人工智能算法为每一位客户提供量身定制的资产管理投资方案。

当前中国,智能投顾所需数据包括信用数据、金融数据、用户支付行为数据等。截至2016年6月,中国已使用网络理财用户达1.05亿,据BCG预测,2020年中国资管规模约174万亿,按3%的渗透率计算(参考美国),2020年中国智能投顾管理资产规模或超5万亿,按平均0.2%管理费水平计算,收入规模超过104亿。

在中国市场,据PINTEC集团整理数据显示,2017年,中国智能投顾管理资产超过288亿元,预计到2022年国内智能投顾管理资产将超过4万亿人民币,覆盖人群达1.03亿,且2017年底中国互联网理财用户达3.84亿,有理财需求的人数在稳步上升。

当多数人又无法满足“高大上”的财富管理机构的标准时,智能投顾则可以根据客户的需求、风险偏好,生成“量身定制的”资产组合,因此国内智能投顾市场正在进入高速发展阶段。比如说我们常用的余额宝,就是智能投顾资管的典型产品。

综合来说,智能数据分析模式有望率先迎来爆发,长期看好Bobo-Advisor,本土化探索仍将继续,传统投顾将面临智能投顾的挑战,需转型升级。

最后,重点唠叨一下我们与美国的科技竞争。自2010年以来,中国制造业的规模就超过了美国位居全球第一,这将美国的产业逼入了死角,所以在未来,信息、数据、人工智能等领域将会是中美竞争的主要赛道之一。在天阅君四期产业链系列的视频中,我们看到,中国制造仍然有很多高投入、高消耗、高排放的传统产业,但是以工业机器人为代表的智能化生产,正在中国悄然开始普及,时至今日,甚至针对于特殊需求的定制型机器人,也已经开始实现了国产替代,中国智造的概念已经被列入目标。更快、更好、更智能,是我们这一代科技人员追逐的目标。新一代信息技术,被列为中国制造2025中的第一大课题。制造业是国民经济的主体,是立国之本、兴国之器、强国之基。而科技,则是我们制造业由大转强催化剂。大力发展本国科技,曾经只是个构想,并没有达成共识。很多学者持怀疑态度,根据凯恩斯国际分工的理论,他们一直有“不要重复造轮子”的想法,反对中国搞“大而全”,认为中国这么做不符合经济学规律。

但经过川普一顿闹,中国人突然明白了,制造业对于国家很重要,而科技对于制造业更重要。共识就这么出来了。打造具有国际竞争力的制造业,是我国提升综合国 力、保障国家安全、建设世界强国的必由之路。而领先的科学技术,则是打造强大制造业的基石!

分享:

评论