@TOC[1] Here's the table of contents:
•一、前言•二、战略性地选择正确的投资人•三、在使用GraphXR前先构建图数据•四、使用GraphXR进行数据可视化•五、结论
基于Neo4j的关联数据评估风险投资人业绩
这篇文章整理翻译自Neo4j专家的分享,主要介绍使用Neo4j、GraphXR和机器学习模型来评估风险投资人业绩,点击链接查看更多精彩内容。Evaluating Investor Performance Using Neo4j, GraphXR and ML[2]
一、前言
在当今的商业环境下,风险投资已经成为创业公司越来越受欢迎和必要的融资来源。那些无法获得银行贷款或债务融资等其他常见资金来源的小公司,可以从富有的投资人那里获得必要的资金支持,以换取股权。现在风投融资非常普遍,能否获得风投往往决定着一家年轻公司的成功或失败。
随着全球涌现初创公司数量激增,投资人要在大海里捞针是一个固有的挑战。
大多数创业公司都会失败了,这已经不是什么秘密了。数亿美元的风投基金并不少见,并且风投机构在遴选具有高增长潜力的初创公司时有很多选择性。由于如此巨额的资金会面临风险,所以研究过程必须彻底,投资人也可以寻求与合作伙伴共同投资,以
限制风险
并增加专业性
。这种挑战也存在于初创企业,尽管对于许多资金短缺的初创企业创始人来说,
筹集资金
无疑是一个巨大的压力来源。要向大大小小的资金雄厚的投资人推销一个创意,是有困难的。显然,风险投资人是更有话语权的一方。
二、战略性地选择正确的投资人
研究者开始为初创公司和他们的创始人分析这个矛盾的问题:
如何不仅获得投资,而且与正确的投资人合作
。尽管“乞丐不能挑肥拣瘦”这句名言有一定的分量,但毫无疑问,投资人可以为一家年轻的公司提供的不仅仅是一张支票。如果这不是真的,那么来自一个风投公司的投资将与来自另一个风投公司的投资只会是资金量的差别。
但是,风险投资是如何吸引年轻创业者的呢?创业公司应该关注哪些特点?值得注意的是投资人投资公司的良好记录是一个很好的参考和开始,但研究者认为,在更广泛的网络中,
投资人的关系
是有价值的,它可能揭示一些以前未被充分利用的信息。
三、在使用GraphXR前先构建图数据
训练机器学习模型可以帮助初创企业解决一些问题,但是随之而来的是解决这个问题的方法会变得繁重。对于那些没有高级学位或技术技能的人来说,交互式可视化几乎为任何人提供了
快速、简单和可理解
的答案。研究者提出GraphXR在这方面是一个很好的资源,因为研究者试图通过观察网络结构得到过如何有助于投资人成功的信息。在这里可以构建了一个图数据网络,节点代表不同的投资人,边代表共同的投资。共同投资被定义为两个风险投资人在同一家初创公司,同一轮次,同一时间进行投资。边的权重设置为共享投资的数量加权。这些数据公开来源于Crunchbase[3],经过一些初始数据ETL清理后,包含了创业公司、投资人、投资关系的表格——可以非常方便地注入到Neo4j图形数据库中。
•投资人关联关系的数据模型
•展示数据实例
四、使用GraphXR进行数据可视化
代码语言:javascript复制
在使用GraphXR前先构建图数据
中展示的属性图结构,允许我们轻松而有效地创建交互式和动态的数据可视化。通过使用下面的查询加载一个网络样本到GraphXR。
MATCH (n:Investor)-[:link_to]-(m:Investor) RETURN * LIMIT 1000
通过移动、旋转和缩放特征来探索初始形状和结构是很简单的,而且识别网络中心的主要节点的能力也立刻显现出来。毫不奇怪,这些关系密切的投资者中有许多是投资界常见的名字:Greylock Partners、Y Combinator、Draper Fisher Jurvetson和红杉资本(Sequoia Capital)等。
GraphXR的探索性分析支持了研究者最初的假设,即并非所有投资人都在网络中享有平等的地位。
对于一个梦想着这些风险投资人成为理想合作伙伴的初创公司来说,重要的是要记住,他们可能有自己的投资理念和想法。虽然有一个愿望清单很好,但深入了解这个网络可以帮助初创公司从战略上找到一个更合理的
潜在合作伙伴名单
。一种方法是尽可能接近这些核心投资人,要知道许多交易都涉及多个风投公司,因此,接近是一个关键中心节点的投资人非常重要。通过选择其中之一(美国著名创业孵化器(Y Combinator)),并将网络调整为树形结构,就很容易看到从主要的投资人扩展开来的一、二、三阶关系的层次结构。 请注意,虽然一些投资人在操作之前远离中心(Y Combinator),但实际上他们可能离主要参与者只有一步之遥——这是可视化工具的另一个好处。对于初创公司来说,这可能是一个有吸引力的发现。
另一个选择是根据投资倾向划分投资人。我们通过调整不同的参数来实现这一点,包括当前的融资轮以及投资者的活跃程度。研究者使用的机器学习分析最终是按行业细分,只研究那些在医疗、技术或服务业等特定领域投资的投资人。
通过上一步的维度细分,在展示模型中可以产生更强的结果,在这里使用GraphXR做过滤是快速和简单的。
通过逐步图过滤,某些不满足必要条件的节点会消失,从而很容易过滤出想要的投资人。
从拥有超过1000名投资人的整个网络开始,只需简单地点击几下,你就会拥有一组可能更容易达成合作的投资人——这些人曾经投资过你的初创公司所在的行业,并且与某个行业巨头关系密切。
现在,关注点已经缩小到一小部分投资人,基于关键指标对他们进行衡量有助于选择最好的投资人。就像目前为止的所有事情一样,在这个框架中执行这些操作是很简单的:为GraphXR绘图选择你的参数,然后投资人和所投轮次的图表就产生了。
从这里开始,在右上角选择突出显示投资人,可以为初创公司提供了一个可靠的合理的投资人名单,这些风险投资人可以成为很好的合作伙伴。它们紧密相连,在你的特定行业和公司发展阶段都有投资的历史模式,并且已经被证明有高于平均水平的成功率。
五、结论
利用这样的技术是一种高效和可扩展的方法,可以快速和简单地回答常见问题,特别是如果不熟悉统计建模或机器学习算法。 通过高级图形化软件的数据可视化可以帮助您快速获得答案,驱动假设,并以新的独特的方式更好地理解您的网络数据。
References
[1]
TOC: 基于Neo4j的关联数据评估风险投资人业绩
[2]
Evaluating Investor Performance Using Neo4j, GraphXR and ML: https://neo4j.com/blog/evaluating-investor-performance-using-neo4j-graphxr-and-ml/
[3]
Crunchbase: https://www.crunchbase.com