超实用干货 | 金融界的“另类数据”采集技巧分享

2023-12-01 14:28:15 浏览数 (1)

开始之前,先给大家分享几个案例:

✔一家银行,根据美团点评数据,评估餐饮门店的销量以及客户体验,来分析预测其业务健康度,进而进行普惠业务。

✔一家数据公司,通过监控Tesla工厂里员工手机的信号多少,来预测特斯拉的量产情况,进而预测股价。

✔某能源公司通过分析城市的工业用电数据,预测未来的工业产值,以此来优化能源调度和分配策略,调整定价。

✔某房地产公司通过分析城市交通数据,包括公交线路、地铁站点、共享单车停放点等,来预测房地产的发展,评估房地产项目的开发和投资。

✔投资公司通过监控淘宝、天猫、京东、唯品会等电商平台上每一个商品的价格与销售数量,准确获知这些电商公司的营收情况,以此来辅助投资决策。

以上案例分布在各行各业,但其实都与金融【另类数据】有关,可以很好地诠释【另类数据】的价值与场景。

什么是金融另类数据?

在过去,投资者更多的是依靠传统金融数据进行投资决策。

传统金融数据包括股票/债券的交易数据、上市公司的年报/财报、金融机构的研报数据、政府的统计数据、银行用户的借贷数据等。

而另类数据,通常被定义为传统金融报告和宏观经济指标之外的信息

另类数据可以提供更多关于公司、市场和经济的深层次信息。例如社交媒体、卫星图像、互联网搜索记录和消费者交易数据等

另类数据具体有哪些?

另类数据主要分为以下三大类:

✔ 个人产生数据数据:

社交网络信息、电商平台评价、搜索记录、购物喜好等。

✔ 商业过程数据:

商业运输、物流数据、信用卡使用记录、订购、预定数据、购买支付数据等。

✔传感器数据:

卫星数据、GPS定位数据、车辆轨迹、运动轨迹、穿戴设备数据等。

可以看到,另类数据主要是互联网、物联网数据。互联网的高速发展,围绕人类和商业的行为几乎都可以数字化,积累沉淀大量的个人和商业过程数据。

数据示例:门店菜品及销量数据数据示例:门店菜品及销量数据
数据示例:店铺评分等基础数据数据示例:店铺评分等基础数据

物联网技术则让原本不被感知的物理世界成为可数据化的分析对象,逐步形成了大量的物理数据资产。

另类数据的特征

与传统金融数据相比,另类数据具备数据量大、实时性高、数据种类多、结构多样的特点,是对传统金融数据的重要补充,为投资者提供更广泛的交易思路、更多维的分析角度。

✔ 数据量大

另类数据通常规模与传输量巨大,数据以极快的速度积累,涵盖了庞大的样本空间。

✔ 实时性高

数据的获取和传输是实时或者接近实时,能够更迅速地反映市场变化和事件影响。

以上市公司营收信息为例,传统方式是从年报/中报中获得。年报集中于3-4月披露,中报集中于7-8月披露,具有时间延后性。

而通过实时监测此公司去年全年线上销售情况,投资者在1月就能知晓此公司上一年营收情况。

✔ 数据种类多,结构多样:

另类数据的形式结构很多样。有数值、图片、文本、音频、视频等多种数据类型,结构化的、半结构化的、非结构化的都有。尤其是非结构化的文本型数据近年来猛增,是重要的挖掘研究对象。

如何获取另类数据?

因为另类数据具有数据量大、实时性高、数据种类多、结构多样的特点,获取难度也比较高。

金融机构一般通过以下3种方式获取另类数据:向另类数据供应商直接购买、自建爬虫团队获取、使用数据采集软件获取。 

其中使用数据采集软件成本效益最明显,前期只需投入很少的资金与人力,即可快速开始探索另类数据。

八爪鱼是通用的网页数据爬取软件,拥有行业领先的数据采集能力,能够很好地解决另类数据体量大、实时性高、数据种类多、结构多样的采集痛点。

近年来,我们已经服务了很多金融客户,帮助他们快速获取互联网上的各种另类数据,辅助投资决策。

八爪鱼采集模板-可采集同花顺-爱基金网站下的基金每日净值情况八爪鱼采集模板-可采集同花顺-爱基金网站下的基金每日净值情况

0 人点赞