共享单车在中国,乃至全世界都掀起了一阵新出行热潮。数据侠Todd Schneider结合共享单车数据,揭示了大纽约公共交通的出行困境、现实与影响。
▍纽约出租车与共享单车的出行大战
在纽约,每天都有数以百万计的的人参加一场盛大的交通竞赛,希望在各种交通工具中选出一种能让他们最快到达目的地的方式。在汽车、地铁、公交车以及轮渡等纽约客们典型的出行方式中,我们并没有真正得出过哪一种交通方式更快的结论。
本文作者曾经写过纽约出租车行驶和共享单车使用的文章,这让他想到这些数据包可以帮助人们更好的识别更快的交通方式,至少在纽约出租车和共享单车Citi Bike这两者中我们可以得出有效的结论。
作者使用的方法及有效发现都将在下文中充分解释。作者以一个居民区为计时点和出发地,并通过地图揭示到达另一个居民区的速度谁更快(黄色出租车vs蓝色共享单车Citi Bike)。
作者使用了2016年7月1日至2017年6月30日的纽约出租车和豪华轿车委员会(NYC Taxi & Limousine Commission)以及共享单车Citi Bike的出行数据。
▍高峰时段,50%的出租车出行慢过共享单车
根据2016年7月至2017年6月的数据,在共享单车的服务区域内,预计若有40%出租车出行换成共享单车的话,平均速度会更快。而在正午高峰期间,超过一半的出租车出行速度慢过Citi Bike。
这个结论的得出有一些限制要素,如果很多出租车的乘客同时改变出行方式使用共享单车,就会直接导致人们很难找到一个可用的共享单车服务点去借车或者还车(DT君小提示:美国的共享单车Citi Bike和中国的城市公共自行车一样需要停靠点),增加的共享单车可能最终导致道路上的车辆减少,这可以缓解车辆拥堵,但可能增加自行车道拥挤。
所以不得不说的是,我得出的这个结论是在某位健全用户不受任何数据影响的情况下做出是否骑自行车还是乘出租车的自然行为决定。
▍想在曼哈顿穿梭?去骑车吧
有一个公认的事实是,在曼哈顿东西向行驶比南北向行驶更难。也很少有地铁在东西向运行,马路也不如南北向宽阔。当地人都知道一个真实且有趣的故事,那就是东西向的公交车行驶速度远不及三轮车。
(图片说明:骑小三轮车穿越曼哈顿比公交车还快)
我把曼哈顿分成了几个如图所示的区域。并在相同的区域内(同一个起点和终点)计算出出租车和共享单车在整个行程中所花费的时间,并作出较。当然,我们先不考虑出租车在曼哈顿商业中心行驶时昂贵的费用。
如果你在中午乘出租车从42街到59街,自行车会更快一些的几率达到70%。
我刚才所说的只是从42街到59街的行程。对于有些较长的路程,比如从东边联合国大厦到西边的地狱厨房(Hell's Kitchen),共享单车出行的速度在一天90%的时间里超过了出租车。值得一提的是,在2016年7月到2017年6月期间,出租车从42街到59街总共需要的时间是共享单车的八倍,显然骑自行车会比乘出租车更加省时。
两种交通方式在所有区域的对比都可以在GitHub看到,当然你可以先看以下这个表格,比较时段是工作日的上午8点到晚上7点。
需要再次申明的是,这项调查需要两种交通方式起点和终点相同,因为从23街到57街无法统一起始点,所以这里就没有进行对比。
其次,我还发现出租车更适合在曼哈顿东边或西边运行,例如一天中有35%的出租车在西边第八大道开始或结束的行程和38%的出租车在东边第三大道开始或结束的行程都比共享单车更快。并且出租车的行驶路程越长,其所消耗的时间在与共享单车的对比中越占据优势。
▍时间拉得越长,出租车输的越惨
在2013年7月共享单车刚推出的时候,平日里大多数共享单车出行都比出租车更快一些。对于出租车和自行车的时间花费,我以月为单位进行了逐月分析调查,最后发现在这场竞争上面出租车的劣势越来越明显。
在这个项目开始之初,我的调查范围是最早的共享自行车服务范围,后来在2015年8月,更多的自行车投入市场,服务范围也随之扩大到出租车更为便捷的上城区和一些其他地方。为了项目的严谨和准确性,我的调查范围仅在从2013年起Citi Bike的服务范围内。
自行车在道路上移动的速度很难受到影响,即便城市发展、人口增加,交通越来越拥堵,自行车的速度也基本保持不变。相比较而言汽车则是越来越慢,所以出租车的乘客为什么越来越少也不言自明。(并且DT君认为骑自行车也是一种锻炼方式,又赶路又锻炼,多划算!)
我建了几个线性回归的模型来预测行驶时间,其中的变量包括行程距离、时间段、降雨量、行程是否包括曼哈顿和以外的地区、月份和年份(回归代码和结果可以在GitHub上面找到)。即便这并不是一个十分完美的模型,它还是能反映出一些基本问题。
如果我们只看年份,其他变量保持不变得出的结论是,2017年出租车在相同的路段上所消耗的时间超出了2009年17%,比如2009年在工作日的上午从曼哈顿东区到联合广场需要10分钟的时间,但在2017年则平均需要11分45秒。
相同的模型应用于共享单车上时就没有因为逐年的交通拥堵导致速度下降问题,相反,可能还比以前更快了一点。具体得出的结论:
共享单车的速度相对出行时间的敏感度明显弱于出租车。在中午高峰期的时候出租车需要比平时多出40%的时间,但自行车平均只需要比平时多出15%的时间。
在雨天自行车在路上的时间比平时短2%,但出租车的出行耗时却要增加1%。
不做对比的话,出租车在秋季是最慢的,共享单车在夏季是最慢的。两者的速度在一年中都比较快的月份则是1月。
▍人们在天气不好的时候会更多的选择出租车
虽然我的研究结论显示,出租车在午时有一半的时间会比共享单车更快,但结论还是有点笼统,我们并不知道具体到每一天会是什么结果。比如说万一哪天有几条路封锁了,在自行车仍可以不受影响的通过时,汽车却要绕道行驶;或者在大夏天的游人减少、学生开学,道路上不再那么拥挤的时候,出租车会更便捷。
为了得出两者详细的胜率,我做了更多的粒度分析。这是一个出租车败率的直方图,数据时间从2016年7月到2017年6月,从图中我们可以得出在下午时段里出租车比自行车更快的具体百分比:
其中有很多天自行车的胜率都在50%,但在直方图开始和结束的周围,出租车更占优势,这说明总有那么几天是大家更愿意选择出租车或自行车出行的日子。我的直觉告诉我图表两端的数据能提供给我新的结论,为此,我又开始以天为单位进行研究,希望得出人们选择两者的一些规律。
出租车更快的日子基本就是车流量比平时小的时候。出租车胜率最高的一天是2016年10月3日的一个下午,当时是犹太人的新年(Rosh Hashanah),许多纽约人都在家庆祝节日。接下来出租车胜率比较高的三天都是在8月的三个星期一,对于这三天,我只能猜测很多人离开城市去休假了。
共享单车胜率最高的前四名都在2016年秋季的雨天。我不懂为什么自行车在雨天会比出租车更快,也许下雨导致的交通状况不佳,并在不同程度上的影响了行驶速度,但也有可能是数据选择性偏差的问题。我之前有写过一篇关于天气和共享单车乘客数量关系的文章,并且有一个结论是在雨天不会有很多人选择自行车。所以对于这个出乎意料的研究结果,存有两个猜想:
在雨天倾向于骑行的人是非常优秀的自行车手,当然他们在天气好的时候会骑的更快。
在雨天骑车的人希望通过更快的车速冲出有雨的地方。
我不确定这些猜想是否正确,但至少听起来很有道理,且我见过有些人的确这么做过。
▍当总统到访纽约,大家还是骑车吧!
在共享单车与汽车的博弈中,2016年6月8日对于共享单车可是个好日子。时任总统奥巴马在那天下午去了纽约市里,很多街道也被封锁了。我研究了一下几条被封锁的道路,想看看哪条受影响最严重。最后得出的是联合广场到莫里山的那条平时出租车胜率占57%的路线,却在当天被自行车以90%的胜率击败。以中位数作为行程时间的有效指标,那么奥巴马的到访将我的中位数提高了不只是一点两点。
出租车平时只要8分钟就可以走完的一条路,在总统的到访当日那天,出租车行程耗时中位数升至21分钟。共享单车所需要的时间基本保持在9分钟不变。
图表反映出2016年9月19日发生了类似的情况。一年一度的联合国大会使封锁了包括莫里山在内的曼哈顿东边的一大片区域。尽管影响力不如奥巴马到访,但大多数出租车在那一段路的行驶时间还是多了一倍,并且共享单车还是基本保持不变。
另一个典型的例子是在2016年6月15日早上的西边,一辆拖拉机翻车事故导致林肯隧道关闭了将近7小时。通常出租车从上西区到西切尔西只需要15分钟,那天却要35分钟。共享单车通常需要18分钟,而事发当日的行程耗时并没有什么变化。出租车在工作日的早上的胜率一般在67%,但6月15日那天,共享单车以超过92%的胜率完胜。
这三个例子是在特殊情况下才会发生的情况,所以从这三个例子推导出来的结论——自行车比出租车更能适应多变的状况,但是这种特俗案例的结论并不够公平。更多的数据显示,出租车在一段路程中出行时间至少比平均耗时多5分钟的概率比共享单车高2倍,耗时多10分钟则比共享单车高3.5倍。所以共享单车出行在很多减少极端情况的案例中,也表现的更出色。
▍为什么在2009年后,出租车越来越慢?
出租车速度下降最明显的时间是2014年和2015年,即便有数据和回归模型作为支撑也没办法解释那段时间出租车耗时的增加。有趣的是,我们去深入挖掘及研究这两年的数据,可能会发现一些特殊地区来找出出租车2009年后的情况。
2014年,优步(Uber)在纽约投入使用,直到2015年,每周优步投入使用的汽车达到10000辆。有人曾抱怨过像Uber、Lyft、Juno这类打车软件给交通造成更大压力。不过2016年的城市交通报告并未显示有严重的交通堵塞发生。
毫无疑问的是,准确衡量共享专车服务对于交通的影响是很困难的,并且我很在意人们对于共享专车服务是否支持或者反对。
即便如此,如果必须让我给出租车在2014年到2015年间速度大幅下降一个最大原因,我会把这个锅扣给高速增长的共享专车服务应用,毕竟不论从时间点还是从道路上,共享专车数量都出现了巨大增长。
但如果说专车软件是造成2014年和2015年车流量增加的主要原因的话,在2016年和2017年的情况就说不通了,因为出租车的出行时间在这两年基本保持稳定,专车的使用持续增加,而出租车的使用却在萎缩,这样的增长与萎缩比率在2016年-2017年与2014年-2015年并没有明显的不同。
一个合理的解释是,从2016年起,私人汽车使用的减少量在一定程度上抵消了专车数量增加的影响,但我目前还没有准确的数据来证实我的猜想。
有人把交通拥挤归咎于自行车道的增加,导致行车道变窄。我想说的是,萝卜白菜各有所爱,并且也有一些数据证明自行车是无辜的。我没能找到纽约市自行车道的投入时间,所以也没办法找出其与2014、2015年出租车低谷关系。
其实还有很多原因可能导致交通状况的改变:经调后的人口增长、地铁的使用、基础设施老化、道路施工、总统到访等等都有可能导致交通拥堵。我并不清楚如何最好的统计所有影响因素,但有一点明确的是,在纽约如果你想更快的去某一个地方,汽车已不再是最好的选择了!
▍出租车和共享单车对应所有汽车和自行车的典型性
我觉得出租车作为纽约所有汽车的代表并没有什么大问题,毕竟出租车司机能够更熟练的穿梭在道路和城市的缝隙间,但同时据说他们很少用能看到路况的导航系统,所以很有可能加入堵车大军。
Citi Bike很有可能比纽约客们自有的自行车慢一些。Citi Bike在设计时为了提高安全性和稳定性,特意增加了自重,所以没办法骑得更快。不过,速度下来了,安全性也上来了!
另外,我认为骑行爱好者喜欢骑快车,更有可能选择更佳性能的自行车。共享单车的停靠点不那么好找,许多便捷的停靠点都已经停满了车,所以用户还得花时间去找可用的停靠点。
相比而言,自有自行车就没有这么多限制。考虑到这些因素,我想如果我能获取所有汽车和自行车的相关数据,最后的结果可能是对自行车有利的。同样值得注意的是,出租车和共享单车都有额外的时间花费,比如你的出发地附近如果没有共享单车服务点的话,你只能乘坐出租车。
▍我做这个项目的意义是什么呢?
有一件需要我们弄清楚的事情是,即便出租车和共享单车的数据很容易被获取并用作分析,但人们在纽约的交通工具的选择并不只限于这两种。比如说经常迟到延误的纽约地铁每天运送着无数的人去不同地方,这样的数量即便将出租车乘客和自行车使用者加在一起都只能望其项背。
所以,我并不是说一定要拘泥于出租车或共享单车这两种交通方式。即便人们没有选择共享单车而选择其他出行方式也是完全可以理解的,毕竟时间并不是每一个人考虑交通工具的唯一因素。
在过去的十年中,自行车的使用人数在不断的增长,可能是因为大部分人已经意识到自行车在日常使用中速度还是比较快的。
尽管如此,仍有数据显示,汽车相比自行车而言,可以最大降低路途上出现意外的风险并节约时间。不过就目前来看,城市人口更倾向于骑自行车其实是一件不错的事情。
▍地铁L线关闭,去骑车吧!
有的读者可能担心2019年纽约地铁L线的关闭对他们每日出行是否会造成影响,那我可以告诉你们的是,在上午高峰期的时候从威廉堡到曼哈顿的任意地方,共享单车在出行耗时上完全碾压出租车。
可滑动 ↓
数据说明:
出租车和共享单车对比分析的具体代码可以在GitHub找到,本文的分析部分依据于纽约市出租车数据报告。
2009年1月起出租车的行程数据和2013年7月起共享单车的行程数据被提供使用,作者将数据筛选了很多遍以便得到更准确的对比结果,所有的这些都可以在作者的GitHub上面找到,不过作者筛选的条件简言之:
i. 将所有的数据限制在工作日内
ii. 共享单车的行程记录我只采纳会员用户的记录
iii. 出租车的行程我只抓取了和共享单车服务区重叠的那部分,也就是用户同样可以选择共享单车到达目的地。
从2016年7月起,也许由于隐私问题,TLC停止提供每个出租车行程的纬度和经度坐标。 现在,TLC将城市划分为263个出租车区域(地图),并为每次出行提供接送区域。然后分析出租车和Citi Bike在相同区域内的时间消耗,想了解更多信息请参阅作者的GitHub。
80%的出租车行程区域都有共享单车,作者在2013年7月起的3.3亿个出租车行程和2700万个共享单车行程中筛选出了行程重合的部分用作分析。在最近的一年中,也就是2016年7月1日到2017年6月30日中,作者筛选了6800万个出租车行程和900万个共享单车行程并进行筛选分析。
作者在R语言中写了一个蒙特卡洛模型来计算在一段行程中共享单车是否会比出租车更快一些。
注:
本文编译自Todd Schneider个人博客文章《When Are Citi Bikes Faster Than Taxis in New York City?》,点击“阅读原文”查看,图片均来自原文。内容仅为作者观点,不代表DT财经立场。如果你对作者的数据筛选方式以及蒙特卡洛模型运作感兴趣的话,在后台回复“纽约客”,获取作者GitHub连接。
作者 | Todd Schneider
编译 | 肖鉴容
编辑 | 吴昊:wuhao@dtcj.com
题图 | 视觉中国
▍数据侠门派
本文数据侠Todd Schneider,一位Genius公司的软件写手。他在霍芬顿邮报上的个人介绍是:“Todd Schneider,一个改革犹太人,去耶鲁上了大学,还曾在对冲基金工作过”。