韩国新剧《鱿鱼游戏》风靡全球,成为全球爆款。其发行商 Netflix 宣布,“鱿鱼游戏正式拥有 1.11 亿粉丝——这是我们有史以来最大的系列发行!” 它在包括美国在内的 90 个不同国家/地区的排行榜上名列前茅,并被称为“口碑全球轰动”,在新闻和社交媒体中随处可见。
据彭博社报道,《鱿鱼游戏》的收视率增长如此之快且规模巨大,以至于在上映后不久,这部剧的预计收入近9亿美元,而制作预算约为2000万美元。同一份报告还提到,Netflix 没有透露其各种数据指标的详细信息。
那么,如何客观地评估这种爆炸性的受欢迎现象,尤其是相对于其他广受好评的热门节目?
维基百科作为数据
维基百科文章的页面浏览量是一个有趣的、独立的公共数据源,可以作为检测流行趋势的参考。另一个典型的替代方案是相关搜索引擎查询的数量。但这些很容易与其他类似主题的搜索混在一起,尤其是跨不同语言的搜索。
Wikipedia Pageview 统计数据是最近的一个项目,其数据只能追溯到 2015 年 7 月 1 日。但它与我试图量化的《鱿鱼游戏》最近的成功一起发挥作用。维基百科数据也非常集中:它既有电视节目的专用页面,也有每种语言的单独页面,百科全书式的内容质量吸引并帮助评估真正投入的读者——这种质量通常很难获得。
为了评估“爆炸性的全球流行度”(或此处的“病毒式传播”),我将使用一个简单的指标:电视节目在一天内产生的最高浏览量,汇总了最主要的语言群体中9种不同语言的维基百科用户。还有其他指标,但这个指标对我来说是最有趣的。
为什么《鱿鱼游戏》受欢迎?
反思《鱿鱼游戏》的文化背景有助于了解其对全球观众的吸引力。我推荐Jin Yu Young 的这篇《纽约时报》文章(https://www.nytimes.com/2021/10/06/business/economy/squid-game-netflix-inequality.html),他在首尔报道并提供了内部人士的观点。正如她指出的那样,韩国在战后历史上强劲的经济增长使其成为亚洲最富有的国家之一,但贫富差距也在扩大,破坏了民族文化的统一。
“《鱿鱼游戏》揭示了在韩国取得成功面对的社会压力和实现这一目标的难度之间的讽刺。” Shin Yeeun 在文章中说。“如今,20 多岁的人真的很难找到一份全职工作。” 她是 2020 年的大学毕业生,因新冠肺炎大流行而走过了艰难而漫长的求职之路。
贫富差距是《鱿鱼游戏》的焦点之一,这一点在韩国人的日常生活中得到了深刻的体现。同时,这也非常贴近全球普通观众的担忧,使该节目在国际上引起轰动。
争议、反乌托邦的艺术视觉效果、暴力以及体育和真人秀的元素增强了该节目的戏剧性。您知道,当某件事成为《周六夜现场》小品和《纽约客》漫画的主题时,它就会被广泛讨论:
图片来源:https://www.facebook.com/newyorker/photos/a.430906773868/10158615888923869/?type=3
收集数据
识别最相关的数据是关键的第一步。电视剧没有真正一致和公开的排名,即使是 Netflix 和Nielsen等拥有悠久广播电视收视率历史的播放平台,也可能对他们的数据和分析存在分歧。通过仔细检查流行媒体和报道的排名,我精心挑选了最近 10 个节目的测试样本:
- 《鱿鱼游戏》(Netflix)
- 《权力的游戏》(HBO)
- 《怪奇物语》(Netflix)
- 《纸钞屋》(Antena 3,Netflix)
- 《曼达洛人》(迪士尼 )
- 《巫师》(Netflix)
- 《使女的故事》(Hulu)
- 《性教育》(Netflix)
- 《布里奇顿》(Netflix)
- 《女王的棋局》(Netflix)
据他们的分发网络和各种新闻媒体报道,他们非常受欢迎。其中一些系列与 Netflix 属于不同的网络,例如 HBO 的《权力的游戏》,还有一些是用与英语不同的原始语言创建的,例如西班牙的《纸钞屋》。
下面的每个字符串都是维基百科超链接的结尾,链接到相关电视节目的专门文章:
验证全球成功意味着一个人应该至少代表全球主要人口群体。维基百科有多种语言版本,对应同一主题的文章不一定是精确的翻译,而是由使用特定语言的用户社区从头开始编写的。根据维基百科,拥有最大用户社区的前8个版本都是用以下语言编写的(我还添加了韩语,我稍后会解释):
排在第 20 位的韩语被添加为第九语言,因此所有节目的所有原始语言(英语、西班牙语、韩语)都得到了代表。Wolfram 语言中的WikipediaData函数是一个灵活的、用户友好的 Wikipedia API 界面。利用我所有 CPU 内核上的并行处理,我获得了所有选定节目和语言的时间序列:
人们需要非常小心来自众包项目(如维基百科)的数据。在检查《鱿鱼游戏》时间序列时,我注意到缺乏中文的数据。我在下图中用黑色显示了丢失数据的重要贡献:
我手动恢复了这些数据。定义合并时间序列的函数:
...我可以将它添加到我的数据中:
数据可视化
可视化数据需要一些设计考虑和进一步处理。首先,看看不同语言的人口统计对我们所收集的总浏览量的贡献是很有用的(尽管只针对9种语言)。毫不奇怪,维基百科英语页面在每个图表中都排在首位。英语通常被认为是一种国际交流语言,世界上许多人把它作为一种重要的第二语言。维基百科英文版的页面通常也是最详细和完善的。因此,除了阅读母语文章外,国际读者还会查看其英文版本以获取更多信息。因此,只有英文页面可以作为“全球”读者的代表,但添加更多的语言,这些语言使用者在人口统计中占很大比例,有助于改善代表性。删除字符串中多余的部分有助于使绘图标签更具可读性:
对于每个节目,我在PieChart的帮助下可视化对应于不同语言的浏览量百分比。请注意,这些百分比仅适用于我访问的顶级语言维基百科人口统计数据。有更多语言的 Wikipedia 综合浏览量,但它们相对较小:
在我之前定义的timeSeriesMerge函数的帮助下,可以合并所有九种语言的特定节目的所有时间序列:
至少根据自 2015 年 7 月 1 日以来可用的维基百科数据,可以对一天的最大浏览量(最高峰值)进行排序以对电视剧进行排名。《鱿鱼游戏》占上风,击败了其最接近的竞争对手《权力的游戏》、《怪奇物语》和《纸钞屋》:
《权力的游戏》于2011年4月17日在美国HBO首播,其维基百科页面以及其他一些剧集的页面都是在维基百科页面浏览量统计发布之前创建的。因此,我们不能保证在2015年之前这些剧不会出现最高的高峰。然而,至少所有的高峰都很有可能发生在2015年之后,因为所有这些节目都是最近的,它们的受欢迎程度增长速度可能比《鱿鱼游戏》要慢得多。
例如,以《权力的游戏》的完整时间系列为例:
高峰随着节目播出季的推移而增长。与 Netflix一次性发布所有季剧集的方法不同,人们不能在节目流行时狂看 HBO 剧集,因为剧集每周发布。因此,也许《权力的游戏》的最高收视是在节目播出最终集时达到的,评论家、观众和媒体都在热烈讨论它。以下函数查找时间序列中的最高峰值及其发生日期:
这可用于创建要在主图中使用的峰值点标记图:
最后,我创建了本文开头的数据可视化:
真正的大片
《鱿鱼游戏》确实像 Netflix 和媒体宣称的那样在全球范围内大受欢迎,至少对在 Wikipedia 上阅读该节目相关内容的人口群体而言是这样。我还可以得出结论,维基百科页面浏览数据是一个很好的信息来源。人们可以考虑不同的指标甚至不同的数据,但这里看到的维基百科总体趋势与其他报告的排名和公众对抽样节目的接受程度非常吻合。
您已经看过《鱿鱼游戏》,或者您打算看?在评论中让我知道您对《鱿鱼游戏》有何看法!
我要特别感谢Jesse Friedman,他为这个项目的数据识别提供了宝贵的建议。
访问Wolfram 社区(https://community.wolfram.com/)或Wolfram 函数库(https://resources.wolframcloud.com/FunctionRepository/),开始您自己的计算冒险之旅!
本文由Wolfram中国代理商:北京哲想软件有限公司 翻译
北京哲想软件邮箱:sales@cogitosoft.com