Marvel Cinematic vs DC Universe哪个更好,这是一场永无止境的辩论,对吧?当你反对这些电影的任何一个时,粉丝会变得疯狂。在本篇文章中,我们将根据一些数据来对比Marvel 与 DC , 数据总能说出真相。
MCU 与 DC
本文末尾提供了下载数据集的链接。你可以在 Jupyter Notebook、Google Colab 或任何其他首选编辑器中编写 Python 代码。
代码和分析
代码语言:javascript复制import pandas as pd
import scipy.stats as stats
import matplotlib.pyplot as plt
from matplotlib.pyplot import figure
import plotly
import plotly.express as px
% matplotlib inline
让我们加载数据先看看是什么样子的。
代码语言:javascript复制df = pd.read_csv("/content/mdc.csv", encoding='latin-1')
df.head()
数据包括电影名称、发行年份、电影类型、IMDB 评级、IMDB 总收入等。
下面看看更多的信息
代码语言:javascript复制df.describe()
df.info()
这两个函数可以帮我们查看数据大体的情况,例如每列的数据类型和信息,还有检查每列中的空值。我们的数据集中没有空值。
数据相关性
代码语言:javascript复制f,ax = plt.subplots(figsize=(14,10))
sns.heatmap(df.corr(), annot=True, fmt=".2f", ax=ax)
plt.show()
以上就是两列之间相关性的热图
如果你想看漫威电影或 DC 电影,你可以通过过滤数据来做到这一点。像这样:
代码语言:javascript复制df[df.entity == 'MARVEL'].tail(5)
df[df.entity == 'DC'].tail(5)
谁拍的电影更多?
代码语言:javascript复制fig = plt.figure(figsize = (10,10))
ax = fig.subplots()
df.entity.value_counts().plot(ax=ax, kind='pie')
ax.set_ylabel("")
ax.set_title("MARVEL VS DC (No. of Movies)")
plt.show()
上面的饼图清楚地告诉我们,漫威制作的电影比 DC 多。在这里,MCU 大获全胜。
电影类型
代码语言:javascript复制fig = plt.figure(figsize = (10,10))
ax = fig.subplots()
df[df.entity == 'MARVEL'].genre.value_counts().plot(ax=ax, kind='pie')
ax.set_ylabel("")
ax.set_title("Marvel Movie Genre Type")
plt.show()
正如你所看到的,漫威电影宇宙的大部分类型是动作、冒险、科幻、喜剧和奇幻。现在来看看 DC。
代码语言:javascript复制fig = plt.figure(figsize = (10,10))
ax = fig.subplots()
df[df.entity == 'DC'].genre.value_counts().plot(ax=ax, kind='pie')
ax.set_ylabel("")
ax.set_title("DC Movie Genre Type")
plt.show()
可以看到DC电影比漫威电影更加多样化。DC 尝试过更多类型(虽然失败了,哈)。我认为这是 DC Universe 最好的部分。
基于 IMDB 的评分最高的漫威和 DC 电影
代码语言:javascript复制dc_movies = df[df.entity == 'DC']
marvel_movies = df[df.entity == 'MARVEL']
#Average and highest rated of dc moviesavrg_dc_imdb = dc_movies['imdb_rating'].mean()
avrg_dc_imdb = dc_movies['imdb_rating'].mean()
highest_dc_imdb = dc_movies['imdb_rating'].max()
print("Average: ",avrg_dc_imdb, "n Highest: ",highest_dc_imdb)
#Average and highest rated of marvel movies
avrg_marvel_imdb = marvel_movies['imdb_rating'].mean()
highest_marvel_imdb = marvel_movies['imdb_rating'].max()
print("Average: ",avrg_marvel_imdb, "n Highest: ",highest_marvel_imdb)
结果是这样
代码语言:javascript复制###DC###
Average: 6.133333333333335
Highest: 9.0
###MARVEL####
Average: 6.794736842105261
Highest: 8.4
DC 电影的平均评分为 6.133,漫威电影的平均评分为 6.794。DC 拥有有史以来收视率最高的电影之一。
IMDB 评分与票房
代码语言:javascript复制plt.scatter(data = marvel_movies, x = 'imdb_rating', y = 'imdb_gross')
plt.scatter(data = dc_movies, x = 'imdb_rating', y = 'imdb_gross')
plt.title('Marvel vs. DC in imdb ratings and gross')
plt.xlabel('IMDb Ratings')
plt.ylabel('IMDb Gross')
plt.legend(['Marvel', 'DC'])
就总票房而言,有少数几个漫威电影大幅度领先DC 。大多数漫威电影的 IMDB 评分都在 6.7 到 8.2 之间。
DC 电影的评分在图中均匀分布。在 IMDB 总票房上表现不错,但如果将它与漫威进行比较,它们少很多。
那个评分最低的肯定是绿灯侠