做分析时遇到精确到小时的时间点,需要对月、天、时间来单独分析。
以我遇到的一个问题作为例子来说明。 2011-01-01 06:00:00 2011-01-01 07:00:00 2011-01-01 08:00:00 。 。 。
等,需要抽出月、天、小时这样的数据单独分析,如何做呢?
幸好,pandas可以提供这样的函数。
代码语言:javascript复制import pandas as pd
#读数据
df_train = pd.read_csv('kaggle_bike_competition_train.csv',header = 0)
#列名
df_train.dtypes
# 把月、日、和 小时单独分出来,放到3列中
df_train['month'] = pd.DatetimeIndex(df_train.datetime).month
df_train['day'] = pd.DatetimeIndex(df_train.datetime).dayofweek
df_train['hour'] = pd.DatetimeIndex(df_train.datetime).hour
这样就有额外的3个列