以下是利用Python进行数据分析中低十章对resample方法具体解释,不过how参数已经过时
代码语言:javascript复制#把流量数据每3分钟聚合一次
def flowdata_fusion_3(temp_volume_series, temp_time_series):
# print(temp_volume_series)
temp_volume_series.index = temp_time_series
ts = pd.Series(temp_volume_series)
flowdata_fusion_3min = ts.resample('3min', label='left', closed='left').sum()
# print(date_fusion_3min)
return flowdata_fusion_3min
temp_volume_series代表这检测器获取的数流量,是Series格式,它的默认索引是0~~xx,想把它的索引改为流量对应的时间格式
之前用的是pd.Series(temp_volume_series).reindex(temp_time_series)
或者pd.Series(temp_volume_series,index=temp_time_series),但是结果聚合后,流量值全都变为NAN。这两种方式只是重排,说白了就是重新创建了新的的索引,但是流量数据还在默认的索引中,所以新的流量不存在就用NAN代替。
解决方法:
直接获取它全部的索引值强制改变 temp_volume_series.index = temp_time_series