在pandas中如果我们想将两个表格按照某一主键合并,我们需要用到merge函数。
代码语言:javascript复制pd.merge(dataframe_1,dataframe_2,how="inner")
参数how有四个选项,分别是:inner、outer、left、right。
inner是merge函数的默认参数,意思是将dataframe_1和dataframe_2两表中主键一致的行保留下来,然后合并列。
outer是相对于inner来说的,outer不会仅仅保留主键一致的行,还会将不一致的部分填充Nan然后保留下来。
然后是left和right,首先为什么是left和right,left指代的是输入的时候左边的表格即dataframe_1,同理right指代dataframe_2。
left和right相当于inner和outer取了个折中的合并方法,意为保证dataframe_1或者dataframe_2不变(不变的表格我们这里记为目标表格),然后另一个表格(我们这里记为信息表格)向目标表格添加信息。
添加信息的方法是在信息表格中搜索与目标表格拥有相同主键的行直接合并,最后没有增加信息的目标表格的行,使用Nan填充。