首页常见问题正文

Python培训:轴向堆叠数据

更新时间:2022-08-22 来源:黑马程序员 浏览量:

  concat()函数可以沿着一条轴将多个对象进行堆叠,其使用方式类似数据库中的数据表合并,该函数的语法格式如下:

pandas.contact(objs,axis=0,join='outer',join_axes=None,ignore_index=False,
               keys=None,levels=None,names=None,verify_integrity=False,
               sort=None, copy=True)

  上述函数中常用参数表示的含义如下:

  (1)axis:表示连接的轴向,可以为0或1,默认为0。

  (2)join:表示连接的方式,inner表示内连接,outer表示外连接,默认使用外连接。

  (3)ignore_index:接收布尔值,默认为False。如果设置为True,则表示清除现有索引并重置索引值。

  (4)keys:接收序列,表示添加最外层索引。

  (5)levels:用于构建MultiIndex的特定级别(唯一值)。

  (6)names:在设置了keys和level参数后,用于创建分层级别的名称。

  (7)verify_integerity:检查新的连接轴是否包含重复项。接收布尔值,当设置为True时,如果有重复的轴将会抛出错误,默认为False。

  根据轴方向的不同(axis参数),可以将堆叠分成横向堆叠或纵向堆叠,默认采用的是纵向堆叠方式。在堆叠数据时,默认采用的是纵向堆叠方式。在堆叠数据时,默认采用的是外连接(join参数设为outer)的方式,当然也可以通过join=inner设置为内连接的方式,图4-10是两种连接方式的示意图。

1661140006634_图4-10连接方式.jpg

  图4-10 连接方式

  图4-10中,A和B分别表示两个数据集。当A与B采用外连接的方式合并时,所得的结果为索引并集部分的数据,数据不足的地方使用NaN补齐即可;当A与B采用内连接的方式合并时,则所得的结果仅仅为索引交集(重叠)部分的数据。

分享到:
在线咨询 我要报名
和我们在线交谈!