更新时间:2022-11-30 来源:黑马程序员 浏览量:
在Pandas对象中,如果它的某一列数据满足不同的划分标准,则可以将该列当做分组键来拆分数据集。例如,创建一个DataFrame对象,具体代码如下。
In [1]: import pandas as pd df = pd.DataFrame({"Key": ['C', 'B', 'C', 'A', 'B', 'B', 'A', 'C', 'A'], "Data":[2,4,6,8,10,1,14,16,18]}) df Out[1]: Key Data 0 C 2 1 B 4 2 C 6 3 A 8 4 B 10 5 B 1 6 A 14 7 C 16 8 A 18
然后,调用groupby()方法时把列名Key传给by参数,代表将Key作为分组键,让df对象按照Key列进行分组,具体示例代码如下:
In [2]: # 按key列进行分组 df.groupby(by='Key') Out[2]: <pandas.core.groupby.groupby.DataFrameGroupBy object at 0X0000000006E274A8>
从输出的结果可以看出,DataFrame经过分组后得到了一个DataFrameGroupBy对象,该对象是一个可迭代的对象,即只有在真正需要的时候才会执行执行计算(采用惰性计算)。