用Python实现数据的透视表的方法

脚本专栏 2024/11/16 佚名

3 1 2

在处理数据时，经常需要对数据分组计算均值或者计数，在Microsoft Excel中，可以通过透视表轻易实现简单的分组运算。而对于更加复杂的分组运算，Python中pandas包可以帮助我们实现。

1 数据

首先引入几个重要的包：

import pandas as pd
import numpy as np
from pandas import DataFrame,Series

通过代码构造数据集：

data=DataFrame({'key1':['a','b','c','a','c','a','b','a','c','a','b','c'],'key2':['one','two','three','two','one','one','three','one','two','three','one','two'],'num1':np.random.rand(12),'num2':np.random.randn(12)})

得到数据集如下：

data
 key1 key2  num1  num2
0 a one 0.268705 0.084091
1 b two 0.876707 0.217794
2 c three 0.229999 0.574402
3 a two 0.707990 -1.444415
4 c one 0.786064 0.343244
5 a one 0.587273 1.212391
6 b three 0.927396 1.505372
7 a one 0.295271 -0.497633
8 c two 0.292721 0.098814
9 a three 0.369788 -1.157426

2 交叉表—分类计数

按照不同类进行计数统计是最常见透视功能，可以通

（1）crosstab

#函数：
crosstab(index, columns, values=None, rownames=None, colnames=None, aggfunc=None, margins=False, dropna=True, normalize=False)

crosstab的index和columns是必须要指定复制的参数：

pd.crosstab(data.key1,data.key2)

结果如下：

key2 one three two
key1     
a  3  1 1
b  0  1 1
c  1  1 1

想要在边框处增加汇总项可以指定margin的值为True：

pd.crosstab(data.key1,data.key2,margins=True)

结果：

key2 one three two All
key1      
a  3  1 1 5
b  1  1 1 3
c  1  1 2 4
All  5  3 4 12

（2）pivot_table

函数：

pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All')

使用pivot_table函数同样可以实现，运算函数默认值aggfunc='mean',指定为aggfunc='count'即可：

data.pivot_table('num1',index='key1',columns='key2',aggfunc='count')

结果相同：

key2 one three two
key1     
a  3  1 1
b  1  1 1
c  1  1 2

（3）groupby

通过groupby相对来说会更加复杂，首先需要对data按照key1和key2进行聚类，然后进行count运算，再将key2的index重塑为columns：

data.groupby(['key1','key2'])['num1'].count().unstack()

结果：

key2 one three two
key1     
a  3  1 1
b  1  1 1
c  1  1 2

3 其它透视表运算

（1）pivot_table

pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All')

要进行何种运算，只需要指定aggfunc即可。

默认计算均值：

data.pivot_table(index='key1',columns='key2')

out：

   num1       num2     
key2  one  three  two  one  three  two
key1               
a  0.193332 0.705657 0.203155 -0.165749 2.398164 -1.293595
b  0.167947 0.204545 0.661460 0.555850 -0.522528 0.143530
c  0.496993 0.033673 0.206028 -0.115093 0.024650 0.077726

分类汇总呢并求和：

data.pivot_table(index='key1',columns='key2',aggfunc='sum')

结果：

   num1       num2     
key2  one  three  two  one  three  two
key1               
a  0.579996 0.705657 0.203155 -0.497246 2.398164 -1.293595
b  0.167947 0.204545 0.661460 0.555850 -0.522528 0.143530
c  0.496993 0.033673 0.412055 -0.115093 0.024650 0.155452

也可以使用其它自定义函数：

#定义一个最大值减最小值的函数
def max_min (group):
 return group.max()-group.min()

data.pivot_table(index='key1',columns='key2',aggfunc=max_min)

结果：

   num1     num2    
key2  one three two  one three  two
key1             
a  0.179266 0.0 0.000 3.109405 0.0 0.000000
b  0.000000 0.0 0.000 0.000000 0.0 0.000000
c  0.000000 0.0 0.177 0.000000 0.0 1.609466

（2）通过groupby

普通的函数如mean，sum可以直接应用：

data.groupby(['key1','key2']).mean().unstack()

返回结果：

   num1       num2     
key2  one  three  two  one  three  two
key1               
a  0.193332 0.705657 0.203155 -0.165749 2.398164 -1.293595
b  0.167947 0.204545 0.661460 0.555850 -0.522528 0.143530
c  0.496993 0.033673 0.206028 -0.115093 0.024650 0.077726

以上这篇用Python实现数据的透视表的方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

Python,数据,透视表

华山资源网 Design By www.eoogi.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

华山资源网 Design By www.eoogi.com

评论“用Python实现数据的透视表的方法”

暂无评论...

www.eoogi.com 华山资源网

120,135影音资源

344,641技术资源

22,817软件资源

435,032站长资源

最新文章

柏菲·万山红《花开原野1》限量开盘母带ORMC

2024/11/16

柏菲·万山红《花开原野2》限量开盘母带ORMC

2024/11/16

潘安邦《思念精选集全纪录》5CD［WAV+CUE]

2024/11/16

杨千嬅《千嬅新唱金牌金曲》金牌娱乐 [WAV+

2024/11/16

杨钰莹《依然情深》首版[WAV+CUE][1G]

2024/11/16

一句话新闻

苹果官宣WWDC 2024！预计会有大批AI功能 - 2024/11/16

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。

用Python实现数据的透视表的方法

在Pandas中给多层索引降级的方法

Python 面试中 8 个必考问题

评论“用Python实现数据的透视表的方法”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

用Python实现数据的透视表的方法

在Pandas中给多层索引降级的方法

Python 面试中 8 个必考问题

评论“用Python实现数据的透视表的方法”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存