Fork me on GitHub

优雅地学习Pandas

如何优雅地学习Pandas

Pandas是数据挖掘常见的工具,掌握使用过程中的函数是非常重要的。本文将借助可视化的过程,讲解Pandas的各种操作。

img

sort_values

1
2
3
4
(dogs[dogs['size'] == 'medium']
.sort_values('type')
.groupby('type').median()
)

执行步骤:

  • size列筛选出部分行
  • 然后将行的类型进行转换
  • 按照type列进行分组,计算中位数

图片

图片

图片

图片

selecting a column

1
dogs['longevity']

图片

groupby + mean

1
dogs.groupby('size').mean()

执行步骤:

  • 将数据按照size进行分组
  • 在分组内进行聚合操作

图片

图片

grouping multiple columns

1
dogs.groupby(['type', 'size'])

图片

groupby + multi aggregation

1
2
3
4
5
(dogs
.sort_values('size')
.groupby('size')['height']
.agg(['sum', 'mean', 'std'])
)

执行步骤

  • 按照size列对数据进行排序
  • 按照size进行分组
  • 对分组内的height进行计算

图片

图片

图片

图片

filtering for columns

1
df.loc[:, df.loc['two'] <= 20]

图片

filtering for rows

1
dogs.loc[(dogs['size'] == 'medium') & (dogs['longevity'] > 12), 'breed']

图片

dropping columns

1
dogs.drop(columns=['type'])

图片

joining

1
ppl.join(dogs)

图片

merging

1
ppl.merge(dogs, left_on='likes', right_on='breed', how='left')

图片

pivot table

1
dogs.pivot_table(index='size', columns='kids', values='price')

图片

melting

1
dogs.melt()

图片

pivoting

1
dogs.pivot(index='size', columns='kids')

图片

stacking column index

1
dogs.stack()

图片

unstacking row index

1
dogs.unstack()

图片

resetting index

1
dogs.reset_index()

图片

setting index

1
dogs.set_index('breed')

图片

文章原文:https://pandastutor.com/index.html

本文标题:优雅地学习Pandas

发布时间:2022年05月23日 - 10:05

原始链接:http://www.renpeter.cn/2022/05/23/%E4%BC%98%E9%9B%85%E5%9C%B0%E5%AD%A6%E4%B9%A0Pandas.html

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

Coffee or Tea