Fork me on GitHub

精选100个Pandas函数

精选100个Pandas函数

精心整理100个pandas常用函数,建议收藏~

a

1
2
3
4
5
6
7
8
9
aggregate()  #聚合;基于内置函数或者自定义函数的聚合运算
argmin() 最小值所在的索引
argmax() 最大值所在的索引
any() 等价于逻辑“或”
all() 等价于逻辑“与”
astype() 强制类型转换
apply() # 自定义函数的元素操作
append() 序列元素的追加
assign() 字段衍生

b

1
2
bfill()   # 后向填充;使用缺失值后一个填充缺失值
between() 区间判断

c

1
2
3
4
5
6
7
count()  # 计数(不包含缺失值)
cov() 计算协方差
corr() # 计算相关系数
cumsum() 累计和
cumprod() 累计积
compress 条件判断
concat() # 数据合并

d

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
dtypes()  查看数据字段类型
describe() # 描述统计信息
duplicated() 判断是否有重复元素
drop_duplicates() #删除重复值
dropna() # 删除缺失值
diff() 一阶差分
dt.date() 提取日期
dt.time() 提取时间
dt.year() 提取年份
dt.month() 提取年份
dt.day() 提取天/日
dt.hour() 提取小时
dt.minute() 提取分
dt.second() 提取秒
dt.quarter() 提取季度
dt.weekday() # 提取星期几(返回数值,0,1,2.....)
dt.weeky_name() # 提取星期几(返回名称,Sunday,Friday等)
dt.week() 返回当年的第几周
dt.dayofyear() 返回年中的第几天
dt.daysinmonth() 月中最大的天数
dt.is_month_start() 是否为当月的第一天
dt.is_month_end() 是否为当月的最后裔天
dt.is_quarter_start() 是否为季度的第一天
dt.is_quarter_end() 是否为季度的最后一天
dt.is_year_start() 是否为当年的第一天
dt.is_year_end() 是否为当年的最后一天
dt.is_leap_year() # 判断是否为闰年

e

1
explode()  # 爆炸函数

f

1
2
3
fillna()   填充缺失值
ffill() # 前向填充;使用前一个值填充缺失值
factorize() 因子化转换

g

1
2
groupby()  # 分组
get_dummies() # 哑变量

h

1
2
hist()   绘制直方图
hasnans() 判断元素中是否存在缺失值;返回的是True或者False

i

1
2
3
isnull()   # 判断序列元素是否为缺失值,返回bool值
isin() 成员判断
iloc() # 定位数据;只能使用数值

j

1
join()  # 数据合并

k

1
kurt()  计算峰度

l

1
loc()   # 定位数据

m

1
2
3
4
5
6
7
min()  最小值
max() 最大值
mean() 均值
median() 中位数
mode() 众数
map() # 元素映射
merge() # 合并数据

n

1
2
3
notnull()    非空判断
nsmallest() 最小的前n个值
nlargest() 最大的前n个值

p

1
2
3
4
5
pct_change   运算比率;后一个和前一个的比例
pd.to_datetime() 转日期时间类型
pd.Series() # 创建Series数据
pd.DataFrame() # 创建DataFrame数据
plot() 绘制基于Kind参数的多种图形;kind指定图形类型:饼图、柱状图、箱型图等

q

1
quantile()  分位数

r

1
2
3
4
5
6
7
replace()   替换值(不能使用正则)
str.replace() 值替换(可使用正则)
round() 四舍五入
read_csv() # 读取csv文件
read_excel() # 读取Excel文件
read_table() # 读取table文件
rank() # 排名

s

1
2
3
4
5
6
7
8
9
10
sum()  求和
size() 计数(包含所有数据,包含空值)
std() 计算标准差
skew() 计算偏度
sample() 抽样
str.split() 字符分割
str.findall()
sort_values() # 按值排序
sort_index() 按索引排序
stack() # 堆叠;列转行

t

1
2
3
to_dict()  转为字典
tolist() 转为列表
transpose .T # 转置

u

1
2
unique()  元素唯一值(去重)
unstack # 不要堆叠,多行转列

v

1
2
var()  计算方差
value_counts() # 统计每个元素的值

w

1
where()    # 基于条件判断的值替换

本文标题:精选100个Pandas函数

发布时间:2022年10月26日 - 21:10

原始链接:http://www.renpeter.cn/2022/10/26/%E7%B2%BE%E9%80%89100%E4%B8%AAPandas%E5%87%BD%E6%95%B0.html

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

Coffee or Tea