用于记录pandas中各种
cao
气的操作
文件读取
1 | import pandas as pd |
查看各种信息
1 | df.describe() |
属性操作
1 | df ['information'] = df['age'] + df['gender'] # 生成information属性 |
排序sort
sort_values
主要是对某个属性中出现的各个元素进行排序,默认是升序,字母是a-z
1 | df.age.sort_values() # 默认是升序,可以修改ascending=False |
过滤相关
1 | df[df.age > 20 & df.state == 'guangdong'] |
axis相关
1 | df.drop('age', axis=1) # 列上操作 |
字符串方法
1 | df.name.str.upper() # 全部变成大写 |
改变数据类型
1 | df['age'] = df.age.astype(float) |
groupby 机制
1 | df.groupby('province').size.agg(['count', 'mean', 'min']) # 传入多个参数 |
缺失值处理
1 | df.isnulll() |
index相关
1 | df.set_index('province', inplace=True) # 将某个属性变成索引index |
处理离散数据
怎么将性别男女变成1/0
1 | df['new_sex'] = df.sex.map({'female':0, 'male':1}) |
日期和时间
1 | df['time'] = pd.to_datetime(df.time) |
pandas中记录的显示
1 | pd.get_option('display.max_rows') # 查看显示多少条 |