本文中总结了最近工作中用到的几个panads操作技巧
pandas显示列和行
显示全部的属性字段和行激励
1 | # 显示所有列 |
解决中文乱码
当字段属性中存在中文的时候,读取数据的时候需要加上encoding
参数
1 | one = pd.read_csv(r"./one.csv",engine="python",encoding="utf-8") # 也有可能是gb18030 |
时间和时间戳
时间转成时间戳
-
如果是本地时间的时间戳,在线工具:https://tool.lu/timestamp/
-
如果是某个指定时间的时间戳
- 利用
strptime()
函数将时间转换成时间数组 - 利用
mktime()
函数将时间数组转换成时间戳
1 | import time |
时间戳转时间
- localtime :将时间戳转成时间元组
- strftime:将时间元组格式为特定形式
1 | timestamp = 1591212042.8380945 |
重新格式化时间
1 | dt = "2020-06-03 20:28:54" |
去掉时间数据中的时分秒
将完整时间数据中的时分秒去掉
1 | # 去掉时间中的时分秒,仅保留日期 |
按照指定格式获取当前时间
先获取到本地的时间戳;再将该时间戳转成指定的时间格式
1 | time_now = int(time.time()) # 获取当前时间戳 |
读取TXT中的json数据
方式1
先通过with语句读进来,再利用read_json进行读取
方式2
直接通过read_table读进来,再进行转化
1 | data = pd.read_table("./user_data.txt") |
去重后重新排序行索引
pandas中去重之后保留的索引仍是原数据的索引,有时候需要按照0,1,2,3,…进行重新排列
1 | df.drop_duplicates("userid").reset_index(drop=True) # drop参数是不保留原始的行索引信息 |