当前位置：首页 > 资讯 > >正文

一文快速入门pandas

来源：哔哩哔哩时间：2023-07-30 13:45:13

描述(概括)

pandas在数据预处理方面具有非常强大的功能，对pandas进行基本学习，能够借助pandas 完成数据的解析，在数据可视化中借助pandas完成数据解析，根据题意从给定的数据源中取出所需数据，并可以对数据做简单的统计运算。

从pandas最基本的series 和 dataframe 对象开始学习，基本上pandas的操作都是基于这两个对象。这一部分，是对pandas常用的方法的记录学习，以及基本的概念的学习。

pandas 入门概念

series 和 dataframe 这是pandas 中最为基本的两个概念，series 类似于一维数组，可以近似当成普通的数组进行操作，对于series 默认会有行索引为它索引，但特殊的同时与普通的一维数组不同列表只能有从0开始的整数索引，而series则可以自定义标签索引，这一点来看，跟字典又比较相似，因此series又可以拥有类似字典的操作方式，series 的标签索引可以随时更新修改替换。series 提供有很多方便的方法，用于判断值为空的 isnull, notnull，sort_index(), sort_values() 用于排序的方法等。

(相关资料图)

而DataFrame是一种表格型数据结构，它含有一组有序的列，每列可以是不同的值。DataFrame既有行索引，也有列索引，它可以看作是由Series组成的字典，不过这些Series公用一个索引。DataFrame的创建有多种方式，不过最重要的还是根据dict进行创建，以及读取csv或者txt文件来创建。

series 相关基本操作

1. 访问series 元素的方式

注意点：

通过series[x] 索引访问时需要注意自定义的sertes标签索引和 series默认的position 类型是否一致，当都为int64时，默认的position会被定义的索引覆盖，此时在通过series[x] 访问需要注意不能使用默认的position来访问。

补充：loc 和 iloc 的区别，

loc 通过标签(也就是series的索引)访问元素，接受整数索引和非整数索引(因为是标签)

iloc 通过整数索引访问元素，并且只能接受整数索引，这一点来看，跟列表的默认整数索引又很相似，允许-1 这样的从后访问元素。

loc 用法(Dataframe)：

loc([这里是行标识], [这里是列标识])

示例：

可以看出行列的索引访问支持切片，添加逻辑判断等操作。

iloc 用法(Dataframe)

iloc([这里是行标识], [这里是列标识])

语法与loc 看上去比较类似，但功能更为单一

示例：

总结：

一般访问series 可以有三种方式，一是loc，通过标签索引访问，这种方式只能接受标签作为参数，不能接受其他的参数类型，可以添加过滤条件。

一是通过iloc 索引访问，只能接受整数索引，也不能添加逻辑判断的过滤条件，但它不受标签值的影响可以一直通过整数索引访问，在对series排序后如果想获取首个元素，就可以通过iloc 来访问，因为此时标签的顺序已经改变。

或是直接通过series[] 访问，他同时支持标签访问和整数索引(序号，跟普通列表的默认索引一致)，所以在一般情况下通过series[] 访问即可。

切片和取值使用

切片，取出元素

上面的访问方式等同于series['c':'a':-1]

同理，也支持整数索引（position）进行切片。

取值，根据需要

上面是根据序号进行取值，跟列表的默认索引原理一致即从0开始

同理，对标签索引也支持这样取值。

根据需要进行取值，即自定义条件

如上，既支持自定义的逻辑判断表达式，也支持lambda表达式。

2. 对series 元素操作的方式

dataframe 相关基本操作

1. 访问dataframe 元素的方式

一般情况下，以上几种访问方式基本能够满足使用。需要注意的是，在访问dataframe时，访问df中某一个具体元素时需要先传入行表索引再确定列索引。

2. 对dataframe 元素进行操作的方式

对元素进行操作的前提就是先读取到数据，因此能正常读取到数据，修改也就是顺理成章了。

以上只是基本的修改，删除新增的方式，更复杂的过滤筛选计数排序等功能未记录

3. 获取到dataframe 数据的方式

目前而言，使用最多的应该会是读取文本文件的方式，读取到文件后就是一个dataframe 对象，之后的操作都是基于dataframe和series 来。

4. dataframe 相关算术运算

1).如果其中一个是数值，那么这个数值会和DataFrame的每个位置上的数据进行相应的运算。

2).参与运算的如果是两个DataFrame，有可能所有的行、列是一致的，那么运算时对应行列的位置进行相应的算术运算，若行列没有对齐，那么填值NaN。

3). 如果参与运算的一个是DataFrame，另一个是Series，那么pandas会对Series进行行方向的广播，然后做相应的运算。

4). 参与运算的两个DataFrame并非完全一样，即行列个数和行列名有可能都不同，那么有对应上的就做运算，无填充NaN。

5). 列方向也有相应的计算处理方式。如果是列方向的运算，一个是dataFrame，另一个是Series，首先将Series沿列方向广播，然后运算。

dataframe 的常用属性

1. columns 属性

获取df 的列标签(列索引)值

2. shape 属性

获取df 的形状，即几行几列

3. size 属性

获取df 的value的个数

4. values 属性

返回当前df 的数据和 index，columns 相对应

5. dtypes 属性

返回df 的每列值的数据类型

6. ndim 属性

ndim 获取df 的阶数，可以看成是维度数

7. T 属性

对df 进行转置，即列和行颠倒。

pandas 常用函数

pandas中的函数一般会有两种结果，一是copy，即返回一个修改后的副本，原有的不变，二是inplace，即在原有基础上直接进行修改。

而且，这个一般会有一个inplace 的参数值指明是否是在原有基础上修改。

series 中的常用函数

1. get() 和 get_value() 方法

因为series 具有字典的一些特征，所以允许使用get 方法来获取数值，如果没有则返回默认值，而get_value 功能类似，但如果没有对应key则会抛出异常。

2. add() 和 append() 方法

add 类似+ 运算，将两个series 相加得到结果，append 则是将一个series 连接在前一个series的后面，类似列表的相加。

3. count() 方法

统计series中非nan 的值，即非空值计数。

4. sort_index() 和 sort_values() 方法

按索引排序或按数值排序，默认升序排列。

5. reset_index() 方法

重置series 的index索引，同时有drop 参数可以选择是否删除索引。

6. reindex() 方法

reindex函数可以将series的index换成其他的index。新的series保留原serie的values值，如果新的index和原series的index不同，则不同的填充NaN值，或者使用fill_value参数指定填充值。

series 中的统计函数

1. sum() 方法和 mean() 方法

sum 求和函数。mean 求均值，同时有skipnan参数可选是否忽略nan 空值。

2. describe() 方法

可获取一系列的统计信息，包含最大最小值，标准差，计数等统计信息。

3. max() 和 idmax() 方法

max 获取series中最大值，idmax 获取最大值的标签或索引。

4. var() 和 std() 以及 mad() 方法

var 获取series 的方差，std 获取标准差是对var 的求算术平方根，mad 平均绝对离差，是用样本数据相对于其平均值的绝对距离来度量数据的离散程度

注意：dataframe 中的统计函数与series中的相关统计函数基本一致，使用方法基本没有区别。

补充：

divmod(x, y)

divmod() 函数返回当参数 1 除以参数 2 时包含商和余数的元组。

X 关闭

最近更新

一文快速入门pandas

2023-07-30 13:45:13

资讯
我市积极应对强降雨天气（一）泃阳镇、李旗庄镇、迎宾北路街道、高楼镇、经济开发区、行宫东街道

2023-07-30 12:32:28

资讯
全国老年健康宣传周老年人可通过接种疫苗预防这些疾病

2023-07-30 11:21:47

资讯
高血脂不能吃土豆？医生提醒：除了土豆，这2种“素食”也要少吃

2023-07-30 10:31:28

资讯
嗨放派第二季范丞丞吃火锅是哪一期（嗨放派第一季有范丞丞吗）

2023-07-30 10:07:12

资讯
新特电气等35股获陆股通增仓超100%

2023-07-30 09:13:05

资讯
999霸王金（霸王金是什么最近看到大街上卖这种相连很火、）

2023-07-30 07:59:35

资讯
超值价！摩托罗拉2021款手机7675元

2023-07-30 06:20:39

资讯
韩国女教师遭小学男学生暴力殴打致重伤，上千名知情教师联名撰写请愿书

2023-07-30 04:15:17

资讯
【碧蓝航线】是俾斯麦她们诱惑的你吗，我的孩子？

2023-07-30 00:08:57

资讯
纽约第五大道购物（纽约第五大道饭店

2023-07-29 22:16:14

资讯
cdma2000无线数据终端（电信cdma2000手机）

2023-07-29 20:28:15

资讯
事实证明，家庭破碎的马特奥，在这部影片中起到什么作用

2023-07-29 19:16:34

资讯
马斯克：推特将更名为“X” 功能将全能化

2023-07-29 18:03:04

资讯
中金：反弹有望继续延续地产产业链等有望成为当前投资主线

2023-07-29 17:08:50

资讯
相聚相知绽放青春 ——成都世界大学生运动会开幕式侧记

2023-07-29 16:09:20

资讯
世茂集团申请复牌：两年亏近486亿元，负债4114亿元

2023-07-29 15:16:34

资讯
中工网带你去追星｜“工匠论坛”追星记

2023-07-29 14:07:59

资讯
冷冻食品批发（冷冻鲽鱼片怎么做好吃）

2023-07-29 13:01:12

资讯
关于股票基本知识有哪些（关于股票基本知识）

2023-07-29 11:55:30

资讯
米体：国米计划450万欧+奖金签索默尚未确定签何种类型的前锋

2023-07-29 11:11:15

资讯
巩固拓展轻工业稳增长良好态势

2023-07-29 10:25:34

资讯
兵种有哪些（兵种的类型）

2023-07-29 09:37:22

资讯
乌军发起新一轮反攻向南“突防”能奏效吗？

2023-07-29 08:41:14

资讯
如何向APOD投稿？

2023-07-29 07:40:49

资讯
斑鸠的养殖方法_斑鸠怎么样养殖

2023-07-29 06:26:30

资讯
中国手机市场迎来洗牌：小米第五，vivo第二，最大的黑马是华为

2023-07-29 05:09:03

资讯
再添一金！覃海洋获得世锦赛男子200米蛙泳金牌

2023-07-29 01:46:13

资讯
李沧交警开展货车集中治理查处超载等违法行为十余起

2023-07-28 23:13:20

资讯
上海市级专精特新企业达8288家

2023-07-28 22:12:06

资讯
嫦娥应悔偷灵药下一句_是什么呢

2023-07-28 21:14:11

资讯
抵御台风影响，辰山植物园急护王莲“蒙面纱”

2023-07-28 20:16:12

资讯
实探张小泉阳江智能制造基地推动国内刀剪行业实现工业4.0标准

2023-07-28 19:28:02

资讯
30省份GDP出炉：14省份增速跑赢全国 3省份增速超8%

2023-07-28 19:01:07

资讯
网格员入户宣传助力垃圾分类

2023-07-28 18:11:32

资讯
帮助别人完美的人更伟大

2023-07-28 17:53:35

资讯
奥的斯电梯深圳分公司被罚存在特种设备违法行为

2023-07-28 17:24:19

资讯
大运来了丨香港女孩胡宝琴：我在成都迎八方来客

2023-07-28 17:03:57

资讯
期待！中国女足今晚对阵海地

2023-07-28 16:19:29

资讯
厦门今日15时将结束“三停一休” 有序恢复正常生产生活秩序

2023-07-28 15:57:00

资讯
服装板块再获关注，AI助力行业发展，这只股早已大涨！

2023-07-28 15:16:18

资讯
“杜苏芮”已登陆！记者台风中扶着车门都站不稳

2023-07-28 15:03:02

资讯
冉姓女孩好听的名字超仙

2023-07-28 14:09:09

资讯
（成都大运会）胡朕卓、郭涵煜将担任成都大运会开幕式中国大学生体育代表团旗手

2023-07-28 13:32:13

资讯
全息系列 | 笔中文化科技集团带您领略展馆展厅的视觉新体验

2023-07-28 12:47:21

资讯
遗迹2捕梦者武器怎么用攻略

2023-07-28 12:17:16

资讯
中央气象台7月28日10时继续发布台风红色预警

2023-07-28 11:43:43

资讯
BRTV文艺《笑动剧场》相声《催婚》之妈妈教育李丁，金句频出

2023-07-28 11:21:59

资讯
碧江区桐木坪乡黄桃进入采摘期

2023-07-28 10:52:52

资讯
小辽说天气丨雨势增强出行注意安全

2023-07-28 10:25:11

资讯
比亚迪(002594)国内新能源强者，开启海外扩张步伐

2023-07-28 10:11:15

资讯
我市扎实推进历史遗留矿山生态修复计划2025年完成历史遗留废弃矿山修复治理任务660公顷

2023-07-28 09:41:01

资讯
发生了什么？美股突然大跌美监管部门拟要求八家最大银行将资本金提高19%

2023-07-28 09:10:16

资讯
国海证券：结构性行情还将持续，多看少动等待情绪回暖

2023-07-28 08:36:59

资讯
现在到春节能通过相亲结束单身的生肖女

2023-07-28 08:03:42

资讯
国内手机市场销量排名更新：苹果排第4，华为排第5

2023-07-28 06:48:41

资讯
山东出台26条“确定性”措施对冲外贸外资发展“不确定性”

2023-07-28 05:39:06

资讯
孙伯君(关于孙伯君简述)

2023-07-28 03:21:10

资讯
河北磁县发现明万历年间古石碑助力研究冀南地区宗教文化传承

2023-07-28 01:11:54

资讯
V观财报｜高斯贝尔董事、时任总经理游宗杰收监管函：违规减持

2023-07-27 22:46:49

资讯
鼎捷软件(300378.SZ)：上半年净利润3613万元同比增长4.82%

2023-07-27 21:50:42

资讯
彼得与狼交响童话视频完整版剧场彼得与狼交响童话视频

2023-07-27 20:16:00

资讯
活死人厂牌成都演唱会门票价格及购票入口2023

2023-07-27 20:23:30

资讯
火影忍者手游夏日沙滩季怎么打？平民高分活动阵容推荐

2023-07-27 19:30:03

资讯
句

2023-07-27 19:11:09

资讯
大商所飞创在线业务平台移动版本正式上线

2023-07-27 18:55:44

资讯
99年美女程序媛，娉婷袅娜，猫咪控，温柔可爱的小姐姐想脱单

2023-07-27 18:43:23

资讯
河北儿童乐享多彩暑期生活

2023-07-27 18:44:55

资讯
山东两所大学走出一个IPO | 专精特新

2023-07-27 18:15:18

资讯
和平区不断扩大航运企业“朋友圈” 打造津城航运服务集聚区

2023-07-27 18:18:02

资讯
学校应急疏散演练方案

2023-07-27 18:09:07

资讯
A股收评：沪指冲高回落跌0.2% 汽车产业链多股涨停

2023-07-27 18:05:03

资讯
借助新的解决方法S可以再次以零售模式运行模拟器

2023-07-27 17:57:06

资讯
识港网“狮子吼”漫画：白宫撇“清”

2023-07-27 17:49:59

资讯
水、陆、空三管齐下夯实“数字底座”湖北长江“黄金水道”插上智慧之翼

2023-07-27 17:33:05

资讯
永川“警网”联合守住群众“钱袋子”

2023-07-27 17:32:25

资讯
南京市两社区入选住建部完整社区建设试点名单

2023-07-27 17:26:29

资讯
法院开放日小学生变身“大法官”

2023-07-27 17:19:04

资讯
2023上海优质农产品盛夏展长宁连展三天(7.21-23)

2023-07-27 17:07:15

资讯
为民心顺、社会安、大局稳提供坚强保障！上海市信访工作会议明确这些重点

2023-07-27 17:01:05

资讯
风格大改，新一代“奥迪A4”路试曝光，气场媲美A8，首搭1.5T引擎

2023-07-27 16:43:52

资讯
MySQL中的存储过程（详细篇）

2023-07-27 16:35:22

资讯
以弓弩和飞镖射杀方式偷狗作案12起两名嫌疑人被刑事拘留

2023-07-12 12:18:04

资讯
校园故事丨校园里的“一米阳光”

2023-07-12 11:57:07

资讯
交通运输部：截至6月全国318家网约车平台公司取得经营许可环比增加5家

2023-07-12 11:14:51

资讯
岗位+86万个！人社部再推四个专场招聘

2023-07-12 11:00:59

资讯
《星球大战绝地：幸存者》隐藏成就挥金如土奖杯指南

2023-07-12 10:24:01

资讯
房地产开发板块震荡下挫京投发展跌超5%

2023-07-12 10:09:37

资讯
中超综合：泰山横扫申花雄狮闷平津门虎

2023-07-12 09:28:33

资讯
追觅科技，难成下一个“扫地茅”

2023-07-12 09:05:53

资讯
长沙医学院到龙山县靛房镇开展爱心义诊活动

2023-07-12 08:24:05

资讯
EIA下调今年美国原油产量预期预计Q4原油价格将达每桶80美元

2023-07-12 07:45:26

资讯
猛涨6个点！微软胜诉后动视暴雪股价涨破88美元

2023-07-12 06:31:48

资讯
美元终将消亡！《富爸爸穷爸爸》作者：金砖国家拥抱黄金货币比特币明年达到12万美元

2023-07-12 05:01:01

资讯
黑莓playbook2怎么样（黑莓playbook）

2023-07-12 01:25:05

资讯
笑喷!男篮寻找斯洛文尼亚圣泉,周琦骗周鹏:老香嘞!喝一口马上吐了

2023-07-11 22:38:30

资讯
大手牵小手，做百姓家门口的“医”靠

2023-07-11 21:52:06

资讯
华荣股份现7896万元折价大宗交易折价率10.33%

2023-07-11 21:05:33

资讯
照烧QQ牛肉串的简单家常做法

2023-07-11 20:10:46

资讯
衡水市知识产权质押融资打通企业发展“堵点”

2023-07-11 19:17:36

资讯