大家好,我是正在实战各种AI项目的程序员晚枫。
欢迎来到Pandas的世界!
Pandas是Python数据分析的核心库,它提供了两个强大的数据结构:Series和DataFrame。掌握它们,你就能像操作Excel一样处理数据,而且更快更强。
为什么用Pandas?
Excel vs Pandas
| 能力 | Excel | Pandas |
|---|---|---|
| 数据量 | 100万行卡顿 | 千万行流畅 |
| 自动化 | 手动操作 | 代码复现 |
| 复杂计算 | 公式受限 | Python灵活 |
| 数据源 | 本地文件 | 数据库/API |
一句话:Excel能做的Pandas都能做,而且做得更好。
Series:一维数据
Series就像Excel的一列,带索引的数组。
创建Series
1 | import pandas as pd |
Series基本操作
1 | # 通过索引访问 |
DataFrame:二维表格
DataFrame就是Excel的整张表,有行索引和列名。
创建DataFrame
1 | # 方式1:从字典创建 |
查看数据
1 | # 基本信息 |
数据选择
选择列
1 | # 单列(返回Series) |
选择行
1 | # 按位置(iloc) |
同时选择行列
1 | # loc[行标签, 列标签] |
条件筛选
1 | # 单条件 |
排序和排名
1 | # 按单列排序 |
常用属性
1 | print(df.values) # 转为NumPy数组 |
实战:员工信息管理
1 | import pandas as pd |
下节预告
下一课我们将学习Pandas数据读取与保存,掌握如何导入导出各种格式的数据。
💬 加入学习交流群
扫码加入Python学习交流群,和数千名同学一起进步:
👉 点击加入交流群
群里不定期分享:
- 数据分析实战案例
- Python学习资料
- 求职面试经验
- 行业最新动态
推荐:AI Python数据分析实战营
🎁 限时福利:送《利用Python进行数据分析》实体书
👉 点击了解详情
课程导航
上一篇: NumPy进阶-数学运算
下一篇: Pandas数据读取与保存
PS:Pandas是数据分析的核心。Series和DataFrame这两个概念一定要理解透彻。
