大家好,我是正在实战各种AI项目的程序员晚枫。
今天学习Pandas数据筛选与查询,这是数据分析最频繁的操作。
掌握这5种方法,无论数据量多大,你都能快速找到想要的数据。这些技巧在项目1:销售数据分析报表自动化中会大量使用。
准备数据
1 | import pandas as pd |
方法1:布尔索引(最常用)
1 | # 单条件筛选:金额大于1000的订单 |
方法2:isin - 多值匹配
1 | # 匹配多个产品类别(比多个或条件简洁) |
方法3:query - 类SQL语法
1 | # 简单查询:金额大于1000 |
优点:代码可读性更好,特别是复杂条件时。
方法4:loc - 标签索引
1 | # 设置订单ID为索引(方便演示) |
方法5:iloc - 位置索引
1 | # 第0行 |
字符串匹配筛选
1 | # 产品名称包含"iPhone" |
日期筛选
1 | # 筛选某天的数据 |
高效技巧
1. 链式操作
1 | # 不推荐:多次赋值 |
2. 使用copy避免警告
1 | # 会出现SettingWithCopyWarning |
3. 重置索引
1 | # 筛选后索引不连续 |
实战:销售数据复杂筛选场景
1 | # 场景:找出华东区、电子产品、金额大于3000、由张三或李四销售的高价值订单 |
下节预告
下一课我们将学习数据清洗-处理缺失值,这是数据分析中最重要的环节。干净的输入才有可靠的输出。
💬 加入学习交流群
扫码加入Python学习交流群,和数千名同学一起进步:
👉 点击加入交流群
群里不定期分享:
- 数据分析实战案例
- Python学习资料
- 求职面试经验
- 行业最新动态
推荐:AI Python数据分析实战营
🎁 限时福利:送《利用Python进行数据分析》实体书
👉 点击了解详情
课程导航
上一篇: Pandas数据读取与保存
下一篇: Pandas数据清洗-处理缺失值
PS:数据筛选是日常工作中最高频的操作。熟练掌握这5种方法,效率提升10倍。这些技巧在项目1的销售报表自动化中会大量用到。
