大家好,我是正在实战各种AI项目的程序员晚枫。
今天学习Pandas的数据读写功能。
在实际工作中,数据可能来自各种地方:Excel表格、CSV文件、数据库、API接口。掌握数据的导入导出,是数据分析的第一步。
读取CSV文件
CSV是最常见的数据格式,纯文本,兼容性好。
基础读取
1 | import pandas as pd |
常用参数
1 | df = pd.read_csv('data.csv', |
中文编码问题
1 | # 如果中文乱码,尝试不同编码 |
读取Excel文件
安装依赖
1 | pip install openpyxl xlrd |
基础读取
1 | # 读取第一个sheet |
常用参数
1 | df = pd.read_excel('data.xlsx', |
保存数据
保存为CSV
1 | # 基础保存 |
保存为Excel
1 | # 基础保存 |
读取其他格式
JSON
1 | # 读取JSON |
SQL数据库
1 | from sqlalchemy import create_engine |
大数据分块读取
1 | # 当文件太大,内存不够时 |
实战:批量处理Excel报表
1 | import pandas as pd |
下节预告
下一课我们将学习数据筛选与查询,这是数据分析的核心技能。
💬 加入学习交流群
扫码加入Python学习交流群,和数千名同学一起进步:
👉 点击加入交流群
群里不定期分享:
- 数据分析实战案例
- Python学习资料
- 求职面试经验
- 行业最新动态
推荐:AI Python数据分析实战营
🎁 限时福利:送《利用Python进行数据分析》实体书
👉 点击了解详情
课程导航
上一篇: Pandas入门-Series和DataFrame
下一篇: 数据筛选与查询
PS:数据的导入导出是分析的第一步。熟练掌握这些操作,能帮你节省大量时间。
