AI编程太狠了！我认怂了——以前1个月的活，现在1晚搞定

2026-01-12

more >>

展开全文 >>

0基础也能搞定AI编程！我花3个月打磨的30讲训练营，带你从小白到独立部署项目，还能搞副业！

2026-01-11

more >>

展开全文 >>

python-office库中，pdf转word怎么用？

2026-01-10

👉 项目官网：https://www.python-office.com/ 👈

👉 本开源项目的交流群 👈

大家好，这里是程序员晚枫，正在all in AI编程实战，小红书/小破站都叫这个名。

pdf2docx 使用说明

功能简介

pdf2docx 用于将 PDF 文件转换为 Word（.docx）文档。
支持：

单个 PDF 文件转换为单个 DOCX 文件
通过输入输出目录进行批量转换（依赖底层 popdf.pdf2docx 的实现）
保持对旧参数 file_path 的向后兼容（已弃用，不推荐继续使用）

函数签名

from office.api.pdf import pdf2docx

pdf2docx(
    input_file: str | None = None,
    output_file: str | None = None,
    input_path: str | None = None,
    output_path: str = '.',
    file_path: str | None = None,  # 已弃用
)

参数说明

input_file：
- 类型：str
- 说明：输入的单个 PDF 文件路径（包含文件名和扩展名）。
- 示例："D:/docs/input.pdf"
- 注意：当前实现中，这是必填参数（除非你依赖底层 popdf 的目录模式，用 input_path + output_path）。
output_file：
- 类型：str，可选
- 说明：输出的单个 Word 文件完整路径（包含文件名和 .docx 扩展名）。
- 若传入该参数，则优先使用此路径作为输出文件位置。
input_path：
- 类型：str，可选
- 说明：批量转换时的 PDF 输入目录路径。
- 使用方式取决于底层 popdf.pdf2docx 的具体实现（目录批量模式）。
output_path：
- 类型：str，可选，默认值：'.'
- 说明：
  - 当只传 input_file 且未传 output_file 时：
    函数会自动将输出文件路径设置为
    output_path + input_file 的文件名（去掉原扩展名，追加 .docx）。
    例如：
    - input_file="D:/docs/a.pdf"
    - output_path="E:/out"
    - 最终输出：E:/out/a.docx
  - 当使用目录模式时（input_path + output_path），会传递给底层 popdf.pdf2docx 进行处理。
file_path（已弃用）：
- 类型：str，可选
- 说明：旧版使用的 PDF 输入路径参数，已被 input_file 替代。
- 当前行为：
  - 如果传入了 file_path，且未传 input_file，函数会自动将 file_path 的值赋给 input_file，并发出 DeprecationWarning 警告。
  - 新代码中不推荐继续使用 file_path，请统一改为 input_file。

调用优先级与分支逻辑

根据当前实现，参数组合的处理顺序如下：

处理弃用参数 file_path
- 如果 file_path 不为 None 且 input_file 为空：
  - 发出弃用警告
  - 用 file_path 填充 input_file

必须提供 input_file

若最终 input_file 仍为 None：

直接抛出：

1	ValueError("必须提供 input_file 参数来指定PDF文件路径")

优先使用 input_file + output_path 模式（当前兼容路径组合逻辑）

if input_file is not None and output_path is not None:
    input_path_obj = Path(input_file)
    output_file = str(Path(output_path) / f"{input_path_obj.stem}.docx")
    popdf.pdf2docx(input_file=input_file, output_file=output_file)

若显式提供了 output_file，则优先使用：

1 2	elif input_file is not None and output_file is not None: popdf.pdf2docx(input_file=input_file, output_file=output_file)

目录模式（依赖底层库的批量实现）：

1 2	elif input_path is not None and output_path is not None: popdf.pdf2docx(input_path=input_path, output_path=output_path)

使用示例

1. 最常用：单个 PDF → 同名 DOCX（指定输出目录）

from office.api.pdf import pdf2docx

pdf2docx(
    input_file=r"D:\docs\report.pdf",
    output_path=r"D:\output"
)
# 结果：在 D:\output 目录下生成 report.docx

2. 单个 PDF → 指定完整输出文件名

from office.api.pdf import pdf2docx

pdf2docx(
    input_file=r"D:\docs\report.pdf",
    output_file=r"D:\output\my_report_v2.docx"
)
# 结果：生成 D:\output\my_report_v2.docx

3. 兼容旧代码：使用已弃用的 `file_path`

from office.api.pdf import pdf2docx

pdf2docx(
    file_path=r"D:\docs\old_api.pdf",
    output_path=r"D:\output"
)
# 行为等同于：
# pdf2docx(input_file=r"D:\docs\old_api.pdf", output_path=r"D:\output")
# 同时会抛出 DeprecationWarning，提示不要再使用 file_path

4. 目录模式（依赖底层 popdf 行为）

from office.api.pdf import pdf2docx

pdf2docx(
    input_path=r"D:\pdf_folder",
    output_path=r"D:\output_folder"
)
# 具体批量转换行为由 popdf.pdf2docx 决定

如果你希望，我可以再帮你把这份使用文档，整理成适合直接放到 README / API 文档里的 Markdown 版本（当前答案已经基本是 Markdown 格式，你可以直接复制过去用）。

以上所有仓库的功能介绍，我都加入了原创课程:给小白的《50讲Python自动化办公》都是1行Python代码就能实现的，适合纯小白的课程，需要可以加入学习哟~

加入学习👉给小白的《50讲Python自动化办公》

大家学习或使用代码过程中，有任何问题，都可以加入读者群交流哟~👇

程序员晚枫专注AI编程培训，小白看完他的教程《30讲 · AI编程训练营》就能上手做AI项目。

展开全文 >>

学AI，一定要学Python吗？

2026-01-10

👉 项目官网：https://www.python-office.com/ 👈

👉 本开源项目的交流群 👈

more >>

展开全文 >>

AI怎么学？

2026-01-10

👉 项目官网：https://www.python-office.com/ 👈

👉 本开源项目的交流群 👈

more >>

展开全文 >>

AI怎么学？

2026-01-10

👉 项目官网：https://www.python-office.com/ 👈

👉 本开源项目的交流群 👈

more >>

展开全文 >>

AI怎么学？

2026-01-10

👉 项目官网：https://www.python-office.com/ 👈

👉 本开源项目的交流群 👈

more >>

展开全文 >>

AI怎么学？

2026-01-10

👉 项目官网：https://www.python-office.com/ 👈

👉 本开源项目的交流群 👈

more >>

展开全文 >>

传统行业进行AI转型，痛点是什么？

2026-01-10

👉 项目官网：https://www.python-office.com/ 👈

👉 本开源项目的交流群 👈

more >>

展开全文 >>

打工人想自由，能不能从拒绝加班开始？

2026-01-09

more >>

展开全文 >>

几十亿美元收购Manus，为何Meta认为智能体是下一代AI的核心？

2026-01-09

more >>

展开全文 >>

2026，Build in Public，才是属于普通程序员的突破之路

2026-01-07

more >>

展开全文 >>

当算法失去人性，马斯克给出了答案

2026-01-06

more >>

展开全文 >>

何同学的魔法钢琴，一点用都没有

2026-01-04

more >>

展开全文 >>

16万粉里程碑｜我的6年B站之路与AI转型，送你一份特别的礼物

2026-01-04

more >>

展开全文 >>

屏幕录制太枯燥？我又付费了一款AI神器，让视频“电影感”拉满！

2026-01-04

more >>

展开全文 >>

面向AI编程，如何让AI理解你的项目？

2026-01-03

more >>

展开全文 >>

10年护照到期了，盘点我去过的国家，平行宇宙里的我过得好吗？

2026-01-01

more >>

展开全文 >>

2025，混乱的一年，觉醒的一年

2025-12-29

more >>

展开全文 >>

讯飞星辰Agent平台

2025-12-28

白开水AI社区，让AI知识不烫手。

欢迎参加本次直播，手把手带你搭建一个聊天Agent。

直播之前请完成下面2个事情：

开通账号

扫码下图，直达讯飞Agent平台，直播时跟我一起操作

点我免费注册

加入直播群

加入直播微信群，直播时获取资料，直播后操作答疑

直播搭建的智能体

我发现了程序员晚枫的客服，快试试和ta对话吧！https://agent.xfyun.cn/chat?sharekey=702423e9ded20544c4548f166e5d7c0b&botId=4486091

成立于2025年12月，目前有各类AI教程，每月都有AI直播。

直播记录

第一时间参与直播，和我们一对一的交流沟通，欢迎加入我们的：AI学习交流群 · 长期有效

场次	直播录制	海报	直播视频	主讲人	筹备组
2025.11上	用 AI 开发一个PDF转Word的办公软件，并打包成了exe	—	查看	晚枫	晚枫
2025.11下	我是怎么用AI自动化写文章、剪视频的？	查看	查看	晚枫	昭意
2025.12.14	人人都可以AI编程，10大功能现场揭秘！	查看	查看	晚枫	昭意

社区课程

联合创始人

晚枫：
- B站：Python自动化办公社区
- 公众号：晚枫AI学习笔记
昭意：
小红书：昭意777
- 公众号：有猫的昭意

线下活动

时间	地点	官宣信息	白开水AI的分享主题
2025.11.29	重庆光电园	G-Star Gathering Day 重庆站来袭！	待整理
2025.12.5	西南大学（北碚校区）	AI + 开源双重 buff！AtomGit 源启高校西南大学站，12 月 5 日邀你解锁 Coding 新姿势～	AtomGit“源启高校”西南大学站活动圆满结束
2025.12.11	阿里中心 · 重庆	【线下活动】Qoder MeetUP · 重庆阿里中心	用Qoder打造开源项目，我悄然进化成六边形战士

采访

更多社区动态，请关注：公众号 - 白开水AI

联系我们

程序员晚枫专注AI编程培训，小白看完他的教程《30讲 · AI编程训练营》就能上手做AI项目。

展开全文 >>

pdf2docx 使用说明

功能简介

函数签名

参数说明

调用优先级与分支逻辑

使用示例

1. 最常用：单个 PDF → 同名 DOCX（指定输出目录）

2. 单个 PDF → 指定完整输出文件名

3. 兼容旧代码：使用已弃用的 file_path

4. 目录模式（依赖底层 popdf 行为）

开通账号

加入直播群

直播搭建的智能体

直播记录

社区课程

联合创始人

昭意：

线下活动

采访

联系我们

3. 兼容旧代码：使用已弃用的 `file_path`