👉 项目官网:https://www.python-office.com/ 👈
👉 本开源项目的交流群 👈
大家好,这里是程序员晚枫,正在all in AI编程实战,小红书/小破站都叫这个名。
pdf2docx 用于将 PDF 文件转换为 Word(.docx)文档。
支持:
popdf.pdf2docx 的实现)file_path 的向后兼容(已弃用,不推荐继续使用)1 | from office.api.pdf import pdf2docx |
input_file:
str "D:/docs/input.pdf" popdf 的目录模式,用 input_path + output_path)。output_file:
str,可选 .docx 扩展名)。 input_path:
str,可选 popdf.pdf2docx 的具体实现(目录批量模式)。output_path:
str,可选,默认值:'.' input_file 且未传 output_file 时:output_path + input_file 的文件名(去掉原扩展名,追加 .docx)。input_file="D:/docs/a.pdf" output_path="E:/out" E:/out/a.docx input_path + output_path),会传递给底层 popdf.pdf2docx 进行处理。file_path(已弃用):
str,可选 input_file 替代。 file_path,且未传 input_file,函数会自动将 file_path 的值赋给 input_file,并发出 DeprecationWarning 警告。 file_path,请统一改为 input_file。根据当前实现,参数组合的处理顺序如下:
处理弃用参数 file_path
file_path 不为 None 且 input_file 为空: file_path 填充 input_file必须提供 input_file
input_file 仍为 None: 1 | ValueError("必须提供 input_file 参数来指定PDF文件路径") |
优先使用 input_file + output_path 模式(当前兼容路径组合逻辑)
1 | if input_file is not None and output_path is not None: |
若显式提供了 output_file,则优先使用:
1 | elif input_file is not None and output_file is not None: |
目录模式(依赖底层库的批量实现):
1 | elif input_path is not None and output_path is not None: |
1 | from office.api.pdf import pdf2docx |
1 | from office.api.pdf import pdf2docx |
file_path1 | from office.api.pdf import pdf2docx |
1 | from office.api.pdf import pdf2docx |
如果你希望,我可以再帮你把这份使用文档,整理成适合直接放到 README / API 文档里的 Markdown 版本(当前答案已经基本是 Markdown 格式,你可以直接复制过去用)。
以上所有仓库的功能介绍,我都加入了原创课程:给小白的《50讲Python自动化办公》都是1行Python代码就能实现的,适合纯小白的课程,需要可以加入学习哟~
大家学习 或 使用代码过程中,有任何问题,都可以加入读者群交流哟~👇


程序员晚枫专注AI编程培训,小白看完他的教程《30讲 · AI编程训练营》就能上手做AI项目。
白开水AI社区,让AI知识不烫手。
欢迎参加本次直播,手把手带你搭建一个聊天Agent。
直播之前请完成下面2个事情:
扫码下图,直达讯飞Agent平台,直播时跟我一起操作

加入直播微信群,直播时获取资料,直播后操作答疑
我发现了程序员晚枫的客服,快试试和ta对话吧!https://agent.xfyun.cn/chat?sharekey=702423e9ded20544c4548f166e5d7c0b&botId=4486091
成立于2025年12月,目前有各类AI教程,每月都有AI直播。
第一时间参与直播,和我们一对一的交流沟通,欢迎加入我们的:AI学习交流群 · 长期有效
| 场次 | 直播录制 | 海报 | 直播视频 | 主讲人 | 筹备组 |
|---|---|---|---|---|---|
| 2025.11上 | 用 AI 开发一个PDF转Word的办公软件,并打包成了exe | — | 查看 | 晚枫 | 晚枫 |
| 2025.11下 | 我是怎么用AI自动化 写文章、剪视频的? | 查看 | 查看 | 晚枫 | 昭意 |
| 2025.12.14 | 人人都可以AI编程,10大功能现场揭秘! | 查看 | 查看 | 晚枫 | 昭意 |
| 时间 | 地点 | 官宣信息 | 白开水AI的分享主题 |
|---|---|---|---|
| 2025.11.29 | 重庆光电园 | G-Star Gathering Day 重庆站来袭! | 待整理 |
| 2025.12.5 | 西南大学(北碚校区) | AI + 开源双重 buff!AtomGit 源启高校西南大学站,12 月 5 日邀你解锁 Coding 新姿势~ | AtomGit“源启高校”西南大学站活动圆满结束 |
| 2025.12.11 | 阿里中心 · 重庆 | 【线下活动】Qoder MeetUP · 重庆阿里中心 | 用Qoder打造开源项目,我悄然进化成六边形战士 |
更多社区动态,请关注:公众号 - 白开水AI
程序员晚枫专注AI编程培训,小白看完他的教程《30讲 · AI编程训练营》就能上手做AI项目。
tag:
缺失模块。
1、请确保node版本大于6.2
2、在博客根目录(注意不是yilia根目录)执行以下命令:
npm i hexo-generator-json-content --save
3、在根目录_config.yml里添加配置:
jsonContent:
meta: false
pages: false
posts:
title: true
date: true
path: true
text: false
raw: false
content: false
slug: false
updated: false
comments: false
link: false
permalink: false
excerpt: false
categories: false
tags: true