大家好,这里是程序员晚枫,今天给大家分享一个Python自动化办公的新功能:分割PDF。
需求说明
上次在小破站给大家录制的原创课程:《给小白的50讲Python自动化办公》
,里面有一讲是关于PDF转Word的特别热门。
但是那个功能有一个缺点:不能转换扫描件,最近在录制另一套新课程发现了一个值得尝试的解决办法,于是就想找一个扫描版的PDF试一下。
在50讲自动化办公的课程群里一问,热心的学员马上就发出来了。但是这个PDF文件太大了,做测试不方便,我就想把它拆分一下,比如:只要前3页,或者取第10-第30页。
搜了一下已有的PDF自动化办公的库,没找到这个功能,所以就有了今天的代码。
上代码
首先,下载一个PDF自动化办公的专用库:popdf
,命令如下,👇
1 | pip install popdf |
然后直接1行代码搞定,👇
1 | # pip install popdf |
参数说明
- input_path:输入PDF的路径一般用于批量操作
- output_path:输出PDF的路径,一般用于批量操作
- input_file: 输入PDF的文件名,可以包含路径,一般用于单个文件的操作
- output_file:输出结果的文件名,可以包含路径,一般用于单个文件的操作
- input_file_list: 输入PDF的文件列表,一般用于批量操作,例如:合并2个pdf文件