大家好,这里是程序员晚枫,今天给大家分享一个Python自动化办公的新功能:分割PDF。
需求说明
上次在小破站给大家录制的原创课程:《给小白的50讲Python自动化办公》,里面有一讲是关于PDF转Word的特别热门。
但是那个功能有一个缺点:不能转换扫描件,最近在录制另一套新课程发现了一个值得尝试的解决办法,于是就想找一个扫描版的PDF试一下。
在50讲自动化办公的课程群里一问,热心的学员马上就发出来了。但是这个PDF文件太大了,做测试不方便,我就想把它拆分一下,比如:只要前3页,或者取第10-第30页。
搜了一下已有的PDF自动化办公的库,没找到这个功能,所以就有了今天的代码。
上代码
首先,下载一个PDF自动化办公的专用库:popdf
,命令如下,👇
1 | pip install popdf |
然后直接1行代码搞定,👇
1 | # pip install popdf |
参数说明
代码功能:分割pdf文件。
- :param input_path: str, 必填, 输入PDF文件的路径。
- :param output_path: str, 选填, 输出分割后PDF文件的路径,默认为’./output_path/split_pdf.pdf’。
- :param from_page: int, 必填, 起始页码。
- :param to_page: int, 选填, 结束页码,默认为None,不填代表只要一页起始页码。