哈喽啊,不知道你们发现没有,百度又有新功能了。话不多说,上图!
我们从长期趋势来看,很多国家和地区的离婚率越来越高,对应的也加重了我们的工作量。辣么有没有什么办法可以帮助我们从冗杂的工作中解放出来呢? 答案是有滴!
一、1行黑科技
📍 1.1 安装库
【pobd】库是基于百度的API实现各种证件识别并且生成Excel文件的Python库。
1 | pip install pobd |
📍 1.2 1行代码
1 |
|
只需这2步,就可以轻松解决这个问题啦!而我们的老朋友 api_key 和 secret_key ,不知道怎么申请的伙伴们,留言区见!
二、爱提问的朋友就要问了:How ?
1、调接口
1 | base64_image = self.image_to_base64(img_path) |
就会得到像这样的数据
1 | "words_result": { |
2、洗数据
1 | "姓名_男": res['words_result'].get("姓名_男", [{}])[0].get("word", ""), |
结构化提取字段 → 转成 DataFrame
3.成表格
1 | df.to_excel('离婚证信息.xlsx', index=False) |
以上,就完成工作啦。