别再手动录发票了!这个 Python 技能,让财务提前 2 小时下班
别再手动录发票了!这个 Python 技能,让财务提前 2 小时下班

别再手动录发票了!这个 Python 技能,让财务提前 2 小时下班

大家好,我是正在实战各种 AI 项目的程序员晚枫。


🕔 下午 6 点,财务室还亮着灯

这一幕你肯定见过:

月底了,大家都收拾东西准备下班。

只有财务室的灯还亮着。

走近一看——财务小姐姐对着堆积如山的发票,一张一张往 Excel 里敲:

  • 发票代码
  • 发票号码
  • 开票日期
  • 金额
  • 税额
  • ……

我问她:"每天录到几点?"

她说:"看发票多少,少的话 8 点,多的话……凌晨吧。"

那一刻我决定:一定要帮她解决这个问题。


🎯 现在我发布了这个技能

技能名称poocr-vatinvoice2excel

ClawHub 地址https://clawhub.ai/CoderWanFeng/poocr-vatinvoice2excel

效果

1
2
3
4
5
6
7
8
9
10
11
之前:
├─ 每天录发票到 8 点
├─ 月底加班到凌晨
├─ 眼睛干涩,手腕酸痛
└─ 还怕录错被老板骂

现在:
├─ 下午 4 点开始识别
├─ 4 点 10 分完成
├─ 喝茶摸鱼等下班
└─ 准确率 98%+,老板还夸我效率高

时间节省:每天提前 2 小时下班,一个月多休 40 小时。


📦 技能核心功能

一句话总结:把发票(PDF/图片)丢进去,Excel 表格吐出来。

支持格式

  • ✅ PDF 电子发票
  • ✅ JPG 拍照发票
  • ✅ PNG 截图发票
  • ✅ 单张识别
  • ✅ 批量识别(文件夹)

提取字段

字段类型具体字段
基础信息发票代码、发票号码、开票日期
金额信息金额、税额、价税合计
购买方名称、税号、地址、电话、开户行
销售方名称、税号、地址、电话、开户行
明细商品名称、规格、数量、单价、金额

输出格式:Excel(.xlsx),直接用 Excel 打开就能用。


🛠️ 5 分钟上手教程

第一步:安装

1
pip install poocr

第二步:获取腾讯云密钥

访问:https://curl.qcloud.com/9ExTmaya

  1. 登录腾讯云
  2. 搜索"文字识别"
  3. 控制台 → 密钥管理 → 新建密钥
  4. 保存 SecretId 和 SecretKey

免费额度:每月 1000 次(够用好久)

第三步:运行代码

单张发票

1
2
3
4
5
6
7
8
import poocr

poocr.ocr2excel.VatInvoiceOCR2Excel(
input_path='invoice.pdf',
output_path='./output',
id='你的 SecretId',
key='你的 SecretKey'
)

批量发票

1
2
3
4
5
6
7
8
import poocr

poocr.ocr2excel.VatInvoiceOCR2Excel(
input_path='./invoices', # 文件夹路径
output_path='./output',
id='你的 SecretId',
key='你的 SecretKey'
)

运行后

1
发票识别完成,结果已保存到:./output/发票识别结果.xlsx

💼 真实案例:从 3 小时到 3 分钟

用户反馈(某公司财务主管):

"我们公司有 5 个销售,每周交一次发票。以前我每周五下午都要花 3 小时录入,现在……3 分钟搞定。"

具体数据

  • 每周发票数量:约 50 张
  • 之前耗时:3 小时(180 分钟)
  • 现在耗时:3 分钟
  • 效率提升:60 倍

她说:"现在周五下午我可以提前去接孩子了,这个技能真的改变了我的生活。"


📊 成本对比(帮你算笔账)

人工录入成本

  • 单张发票:2 分钟
  • 月薪 5000 元的财务,时薪约 30 元
  • 单张发票人工成本:30 元 ÷ 30 张/小时 = 1 元/张

OCR 识别成本

  • 腾讯云免费额度:1000 次/月
  • 超出后:0.035 元/次
  • 平均成本:约 0.035 元/张

成本对比

方式单张成本1000 张成本
人工1 元1000 元
OCR0.035 元35 元
节省96.5%965 元

一年省下:965 × 12 = 11580 元

这还不算加班费、错误成本、员工满意度……


⚠️ 常见问题(FAQ)

Q1:识别准确率怎么样?

A:电子版 PDF 发票接近 100%,拍照发票约 98%(模糊的会低一些)。

建议:尽量用电子版,拍照要清晰。

Q2:需要编程基础吗?

A:需要一点点 Python 基础,但代码就几行,复制粘贴改路径就行。

不会编程怎么办:可以找会编程的同事帮忙,或者参加我们的培训课(文末有链接)。

Q3:密钥安全吗?

A:密钥是调用腾讯云 API 的凭证,要保管好。

安全建议

  • 不要硬编码在代码里
  • 用环境变量或配置文件
  • 不要上传到 GitHub

Q4:一个月能识别多少张?

A:免费额度 1000 次/月,超出后按量计费(0.035 元/次)。

大部分中小企业:免费额度够用。

发票多的企业:费用也很低,10000 张才 350 元。


🎯 适合谁用?

强烈推荐

  • ✅ 企业财务(月底报销不再痛苦)
  • ✅ 财务外包公司(批量处理客户发票)
  • ✅ 税务代理(进项销项快速整理)
  • ✅ 审计公司(全量发票分析)
  • ✅ 开发者(集成到财务系统)

可以考虑

  • ⭐ 个体户(自己处理进项票)
  • ⭐ 自由职业者(报销自己的发票)

不适合

  • ❌ 每月只有几张发票的个人(手动更快)
  • ❌ 完全不想学任何新工具的人

💡 进阶玩法

玩法 1:集成到公司 OA 系统

1
2
3
4
5
6
7
8
9
10
11
12
13
14
# 伪代码示例
@app.route('/upload_invoice', methods=['POST'])
def upload_invoice():
file = request.files['invoice']
file.save('/tmp/invoice.pdf')

poocr.ocr2excel.VatInvoiceOCR2Excel(
input_path='/tmp/invoice.pdf',
output_path='/output',
id=SECRET_ID,
key=SECRET_KEY
)

return send_file('/output/结果.xlsx')

效果:员工上传发票 → 系统自动识别 → 财务直接审核。

玩法 2:定时任务自动处理

1
2
3
4
5
6
7
8
9
10
11
12
13
14
from apscheduler.schedulers.blocking import BlockingScheduler

scheduler = BlockingScheduler()

@scheduler.scheduled_job('cron', hour=16) # 每天下午 4 点
def auto_process_invoices():
poocr.ocr2excel.VatInvoiceOCR2Excel(
input_path='/inbox/invoices',
output_path='/output',
id=SECRET_ID,
key=SECRET_KEY
)

scheduler.start()

效果:每天自动处理新发票,财务上班就能看到整理好的 Excel。

玩法 3:自动邮件发送结果

1
2
3
4
5
6
7
8
9
10
11
12
import smtplib
from email.mime.multipart import MIMEMultipart
from email.mime.base import MIMEBase

def send_result_email(output_path, recipient):
# 发送邮件逻辑
...
print(f"结果已发送到:{recipient}")

# 识别完成后自动发送
poocr.ocr2excel.VatInvoiceOCR2Excel(...)
send_result_email(output_path, 'finance@company.com')

效果:识别完成自动邮件通知,财务不用盯着进度条。


📚 相关资源

技能地址

腾讯云 OCR

poocr 库

  • 安装:pip install poocr
  • 文档:技能页面有示例代码

💬 联系我

平台账号/链接
微信扫码加好友
微博@程序员晚枫
知乎@程序员晚枫
抖音@程序员晚枫
小红书@程序员晚枫
B 站Python 自动化办公社区

主营业务:AI 编程培训、企业内训、技术咨询


🎓 推荐课程


工具永远在淘汰不用工具的人。

当你的同事还在加班录发票,你已经提前 2 小时下班去健身、陪家人、学习新技能——这就是差距。

别等,现在就行动。


P.S. 那个财务小姐姐现在已经不加班了,上周还去报了我们的 Python 自动化课程。她说:不想一辈子只做录入工作,要学会用工具提升价值。

为她点赞。👍

🎓 AI 编程实战课程

想系统学习 AI 编程?程序员晚枫的 AI 编程实战课 帮你从零上手!