财务小姐姐哭了:300 张发票,我用这个技能 10 分钟搞定
财务小姐姐哭了:300 张发票,我用这个技能 10 分钟搞定

财务小姐姐哭了:300 张发票,我用这个技能 10 分钟搞定

大家好,我是正在实战各种 AI 项目的程序员晚枫。


😭 上个月,我差点被发票埋了

场景还原

月底报销日,财务小姐姐抱着一箱子发票走到我工位:

"晚枫,听说你会编程,能不能帮个忙……这 300 多张发票,我得录到明天凌晨……"

我低头一看:

  • 增值税专票、普票混在一起
  • 有 PDF 电子版,有手机拍的 JPG
  • 还有几张皱巴巴的纸质扫描件

传统方式(我帮小姐姐试过):

  1. 打开一张发票
  2. 手动输入:发票号码、开票日期、金额、税额……
  3. 粘贴到 Excel
  4. 重复 300 次

时间计算

  • 单张发票录入:2 分钟
  • 300 张发票:300 × 2 = 600 分钟(10 小时)
  • 还得加班到凌晨 1 点

那一刻我明白了:这不是在报销,这是在"报命"。


🎯 现在我发布了这个技能,10 分钟搞定

技能名称poocr-vatinvoice2excel

ClawHub 地址https://clawhub.ai/CoderWanFeng/poocr-vatinvoice2excel

效果预览

1
2
3
4
5
6
7
8
9
10
11
之前:
├─ 300 张发票
├─ 手动录入 10 小时
├─ 腰酸背痛
└─ 还可能录错

现在:
├─ 300 张发票
├─ 自动识别 10 分钟
├─ 喝着咖啡看进度条
└─ Excel 自动整理好,零错误

效率提升60 倍(不是吹,是实测)


📦 这个技能能干什么?

核心功能

  • ✅ 单张发票识别 → 适合临时报销
  • ✅ 批量识别文件夹 → 适合月底集中处理
  • ✅ 支持 PDF、JPG、PNG → 不管什么格式都能吃
  • ✅ 自动提取关键字段:发票号码、开票日期、金额、税额、购买方、销售方……
  • ✅ 直接导出 Excel → 不用二次整理

支持的发票类型

  • 增值税普通发票
  • 增值税专用发票
  • 增值税电子专票
  • 增值税电子普票
  • 电子发票(普通/专用)

识别字段(全字段提取):

字段说明
发票代码10 位或 12 位代码
发票号码8 位号码
开票日期自动格式化
合计金额不含税金额
合计税额自动计算核对
价税合计总金额
购买方信息名称、税号、地址、电话、开户行
销售方信息同上
明细条目商品名称、规格、数量、单价

🛠️ 安装和使用(5 分钟上手)

第一步:安装依赖

1
pip install poocr

就一行命令,不用折腾环境,不用配置路径。

第二步:获取腾讯云 API 密钥

访问腾讯云控制台获取密钥:https://curl.qcloud.com/9ExTmaya

步骤

  1. 注册/登录腾讯云账号
  2. 搜索"文字识别"
  3. 进入控制台 → 密钥管理
  4. 新建密钥,保存 SecretId 和 SecretKey

注意:密钥要保管好,别发到群里(别问我怎么知道的……)

第三步:单张发票识别

1
2
3
4
5
6
7
8
import poocr

poocr.ocr2excel.VatInvoiceOCR2Excel(
input_path='发票文件路径.pdf',
output_path='输出目录',
id='你的 SecretId',
key='你的 SecretKey'
)

运行后

1
发票识别完成,结果已保存到:/path/to/output/发票识别结果.xlsx

打开 Excel,所有字段整整齐齐:

发票代码发票号码开票日期金额税额价税合计
011002100113123456782026-03-151000.00130.001130.00

第四步:批量识别(这才是大招)

1
2
3
4
5
6
7
8
import poocr

poocr.ocr2excel.VatInvoiceOCR2Excel(
input_path='发票文件夹路径', # 放 300 张发票的文件夹
output_path='输出目录',
id='你的 SecretId',
key='你的 SecretKey'
)

效果

  • 自动遍历文件夹里所有发票文件
  • 一张一张识别
  • 合并到一个 Excel 里
  • 每张发票一行,字段对齐

你只需要

  1. 把发票全丢进一个文件夹
  2. 运行脚本
  3. 等 10 分钟
  4. 收工

💼 真实使用场景(不只是财务报销)

场景 1:财务报销(最常用)

之前

  • 员工交发票 → 财务手工录入 → 核对 → 打款
  • 月底集中处理,加班到深夜

现在

  • 员工交发票(电子版直接发,纸质版拍照)
  • 运行技能 → 10 分钟识别完
  • 自动核对金额 → 打款

时间节省:从 10 小时 → 10 分钟

场景 2:税务申报

之前

  • 整理进项发票、销项发票
  • 手动汇总数据
  • 填写申报表

现在

  • 发票分类放两个文件夹
  • 批量识别,自动汇总
  • 导出 Excel 直接导入税务系统

效率提升:申报时间从 1 天 → 1 小时

场景 3:审计工作

之前

  • 抽查发票 → 手动核对
  • 样本量有限,容易漏问题

现在

  • 全量识别所有发票
  • 自动比对异常数据
  • 问题发票自动标记

审计覆盖率:从抽样 10% → 全量 100%

场景 4:数据录入外包

之前

  • 接一单发票录入活
  • 雇人手工录,成本占 70%
  • 利润薄,还容易出错

现在

  • 接活 → 批量识别 → 交付
  • 成本几乎为零
  • 利润率提升 5 倍

一个朋友实测:用这个技能接发票录入外包,一个月多赚 2 万。


📊 实测数据(不吹不黑)

测试环境

  • 发票数量:300 张
  • 发票类型:混合(专票、普票、电子版、拍照版)
  • 电脑配置:普通笔记本(i5, 16G)

测试结果

指标数值
总耗时9 分 47 秒
平均单张1.9 秒
识别准确率98.3%
错误发票5 张(拍照模糊)
Excel 生成自动完成

准确率说明

  • 98.3% 的发票字段完全正确
  • 5 张错误发票都是因为拍照太模糊(反光、折叠、光线暗)
  • 重新拍照后识别成功

建议

  • 电子版 PDF 发票:准确率接近 100%
  • 拍照发票:确保光线充足、平整、无反光

💡 进阶用法(封装成类)

如果你想集成到自己的系统里,可以这样封装:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
import poocr
import os

class InvoiceOCR:
def __init__(self, secret_id, secret_key):
self.SecretId = secret_id
self.SecretKey = secret_key

def recognize_invoice(self, input_path, output_path):
"""识别发票并导出 Excel"""
if not os.path.exists(input_path):
raise FileNotFoundError(f"文件不存在:{input_path}")

poocr.ocr2excel.VatInvoiceOCR2Excel(
input_path=input_path,
output_path=output_path,
id=self.SecretId,
key=self.SecretKey
)

print(f"发票识别完成,结果已保存到:{output_path}")

# 使用示例
if __name__ == "__main__":
ocr = InvoiceOCR(
secret_id="你的 SecretId",
secret_key="你的 SecretKey"
)

ocr.recognize_invoice(
input_path="../test_files/VatInvoiceOCR",
output_path="../test_files/VatInvoiceOCR"
)

好处

  • 密钥管理更安全
  • 可以集成到 Web 系统
  • 方便扩展功能(比如自动邮件发送结果)

⚠️ 注意事项(踩坑提醒)

  1. 密钥安全

    • SecretId 和 SecretKey 别硬编码在代码里
    • 用环境变量或配置文件
    • 别上传到 GitHub(别问我怎么知道的……)
  2. 图片质量

    • 拍照发票确保光线充足
    • 避免反光、折叠、模糊
    • 能用 PDF 就用 PDF,准确率更高
  3. API 额度

    • 腾讯云 OCR 有免费额度(每月 1000 次)
    • 超出后按量计费(很便宜,几分钱一次)
    • 批量处理前确认额度够用
  4. 网络环境

    • 需要联网调用腾讯云 API
    • 公司内网可能需要配置代理
    • 批量处理时确保网络稳定

🎯 适合人群

强烈推荐

  • ✅ 财务人员(月底报销不再加班)
  • ✅ 审计人员(全量发票分析)
  • ✅ 税务代理(批量处理客户发票)
  • ✅ 外包团队(发票录入业务)
  • ✅ 开发者(集成到自己的系统)

可以考虑

  • ⭐ 个体户(自己处理进项发票)
  • ⭐ 学生(学习 OCR 技术应用)

暂不推荐

  • ❌ 每月只有几张发票的个人(手动录更快)
  • ❌ 完全不懂 Python 的小白(需要基础编程知识)

📈 成本核算(帮你算笔账)

腾讯云 OCR 定价

  • 免费额度:1000 次/月
  • 超出后:0.035 元/次

场景:每月处理 3000 张发票

1
2
3
免费额度:1000 次 → 0 元
超出部分:2000 次 × 0.035 元 = 70 元
总成本:70 元/月

对比人工成本

  • 人工录入:3000 张 × 2 分钟 = 100 小时
  • 按 50 元/小时计算:5000 元
  • 节省:5000 - 70 = 4930 元/月

一年省下:4930 × 12 = 59160 元

这还不算加班费、错误成本、时间成本……


💬 最后的建议

给财务人员的建议

  1. 学会这个技能,月底不再加班
  2. 把重复工作交给 AI,你来做分析和决策
  3. 提升自己在公司的价值(会编程的财务更值钱)

给开发者的建议

  1. 可以集成到公司财务系统
  2. 可以做成 SaaS 服务收费
  3. 可以接外包单赚钱

给老板的建议

  1. 给财务团队配这个技能,加班费都省了
  2. 效率提升,员工满意度也提升
  3. 几十块的 API 成本,换来几千块的人工节省

📚 相关资源

技能地址

腾讯云 OCR

poocr 库

  • PyPI: (搜索 poocr)
  • 文档:(技能页面有示例)

💬 联系我

平台账号/链接
微信扫码加好友
微博@程序员晚枫
知乎@程序员晚枫
抖音@程序员晚枫
小红书@程序员晚枫
B 站Python 自动化办公社区

主营业务:AI 编程培训、企业内训、技术咨询


🎓 推荐课程


AI 的价值,从来不只在于它能"说"多少,更在于它能"感知"多少。

当你的 AI 助手能够真正"看懂"发票,从被动的问答工具蜕变为主动的智能伙伴——那种感觉,真的回不去了。

财务小姐姐说:这个技能,救了我的命。

你呢?准备好让 AI 帮你打工了吗?💪


P.S. 有财务朋友问我:会不会失业?我说:不会编程的财务会,会编程的财务不会。工具永远在淘汰不用工具的人。

🎓 AI 编程实战课程

想系统学习 AI 编程?程序员晚枫的 AI 编程实战课 帮你从零上手!