我帮公司省了 6 万块!发票 OCR 自动化实战复盘
我帮公司省了 6 万块!发票 OCR 自动化实战复盘

我帮公司省了 6 万块!发票 OCR 自动化实战复盘

大家好,我是正在实战各种 AI 项目的程序员晚枫。


💰 去年,老板把我叫进办公室

"晚枫,公司今年要降本增效,你有什么想法?"

我想了想,说:"我先去财务看看。"

这一看,看出了大问题

  • 财务部 3 个人,月底集体加班
  • 每人每月录入发票 1000+ 张
  • 加班费 + 人力成本,一年至少 6 万
  • 还经常录错,对账对到崩溃

我当时就想:这活,AI 能干啊。


🎯 3 个月后,效果出来了

投入

  • 开发时间:2 天
  • API 成本:70 元/月(腾讯云 OCR)
  • 培训成本:1 小时(教财务用脚本)

产出

  • 月底加班费:从 3000 元/月 → 0 元
  • 人力释放:3 人 × 10 小时/月 = 30 小时
  • 错误率:从 3% → 0.2%
  • 财务满意度:从"想离职" → "想加薪"(开玩笑)

一年算账

1
2
3
4
5
6
加班费节省:3000 × 12 = 36000 元
人力成本节省:30 小时 × 50 元 × 12 = 18000 元
错误成本节省:约 6000 元(对账、返工)
API 成本:70 × 12 = 840 元

总节省:36000 + 18000 + 6000 - 840 = 59160 元

接近 6 万块,就用了 2 天开发时间。

老板说:"这种项目,再来 10 个。"


📦 我用的是什么技能?

技能名称poocr-vatinvoice2excel

ClawHub 地址https://clawhub.ai/CoderWanFeng/poocr-vatinvoice2excel

核心逻辑

1
2
3
4
5
6
7
8
9
发票文件(PDF/图片)

腾讯云 OCR 识别

提取关键字段

写入 Excel 表格

财务直接使用

代码就几行

1
2
3
4
5
6
7
8
import poocr

poocr.ocr2excel.VatInvoiceOCR2Excel(
input_path='发票文件夹',
output_path='输出目录',
id='SecretId',
key='SecretKey'
)

就这么简单,但省了 6 万块。


🛠️ 实施过程(完整复盘)

第一阶段:调研(1 天)

任务

  1. 去财务室观察工作流程
  2. 记录每张发票录入时间
  3. 统计每月发票数量
  4. 计算当前成本

发现

  • 单张录入:2 分钟
  • 每月总量:3000 张
  • 总耗时:100 小时
  • 人力成本:5000 元/月

结论:值得自动化。

第二阶段:开发(1 天)

任务

  1. 申请腾讯云 OCR 账号
  2. 测试识别准确率
  3. 编写批量处理脚本
  4. 封装成易用的函数

代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
import poocr
import os
from datetime import datetime

class InvoiceAutomation:
def __init__(self, secret_id, secret_key):
self.secret_id = secret_id
self.secret_key = secret_key

def process_monthly_invoices(self, month):
"""处理指定月份的发票"""
input_path = f'./invoices/{month}'
output_path = f'./output/{month}'

if not os.path.exists(input_path):
print(f"未找到 {month} 的发票文件夹")
return

poocr.ocr2excel.VatInvoiceOCR2Excel(
input_path=input_path,
output_path=output_path,
id=self.secret_id,
key=self.secret_key
)

print(f"{month} 月份发票处理完成")

# 使用
automation = InvoiceAutomation('SecretId', 'SecretKey')
automation.process_monthly_invoices('2026-03')

测试

  • 用 100 张历史发票测试
  • 准确率:98.5%
  • 速度:100 张/3 分钟
  • 通过

第三阶段:部署(半天)

任务

  1. 在财务电脑安装 Python 环境
  2. 配置 API 密钥
  3. 创建发票文件夹结构
  4. 写一个批处理脚本(双击运行)

批处理脚本run.bat):

1
2
3
@echo off
python process_invoices.py
pause

财务小姐姐说:"这个好,我不用记命令,双击就行。"

第四阶段:培训(半天)

培训内容

  1. 把发票 PDF 放到指定文件夹
  2. 双击运行脚本
  3. 等待完成
  4. 打开 Excel 检查结果

培训材料

  • 3 页 PPT(流程、注意事项、常见问题)
  • 1 个视频教程(5 分钟)
  • 1 个微信群(有问题随时问)

财务反馈:"比想象中简单多了。"


📊 效果对比(数据说话)

指标之前之后改善
单张处理时间2 分钟2 秒60 倍
月度总耗时100 小时1.7 小时59 倍
加班时长30 小时/月0100%
错误率3%0.2%93%
人力成本5000 元/月840 元/月83%
员工满意度6/109/10+50%

最明显的变化

  • 财务月底不加班了
  • 对账时间从 1 天缩短到 1 小时
  • 员工不再抱怨重复劳动
  • 有时间做更有价值的分析工作

💡 意外收获(没想到的收益)

收获 1:财务开始学 Python

负责报销的财务小姐姐,用了这个脚本后,对编程产生了兴趣。

她说:"原来代码真的能解决问题,我也想学。"

现在:她已经学完了 Python 基础,正在学数据分析。

公司收获:培养了一个懂业务的复合型人才。

收获 2:发现了流程优化空间

自动化过程中,我们发现:

  • 有些发票可以不要纸质版,直接要电子版
  • 有些报销可以线上审批,不用打印
  • 有些供应商可以开月结发票,减少发票数量

流程优化后:发票数量减少了 30%。

收获 3:老板对 IT 部门重视了

之前老板觉得 IT 就是修电脑的。

这个项目之后,老板说:"IT 能创造直接价值。"

结果:IT 部门预算增加了 50%。


⚠️ 踩过的坑(帮你避雷)

坑 1:密钥泄露

问题:有同事把代码传到 GitHub,密钥被扫描到。

后果:腾讯云账号被盗用,产生额外费用。

解决

  • 密钥用环境变量配置
  • 代码上传前检查 .gitignore
  • 定期轮换密钥

坑 2:图片质量差

问题:有些发票拍照太模糊,识别失败。

解决

  • 制定发票提交规范(清晰、平整、无反光)
  • 优先使用电子版 PDF
  • 失败的手动处理,加入"异常发票"列表

坑 3:网络不稳定

问题:公司内网访问腾讯云偶尔超时。

解决

  • 添加重试机制
  • 批量处理时分小批次
  • 失败的文件记录日志,后续重试

坑 4:Excel 格式不统一

问题:财务希望增加一些自定义字段。

解决

  • 在脚本中添加字段映射配置
  • 支持自定义输出模板
  • 提供 Excel 格式调整选项

🎯 可复用的经验

经验 1:从小处着手

不要一上来就想自动化整个财务系统。

从最痛、最重复、最耗时的点开始

  • 发票录入
  • 银行对账
  • 报表生成

小成功积累大信任

经验 2:让用户参与

开发过程中,多和财务沟通:

  • 她们想要什么格式
  • 哪些字段最重要
  • 使用场景是什么

用户参与设计的产品, adoption rate 更高

经验 3:留好退路

自动化不是万能的:

  • 保留手动处理通道
  • 异常发票人工复核
  • 定期备份数据

AI 是辅助,不是替代

经验 4:持续优化

上线不是结束:

  • 收集用户反馈
  • 监控识别准确率
  • 定期更新脚本

好的工具是迭代出来的


📚 相关资源

技能地址

腾讯云 OCR

代码示例

  • GitHub: (欢迎 Star)
  • 完整示例:技能页面有详细代码

💬 联系我

平台账号/链接
微信扫码加好友
微博@程序员晚枫
知乎@程序员晚枫
抖音@程序员晚枫
小红书@程序员晚枫
B 站Python 自动化办公社区

主营业务:AI 编程培训、企业内训、技术咨询


🎓 推荐课程


降本增效不是口号,是一个个具体项目的积累。

一个发票自动化,省 6 万;
一个报表自动化,省 3 万;
一个对账自动化,省 5 万;

一年下来,就是几十万的收益。

而你要做的,只是开始。

从今天开始,找一个小痛点,用代码解决它。


P.S. 有老板问我:能不能来我们公司做个自动化诊断?

我说:可以,但最好的诊断师是你自己——你最清楚哪里最痛。

行动起来,你就是公司的"降本增效英雄"。 💪

🎓 AI 编程实战课程

想系统学习 AI 编程?程序员晚枫的 AI 编程实战课 帮你从零上手!