Now I have all the verified content I need. Let me compose the final report.
今日最值得落地(3条)
1. OpenAI + Thrive Holdings:自改进税务申报 Agent,7,000 份税表实测
- 场景:个人税表(1040/1041)申报准备,覆盖 W-2、1099、K-1、Schedule E/C/A 等复杂表单。Crete 专业联盟旗下 30+ 会计事务所参与试点。
- 可做动作:借鉴其”人工修正 → 结构化 trace → Codex 自动修复”三环反馈架构,用于本团队重复出错率高的税务字段抽取或对账场景。核心不是直接用他们的产品,而是复用这个”让系统从审核纠错中自我改进”的工程模式。
- 复核控制:每份 AI 草稿由 CPA 逐字段审核;修正记录自动回流为 eval 数据集;Codex 提出的修复必须通过回归测试才能部署;模糊案例路由给工程师人工判断。
- 输出物:税表草稿(字段准确率从上线时 25% 六周内升至 86%,最高达 97%);单人准备时间从 180 小时降至 15 小时;吞吐量提升约 50%。
- 来源:OpenAI 官方博客 | 2026-05-27 | operator + 供应商合作案例
2. n8n 零代码搭建多 Agent 财务部门:CFO + FP&A + 会计 + 资金
- 场景:财务团队内部 AI 助手,覆盖 FP&A、会计、资金三个职能的日常问答和初步分析。
- 可做动作:用 n8n 自托管(~$4/月 VPS),搭建一个 CFO 主 Agent + 三个专业子 Agent;用 ChatGPT 生成 system prompt;分层选择模型(CFO 用强推理模型,子 Agent 用轻量模型控制成本)。整个过程无代码,Finance 团队可自行维护。
- 复核控制:关键在 delegation logic——必须在 system prompt 中强制 CFO Agent 路由到专业子 Agent,而非自行回答;首次测试失败后用 ChatGPT 迭代修正 prompt。Code Interpreter 必须启用(LLM 不是计算器,数值推理需要 Python/R 执行环境)。
- 输出物:可嵌入 Slack/Teams/网站的 AI 财务聊天界面;每步调试过程可视、可复现。
- 来源:YouTube 实操视频(Corey Ganim + Mike Dion / F9 Finance) | 2026-05-27 | operator 实操演示
3. CFO Connect:25 个 Claude 财务提示词模板,500+ 财务负责人现场验证
- 场景:关联公司对账、财务模型审计、资产负债表勾稽、发票处理、journal entry 生成。
- 可做动作:采用四部分提示词结构(上下文 → 输入格式 → 输出规范 → 异常处理),从关联公司费用分摊或发票抽取开始试点。最高杠杆技巧:先用 Claude Chat 写提示词,再部署到 Claude Cowork/Code(meta-prompting)。
- 复核控制:Claude 处理机械性工作(抽取、计算、格式化),财务人员验证逻辑和判断;异常数据不中断流程,自动标记并路由给指定人员。每个输出行必须标注数据来源。
- 输出物:journal entry 上传表(含 entity、GL code、debit/credit、currency、allocation methodology);reconciliation checking tab;结构化发票数据;模型错误标注。
- 来源:CFO Connect 提示词库 | 2026 年 | Luc Hancock 整理,社区实测材料
Accounting / Close / Controls
关联公司对账 + 发票处理:Claude 提示词模板
见今日最值得落地第 3 条。其中两个提示词组合值得本周试点:
- 关联公司费用分摊(提示词 #8-#10):输入共享服务发票数据 → Claude 按收入百分比/人头/直接归属等方法分配到多实体多币种 → 输出 journal entry 上传表 + checking tab 验证借贷平衡。缺失数据不中断流程,自动发 Slack 通知指定人员,回复后更新映射并重新生成。
- 发票字段抽取(提示词 #11):输入发票 PDF/图片 → Claude 输出结构化数据(vendor name、invoice number、line items、subtotal、tax、total)→ 人工复核异常和缺失字段。
控制要点:checking tab 必须验证 debit = credit 并 flag 差异;缺失/不可匹配记录单独标记,不自动跳过;所有输出行标注数据来源(source of truth citation)。
FP&A / Planning / Reporting
FP&A AI 技能升级框架:CFO 如何重新设计财务角色
- 场景:FP&A 团队 AI 能力建设和角色转型。
- 数据信号:43% 的 FP&A 岗位招聘已要求 AI/ML 技能(一年前为 25%);AI 认证持有者薪资溢价 15-24%;但 CFO 以下层级薪酬增长停滞,形成 retention 风险。
- 核心风险:AI 提高了产出预期,但未重新设计角色和薪酬,导致”隐性工作量”增加——验证假设、检查源数据、挑战 hallucination、将输出翻译成业务行动。可见工作变快了,不可见工作变重了。
- 角色转型方向:
| 传统 FP&A | AI 时代 FP&A |
|---|---|
| 报告/数据拼装 | 解读和业务解释 |
| 模型搭建 | 假设挑战和逻辑测试 |
| Deck 制作 | 决策支持和行动计划 |
| 分析师执行 | 工作流所有权和设计 |
- 实操框架:① 受保护的学习时间(不靠员工下班自学);② 基于真实工作流的培训(variance commentary、forecasting、board packs);③ 验证纪律(教模型检查、源数据验证、怀疑性审查);④ 共享 playbook(降低 key-person 风险);⑤ 将 AI 能力与晋升挂钩。
- 来源:CFO Connect | 2026 年 | Luc Hancock 整理
Treasury / Cash / Risk
数据暂缺。 本期未发现最近 365 天内现金预测、银行流水自动化或流动性风险监控的新 AI 落地案例或实操方法。
Tax / Compliance / Audit
自改进税务 Agent 的三环架构
见今日最值得落地第 1 条。OpenAI + Thrive 的架构对税务/审计团队有直接参考价值,其核心模式可复用到其他需要”人工审核 → 重复错误 → 系统性修复”的财务流程:
- 环 1 — 实践者修正:CPA 在正常审核中纠正 AI 输出,系统记录差异。
- 环 2 — 产品化证据:完整 trace(源文档、抽取字段、映射关系、修正记录)被结构化存储,重复失败模式被分组为 eval 目标。
- 环 3 — Codex 迭代:eval + trace + repo → Codex 自主调查、修复、回归测试、提 PR;模糊路由给工程师。
扩展方向:Thrive 已将同一架构应用于簿记、审计和 IT 帮助台。对财务团队而言,收入确认规则映射、SOX 控制测试证据抽取、税务研究案例归纳等场景均可借鉴此模式。
CFO / Leader 团队建设经验
Remote CFO Michiel Boere:AI 治理、团队采纳与工作流自动化
- 背景:Remote 是全球雇主记录平台,覆盖 180+ 国家。Michiel Boere 在 CFO Connect 社区做了一场无脚本 AMA,回答社区关于 AI 治理、团队采纳、工作流自动化的问题。
- 核心观点:
- “投资不足的风险远大于过度投资的风险”——CFO 需要现在就对 AI 立场表态,不能等。
- 真正的生产力提升从第三阶段(工作流自动化)开始,不是聊天界面或仪表盘。
- AI 治理 = 政策 + 流程 + 文化规范:谁能用、用什么数据、输出谁审核。
- 团队建设启示:不要让 AI adoption 停留在个人实验层面;需要公司级的治理框架和授权机制,明确工具选择、数据边界和审核责任人。
- 来源:CFO Connect 活动回顾 | 2026 年 | Michiel Boere(Remote CFO)
待验证线索:Startup CFO cjgustafson 在 X 上分享”你不能 vibe code 一家上市公司:AI 在财务中真正有效的领域”以及”如何构建 AI-first 财务团队”。来源为实际 Startup CFO 视角,但 X 帖子正文有限。其 Glasp Talk 播客访谈(第 48 期)可能包含更完整的观点,待进一步验证。
开源 / AI 工程可借鉴
LLM Wiki:用 Claude MCP 自动维护财务知识库
- 项目:lucasastorian/llmwiki(1,002 stars,Python,Apache 2.0)
- 架构:本地文件系统为 source of truth → SQLite 索引 → MCP Server 连接 Claude Desktop → Claude 自动读取源文件、撰写/更新 wiki 页面、维护链接和引用。文件写入磁盘后立即更新索引。
- 支持格式:PDF(文本提取)、Markdown、HTML、Excel/CSV、图片;可选 LibreOffice 转换 Word/PPT;可选 Mistral API 做高质量 PDF OCR。
- 财务适用场景:
- 会计政策手册维护:新准则/解释更新时自动更新相关章节和交叉引用。
- 审计/SOX 控制文档:控制矩阵、流程描述、证据清单的持续更新。
- 税务研究笔记:跨辖区税法变更时自动标记受影响的分析和结论。
- 注意事项:本地运行,数据不出机;Claude MCP 调用需要 API key;scanned PDF 需先做 OCR 预处理。
- 来源:GitHub | Apache 2.0
n8n 多 Agent 架构的工程要点
见今日最值得落地第 2 条。可复用的关键设计:
- 分层模型策略:主 Agent 用强推理模型,子 Agent 用轻量模型,成本降低 30-40%。
- Code Interpreter 必选:数值推理必须启用 Python/R 执行环境。
- Delegation 强制:system prompt 必须显式要求路由,否则主 Agent 会自行回答所有问题。调试方法:失败用例反馈给 ChatGPT 生成修正后的 system prompt。
- Upskilling 优先于外包:培训内部团队自己搭建和维护,因为他们最了解业务;外部顾问搭的东西团队改不了。
本周可做的小实验
-
关联公司对账试点:取一张本月共享服务费用发票,用 CFO Connect 的提示词 #8-#10 在 Claude 中跑关联公司分摊,输出 journal entry 表和 checking tab。Owner:会计主管。复核:Controller 检查 allocation methodology 和借贷平衡。记录:prompt 版本、输入数据、输出结果、修正点。
-
发票 OCR 结构化:收集 5 张不同供应商的 PDF 发票,用提示词 #11 在 Claude 中抽取字段,对比人工录入结果。Owner:AP 专员。复核:AP 主管逐字段比对。判断标准:字段准确率 ≥ 90% 则可扩展到批量处理。
-
n8n 财务 Agent 原型:在本地用 n8n 搭建一个最小 CFO Agent + 1 个 FP&A 子 Agent,测试 delegation 路由是否正确。输入:3 个 FP&A 类问题 + 3 个会计类问题。Owner:财务系统管理员或 IT。复核:财务经理验证路由准确性和回答质量。
-
FP&A 角色审计:列出 FP&A 团队当前所有”隐性 AI 验证工作”(假设检查、源数据核对、hallucination 筛查),标注每项每周耗时。Owner:FP&A 负责人。输出:工作量清单 + 下季度 upskilling 优先级。复核:CFO 审阅并决定是否调整角色描述和薪酬结构。
-
财务知识库原型:用 llmwiki 在本地打开一个包含最近 3 个月会计政策 PDF 的文件夹,连接 Claude MCP,测试自动摘要和交叉引用更新质量。Owner:财务系统管理员。复核:Controller 检查生成页面的准确性和完整性。