Categories: AI编程

从IPTV到文件整理:我用QClaw自动提取PDF生成Excel,结果却出人意料……

之前和大家分享过如何利用 QClaw 获取 IPTV 的折腾经历:

QClaw开始公测,看看这只龙虾能帮我抓取直播源吗

当时感觉这个 AI 工具虽然有些“小聪明”,但似乎还不够完美。不过,毕竟它每天提供高达 4000万 Token 的免费额度 ,对于完成一些日常的自动化工作来说,这个羊毛还是非常值得薅的。

所以今天,我决定给 QClaw 安排一个更加贴近日常办公场景的任务——PDF 文件整理与数据统计

被纸质文件支配的恐惧

大家在工作中可能经常会遇到这种情况:每天都有大量的纸质单据或扫描版 PDF(比如送货单、入库单等)需要人工核对并录入到电脑里。这种工作不仅效率极低,而且容易出错。

既然 AI 已经这么发达了,能不能直接让 QClaw 来帮我完成这项枯燥的工作呢?

我的需求很明确:

  1. 自动读取 PDF 内容 :提取单据中的关键数据。
  2. 整理成 Excel 表格 :表头需要包含:发货日期、科室名称、类型、包名、数量、器械数量等。
  3. 数据筛选与统计 :注意,只有包含“灭菌日期”的行才纳入统计。
  4. 防错验证 :PDF 每页的底部都有“合计总数”和“产品包合计总数”,程序最后必须自动对比所有页的汇总和与 Excel 提取数据的汇总和,完全一致才算正确。

初战告捷:丝滑的任务执行

我直接将这套需求以及 PDF 文件的位置“喂”给了 QClaw(我们习惯叫它“龙虾”)。

PDF内容

令人惊喜的是,第一阶段的任务完成得非常顺利。QClaw 准确理解了我的意图,不仅成功提取了所需的字段信息,还聪明地运用了相关的 OCR 技术,完成了带有逻辑判断(有无灭菌日期)的数据筛选,并成功输出了交叉验证一致的 Excel 表格。

生成的EXCEL

看着最终生成的 Excel 汇总表完美匹配了 PDF 内置的合计数据,我当时心里只有两个字:真香!

进阶尝试:将工作流固化为 Skill

既然 QClaw 能完美完成单次任务,如果我每次都要重新描述一遍需求,未免太麻烦了。于是我提出了进一步的要求:完成验证并生成 Skill,以后只要遇到类似的 PDF,直接调用这个 Skill 自动处理。

生成SKILL任务

QClaw 也顺从地完成了 Skill 的构建。在它生成的 .qclaw/skills/delivery-report 目录下,结构非常清晰:

  • 一个 SKILL.md 文件,详细记录了整个工作流程和逻辑。
  • 一个 scripts 文件夹,里面存放了实际运行数据提取与 Excel 生成的 Python 脚本。

生成的SKILL

理论上,以后只需扔给它一个文件路径,它就能调用本地的 Python 脚本一键搞定。

翻车现场:AI 的“死循环”迷局

正当我以为以后再也不用手动录入表单,准备愉快地喝杯咖啡时,现实却给我浇了一盆冷水。

当我尝试让 QClaw 使用刚刚创建的这个 Skill 去处理新的 PDF 文件时,它却似乎陷入了某种逻辑死局。

后台数据显示,在长达一个多小时的时间里,它一直在不断地尝试、报错、重试……最终,这一个任务竟然疯狂消耗了近 2000万的 Token !即便烧掉了这么多额度,任务依然没有跑通。

用SKILL token消耗情况

总结:前途光明,但还需“调教”

这次的 QClaw 实战体验,可以说是“一半惊艳,一半无奈”。

惊艳在于它的理解和代码生成能力 :只要你把业务逻辑、验证条件描述得足够清晰,它真的能帮你写出可用的脚本,甚至能考虑到 OCR 和复杂的数据比对逻辑,大幅度降低了自动化的门槛。

无奈在于它的任务编排与容错机制 :当把它自己生成的代码封装成自动化流程(Skill)去执行时,一旦遇到路径变量传递、依赖环境异常或是微小的数据结构变化,它很容易陷入无意义的循环消耗中,不知道适时跳出或向人类求助。

总的来说,QClaw 作为一个拥有海量免费 Token 的工具,在辅助编写脚本、处理特定格式转换上绝对是个好帮手。但在完全实现“黑盒自动化流水线”之前,看来还需要我们多花点心思去“训练”和调试。

大家在用 AI 处理日常工作时,有遇到过类似这种“看似聪明却突然犯轴”的情况吗?欢迎在评论区分享你的踩坑经历!


📚 往期精彩文章推荐


🌟 与你互动

嗨~这里是【医工学习日志】的温暖小窝!
📩 随时戳一戳 :后台留言任何问题,树树会带着光速回复闪现!
💡 奇思妙想征集令
👉 遇到有趣资源?戳我分享!
👉 想看的硬核测评?甩题过来!
🔥 你的脑洞,可能成为下期爆款文章哦~

如需有偿部署服务或商务,请加V注明来意,不闲聊:



📝 栏目信息
策划编辑 ✨ 树树 ✨

技术支撑 @恩山无线论坛 & Github & 瀚思彼岸


📜 版权声明
内容说明:

  1. 原创文章转载请私信授权;

  2. 部分素材源自网络,版权归属原作者;

  3. 如觉侵权,请凭权属证明联系删除

cqshushu

Recent Posts

别再手动更新 Docker 容器了,Watchtower帮你监视并自动更新

🤦 你还在手动更新容器? 正常…

5 小时 ago

IPTV-Spider v2.0.9 docker已推送

大家好,我是你们的老朋友医工。…

1 天 ago

IPTV-Spider v2.0.9 docker已推送

大家好,我是你们的老朋友医工。…

1 天 ago

关于 IPTV-Spider 的一些统一回复(附日常优化小更新)

大家好,我是你们的老朋友医工。…

4 天 ago