用 AI 捣鼓一些有意思的东西 / Part 1

哆啦 A 梦道具实现率

哆啦 A 梦道具实验的手机截图
哆啦 A 梦道具实验的宽幅配图
56.35%

已实现比例

比预期高很多

4,011

总道具数

从维基百科爬取的完整列表

200.5h

人工搜集预估耗时

通过 AI + 多维表格大幅缩短

00概览

哆啦 A 梦道具实现率

如何通过 AI 减少重复劳动,快速给出我想要的答案?

这个问题有三个难点:道具数量多、很多道具不熟悉、不确定现实世界是否已经实现。假设人工搜集所有道具并标记是否已完成:

4,011

总道具数

0.5m

搜索道具

2m

了解能力

0.5m

判断实现

12,033 分钟 = 200.5 小时

道具数量多
道具数量多
很多道具不熟悉
很多道具不熟悉
不确定现实世界是否已经实现
不确定现实世界是否已经实现
01尝试

让 AI 一步到位的失败

我首先尝试用 ChatGPT 一步到位——搜索所有道具、标注是否已实现,并直接给出最终百分比。

01ChatGPT 搜索 + 标注

让 ChatGPT 同时完成搜集和判断。结果:搜集数量有限,而且会编造假道具。

02仅用 ChatGPT 搜索

退一步,不做标注,只用 Deep Research 和 Agent Mode 搜索并列出所有道具和介绍。效果同样不理想。

ChatGPT 搜索并标注的对话截图
ChatGPT 搜集数量有限
ChatGPT 编造假道具
Deep Research 对话截图
02方法

爬虫 + 多维表格批量处理

用几乎一样的 prompt,只增加了一句“写一个爬虫”,ChatGPT 就成功列出了所有的道具。

ChatGPT 写爬虫的对话截图

把 CSV 导入多维表格后,用 DeepSeek 自动帮我判断每个道具在现实生活中是否可以实现。

多维表格配置截图
多维表格全貌截图

最终答案:56.35%——比我预期的高很多。

最终结果展示
补充结果条
03收获

AI 的能力边界

这个小项目让我对 AI 的能力边界有了更具体的认识。

01LLM 不擅长枯燥重复的工作

确定性高、重复性高的工作通过传统的代码和工作流效果远好于让 LLM 自己硬写,有时它还会像人一样偷懒耍滑。

02LLM 不会主动寻找最优解法

它不会自己判断应该调用什么工具。在我输入最开始的提示词时,它就应该想到用爬虫是更可行的方法,但它没有。需要人为给予指令。

03批量处理用多维表格

多维表格在批量处理结构化内容上有得天独厚的优势,可以并行处理大量简单工作,相当于同时开了几百个 LLM 窗口。