最近我被一个 Claude3.5 的神级 Prompt 彻底震撼了
简单来说,这个 Prompt 通过给 Claude3.5 注入一个 O1 级别的思维链,把它的思考过程变得更人性化,逻辑也更详细,甚至能够像 O1 一样展开和折叠。
经过这个强化,Claude3.5 的智能水平、成功率和类人化程度都大幅提升。
群里的朋友们都玩得不亦乐乎。有人直接用这个经过强化的 Claude3.5,现场造出了一个可以玩的 Flappy Bird。没错,是真的可以玩,给大家看得目瞪口呆。
有人做了一个德州扑克游戏,除了可以玩,里面还有 AI 玩家…整个人都炸了。
然而,这一切都还没完,大家的赞叹才刚刚开始,接下来有几个更炫酷的案例紧随其后。
所有这一切的源头,都来自那段神级 Prompt,而这段 Prompt 名叫“Thinking Claude”。顾名思义,就是一个强化思考能力的 Claude。
我先给大家贴一下它的原始 Prompt,虽然很长,大家可以去作者的 Github 页面查看,链接地址是:
https://github.com/richards199999/Thinking-Claude/tree/main
更让人震撼的是,这个 Prompt 的作者是个 17 岁的高中生——涂津豪(@Richards Tu),他出生于 2007 年,之前还在阿里巴巴全球数学竞赛 AI 赛道中夺得了全球第一。
我的 17 岁,和他的 17 岁,真的是天差地别。
这个 Prompt 非常复杂,我先大概给大家讲讲它的能力,让大家能更直观地了解。
整个 AI 圈都有共识:思维链对大模型有很大的加成作用。从去年到现在,大家看到 O1 的成功,都已经不再怀疑这一点。
但在 O1 之前,思维链的实际效果离我们想要的思考方式还有不小的差距。我们希望模型的思维链能更像人类的思考过程,但实际上,模型只是照搬它在预训练中遇到的推理路径。
而 O1 之后,思维链发生了改变。你可以看到,模型的推理不再是死板的教科书式解法,反而像是人类在思考时的“内心独白”或“意识流”——更具人性化。
涂津豪写这个 Prompt 的灵感正是来自于此。
Claude 本身就很强,如果能够给 Claude 加上一层类似 O1 的拟人化思维链,尽管无法完全比肩 O1,但或许能在 Claude 的基础上大幅提升它的表现。
于是,涂津豪按自己的理解,徒手编写了这段拟人化的思维链 Prompt。这也就是 Thinking Claude 的雏形,版本 0.01。最初的 Prompt 是英文的,我把它翻译成中文给大家看。
这个 Prompt 的核心思想就是:“Claude 的思维应该更像是一个意识流。” 虽然这版思维链的效果有些生硬,但涂津豪没有放弃,而是做了一件有趣的事情。
他把这段 Prompt 扔给了 Claude,询问人类的思考框架是什么样的,以及如何优化自己的 Prompt。
Claude 给出的框架非常棒,涂津豪就把 Claude 的建议修改后添加到 Prompt 中。
接着,涂津豪又开了一个窗口,把修改后的 Prompt 再次交给 Claude3.5 进行迭代,经过 80 多次修改后,最终才有了今天的 Thinking Claude。
这个过程中,他几乎用完了 Team 版的对话额度。
当你把这个 Prompt 输入 Claude 后,你就可以随意提出问题。
比如让它做一个计算器,它会先思考出一整段“如何做”的步骤,然后再开始执行。这个思考过程非常有趣。
让我们来看一下 Claude3.5 在加上这个 Prompt 后,如何思考的。
最关键的一句话是:“但我应该包括更高级的操作吗?也许是科学功能?不,让我们从基础知识开始,因为用户没有指定任何更复杂的东西。”
这个自问自答的思考过程非常贴近人类,能够理清需求。
当然,最终这个计算器是成功的,对于 Claude3.5 来说,几乎没有任何难度。
而在文学创作方面,Thinking Claude 也表现得同样出色。
例如,如果你让它“给我一个关于科幻短篇小说的糟糕的想法,但要出色地执行它”,这听起来是个挑战吧?但是看看 Thinking Claude 是怎么思考的:
“或者…等等,有了!”这些语气词和人类思考的流畅感,都表现在这条思维链里。
最终,它成功创作出了这篇短篇小说。
这是一个由 AI 写出来的故事,给我带来了极大的震撼。
而这一切,都是 Thinking Claude 加持后的成果。
涂津豪不仅仅满足于此,他希望 Claude3.5 的思考过程也能像 O1 那样,允许用户选择是否展开或收起思维链。
目前,Claude3.5 的思维链是一直展开的。
涂津豪想要完全复刻 O1 的功能,于是他向 Thinking Claude 求助,而 Claude 告诉他:“开发一个 Chrome 插件吧,就能解决这个问题。”
经过一番折腾,这个插件终于出炉了。
当你安装它后,Claude 的思维过程会被折叠起来,只有在需要的时候才会展开,极其方便。
通过 Thinking Claude 的思维链强化,再加上 Claude 底层的强大能力,配合强无敌的 Artifacts 功能,Claude3.5 几乎可以媲美 O1 了。
相比之下,现在的 O1 不仅不能识图,不能运行代码,排版也一团糟,体验差距巨大。
最后,感谢 Claude,感谢涂津豪,感谢这个 17 岁的少年,他的热血和才华真的让我深感敬佩。
我相信,随着这样的进步,我们将一起走向更加强大的未来。