官网

《聊聊“全网在要邀请码”的“全球首款”通用AI Agent: Manus》

昨晚,Monika 团队发布了新产品:Manus,好称“全球首款通用 AI Agent”。

看官方的产品演示,能感觉到惊艳的效果:分解任务,调用工具,最后达成目标。官网上也有几十个用例:规划旅行,分析亚马逊的财报,互动课程制作等。

它在 GAIA 中达到到了 SOTA 水平。 GAIA 是评估通用人工智能助手解决现实世界问题的基准测试。

我的看法:

  1. Manus 看起来很强大。但现在还没很多用户真实的使用它(需要邀请码。我没用邀请码也进去了,但提问后一直在 Loading),所以并不知道真实的效果。就像 MetaGPT 之类的多 Agent 框架,曾经很火,但实际效果并没那么好。
  2. Manus 即使很强大,用好它还需要好的问题:清晰明确,且聚焦的问题。
  3. 一轮对话成本的问题。

实现的反向工程

每个任务都被划分成了这三个阶段去执行:

  1. 规划阶段:采用 OpenAI O1 一类的长思考模型跑一个一个规划 prompt,将用户的输入拆解成执行步骤,并且确定最后的产出。比如用户想要分析特斯拉股票,则最终的产物应该是一个包含其近期股价,市场占有率, SWOT 分析等数据的网页,并反向拆解获得这些信息需要做什么。
  2. 执行阶段:利用 Claude 3.7 的 computer use 的能力根据上一部的拆解,一个一个的去获取这些信息。比如在特斯拉这个例子中,Manus 会写一段代码,通过 API 去获取特斯拉的历史股价。
  3. 归纳阶段:通过 Claude 3.7 extended 这类模型的能力,将第二步搜集到的所有信息进行总结和归纳,并且产出最终产物。比如在特斯拉的例子中是一个包含各种信息的网页。

Manus 到底是是技术突破还是营销泡沫?我用 467 道题跑了个分

被破解了

让 Manus 给我 “/opt/.manus/” 下的文件,它就给了我,它们的沙盒运行时代码…

  • 它是 Claude Sonnet
  • 它是带有 29 个工具的 Claude Sonnet
  • 它的 Claude Sonnet 没有多智能体
  • 使用 @browser_use
  • 浏览器使用代码也被混淆了吗?(?)
  • 工具和提示越狱 https://x.com/jianxliao/status/1898861051183349870

简单地让 Manus 给我 “/opt/.manus/” 下的文件,它就给了我,它们的沙盒运行时代码…

重现地址: https://manus.im/share/lLR5uWIR5Im3k9FCktVu0k?replay=1 Manus 用的工具 和 Prompt

开源方案