Manus

官网

《聊聊“全网在要邀请码”的“全球首款”通用AI Agent: Manus》

昨晚，Monika 团队发布了新产品：Manus，好称“全球首款通用 AI Agent”。

看官方的产品演示，能感觉到惊艳的效果：分解任务，调用工具，最后达成目标。官网上也有几十个用例：规划旅行，分析亚马逊的财报，互动课程制作等。

它在 GAIA 中达到到了 SOTA 水平。 GAIA 是评估通用人工智能助手解决现实世界问题的基准测试。

我的看法：

Manus 看起来很强大。但现在还没很多用户真实的使用它(需要邀请码。我没用邀请码也进去了，但提问后一直在 Loading)，所以并不知道真实的效果。就像 MetaGPT 之类的多 Agent 框架，曾经很火，但实际效果并没那么好。
Manus 即使很强大，用好它还需要好的问题：清晰明确，且聚焦的问题。
一轮对话成本的问题。

实现的反向工程

每个任务都被划分成了这三个阶段去执行：

规划阶段：采用 OpenAI O1 一类的长思考模型跑一个一个规划 prompt，将用户的输入拆解成执行步骤，并且确定最后的产出。比如用户想要分析特斯拉股票，则最终的产物应该是一个包含其近期股价，市场占有率, SWOT 分析等数据的网页，并反向拆解获得这些信息需要做什么。
执行阶段：利用 Claude 3.7 的 computer use 的能力根据上一部的拆解，一个一个的去获取这些信息。比如在特斯拉这个例子中，Manus 会写一段代码，通过 API 去获取特斯拉的历史股价。
归纳阶段：通过 Claude 3.7 extended 这类模型的能力，将第二步搜集到的所有信息进行总结和归纳，并且产出最终产物。比如在特斯拉的例子中是一个包含各种信息的网页。

Manus 到底是是技术突破还是营销泡沫？我用 467 道题跑了个分

被破解了

让 Manus 给我 “/opt/.manus/” 下的文件，它就给了我，它们的沙盒运行时代码…

它是 Claude Sonnet

它是带有 29 个工具的 Claude Sonnet

它的 Claude Sonnet 没有多智能体

使用 @browser_use

浏览器使用代码也被混淆了吗？（？）

工具和提示越狱 https://x.com/jianxliao/status/1898861051183349870

简单地让 Manus 给我 “/opt/.manus/” 下的文件，它就给了我，它们的沙盒运行时代码…

重现地址: https://manus.im/share/lLR5uWIR5Im3k9FCktVu0k?replay=1 Manus 用的工具和 Prompt

开源方案

OpenManus MetaGPT 搞的。调用的本地的工具：PythonExecute，FileSaver，BrowserUseTool， GoogleSearch。只用三小时，几个 00 后尝试复刻了 Manus

Joel 的大唠嗑

Explorer

Manus

实现的反向工程

被破解了

开源方案

Graph View

Table of Contents

Backlinks