blog.sakanano.moe2025-03-19 19:34

R#040 锐评 manus

文章摘要

这篇文章探讨了新发布的 AI 工具 manus,它被描述为一个 AI agent 概念演示。Manus 通过拆解任务、收集信息、生成文本和部署代码来实现自动化执行。 虽然 manus 的功能与几年前的 autogpt 类似,但它更注重展示基于 AI agent 的想象空间。文章指出,由于缺乏统一标准协议,manus 通过模拟鼠标键盘操作的方式来实现与用户交互,这种做法激发了人们对未来 agent 应用的期待,并促进了 AI 应用领域的竞争。 作者认为,个人电脑上的通用 agent 目前仍是一个伪概念,应该从特定场景开始,例如开发人员的个人 agent。最终目标是通过结合平台优势和产品特点,打造更专业、更有价值的 AI agent 应用。

事件

  1. manus 发布。AI 火了之后带了一股营销风,突然就冒出来 manus。用了 manus,一般,总的来说,manus 是一个 AI agent 的概念性 demo,时机取巧。

agent

manus 的核心功能是帮你拆解成多个步骤,并且去收集信息(deepsearch)、实现文本(LLM)、部署代码(operator)。

收集信息,是联网功能;

实现文本,是 LLM 基本能力;

部署代码,是类似 bolt.new, v0.dev 之类已经比较成熟的方案,再扩展到键鼠操作、API 操作之类。

它的亮点在于,展示了一个任务的「执行逻辑」,也就是展示了「Thinking 过程」,甚至让你看到它用浏览器访问网页,配合多模态去理解屏幕内容,鼠标点击等等。当然,这里我不觉得 system 提示词、拆分任务、调用 function call 是个亮点,这更像是使用 AI 的基本功。

概念 demo

虽然 manus 看似实现了 agent,但是和几年前的 autogpt 没有太大的区别,更多是向用户展现了基于 AI/Agent 的想象空间。

从现在 AI 发展看,国外比较倾向于商定协议,比如 MCP,规定 AI 能控制什么、如何控制等交互,也正因为标准协议还没发展起来,缺少一个 AI 与 APP 厂商之间的利益平衡方,manus 采取了很取巧的做法——也就是让用户并去操作浏览器、终端,基于鼠标键盘的模拟操作。

从用户角度看,我倒是支持这个做法的,甚至,这种有点绑架用户心智,让大家对未来 agent 充满幻想的做法,能加速各个厂商卷现在 AI 应用,尤其是大厂。

现在谁都知道要做 personal agent,去吃制定标准、抢产品形态定义的螃蟹流量,manus 就干了这个事情。

现在我觉得 pc personal agent 是个伪概念,应该做场景化的比如 dev personal agent,想一口吃成通用化是不可能的,因为 LLM 是个语言学概率模型,通用化就意味着不专业,要从下向上做通用,教 AI 也是教用户模型擅长什么、不擅长什么。

后来我觉得得吃平台优势,结合自己产品搞 agent 化,比如企业微信/钉钉/飞书提供一个用户侧的 agent 助手作为秘书,而不是现在 xjb 搞的群聊总结,用户能收到看到的所有信息就是 agent 的输入,用户自己跟 agent 交互就行了

但是做产品无非就是形态定义权,别人想抄还是能抄的,所以,我觉得借着市场上国民级应用的垄断级优势去跟国家制定 MCP,做 MCP 的 SDK 供应商,才是要冲的玩法。

时机取巧

deepseek 热度还没散去,趁着全民都对 deepseek 有认知,不需要教用户什么是 AI,也不需要告诉用户 AI 有那么多幻觉、错误和门槛,赶紧把「第一」这个概念在国内抢了。

不过 manus 只是个第四方平台,没做标准的能力,不得已,吃一口流量抢占产品形态。

可能是想提高被收购的价值吧。

跑了几个案例,全都失败了。

第一个案例只说了一次提示词,跑了 2h,就触发了 token 上限(所以说 manus 出的时机太早了,模型水平还没跟上…),更别提 debug 了:

后续基本上也是类似的问题,如果你的需求足够简单,那有更好的工具比如 Claude,如果你的功能很复杂,manus 的上下文也支持不了。这就是第四方通用平台的困境,看着花哨,上限很不稳定。

但话又说回来了,确实有相当多的简单工作可以在这轮迭代里被干掉,比如写个简单的 ppt、报告啥的,确实降低了 prompt 的编写门槛(其实是平台帮你写了 prompt,也就是所谓的智能体、流程),挺好的,厂商越卷,我(用户)越开心。

信息

灵感

  1. 大胆预测一下,下一个 AI 转折点应该是无限 Token

系统

  1. 上周用了片假名终结者这个插件,不过汉字还是需要注音,于是有找了个插件注音假名生成器

Other

  1. 拿到了离开深圳的倒数第二张门票,职级过了,还是挺开心的。
  2. 下周该分享了,这次分享宏观经济和投资,赶紧去准备一下 PPT。