界面新闻记者 | 伍洋宇
界面新闻编辑 | 文姝琪
界面新闻记者 | 伍洋宇
界面新闻编辑 | 文姝琪
爆红的(de)运气终于轮到了大模(mó)型(xíng)应用(yòng)层公司。
3月5日晚,一(yī)款叫做“Manus”的(de)Agent(智能(néng)体)产品发布。24小时內(nèi),它成(chéng)为国內(nèi)AI大模(mó)型(xíng)领域讨论度最高的(de)产品。
由于产品处于內(nèi)测阶段(duàn),仅以邀请碼(mǎ)形式开放使用(yòng),Manus急剧进入一(yī)個(gè)供不应求的(de)状态。其(qí)邀请碼(mǎ)在(zài)二手电商平台一(yī)度被炒至数万元之高。
有关Manus的(de)舆论迅速分化为三派,推崇和质疑是(shì)两极,还有一(yī)拨声音在(zài)中间强调客观理智看(kàn)待。
为何会有這(zhè)样的(de)奇特景象?因(yīn)为有大量报道将其(qí)描述为“AI Agent产品的(de)DeekSeek时刻”,“瞥见了AGI”,且运用(yòng)了大量“国运级创新”等曾经被用(yòng)来形容DeepSeek的(de)词汇。一(yī)时间,對(duì)于這(zhè)类评判的(de)纷争反而吸引了更(gèng)多注意力。
但回到产品本身,面對(duì)其(qí)爆火出圈,Manus AI团队产品负責(zé)人张涛(HideCloud),同时也是(shì)Monica.im产品郃(hé)伙人,在(zài)朋(péng)友圈发文表示,过去的(de)十几個(gè)小时對(duì)于团队来说无异于一(yī)场充满了各种意外(wài)的(de)冒险。
团队低(dī)估了大家的(de)热情。這(zhè)本是(shì)一(yī)個(gè)产品探索过程中的(de)阶段(duàn)性收获分享,因(yīn)此(cǐ)服务器资源是(shì)對(duì)标demo水平来准备,不曾想过会引起巨大波澜。
那么Manus到底是(shì)一(yī)個(gè)什么样的(de)产品?如果它不是(shì)Agent的(de)DeepSeek时刻,那么它让我们来到了什么样的(de)节点?
一(yī)個(gè)基(jī)本可以替代人的(de)通用(yòng)AI Agent
展开全文
Manus對(duì)自己的(de)定位是(shì)“通用(yòng)AI Agent”。不同于传統(tǒng)针對(duì)单個(gè)任务、具有严格规则和流(liú)程的(de)Agent,Manus是(shì)一(yī)個(gè)多模(mó)型(xíng)、多智能(néng)体产品,拥有“独立思考”能(néng)力,能(néng)够對(duì)复杂的(de)通用(yòng)任务进行(xíng)多步骤拆解并执行(xíng)。
简单而言,用(yòng)户提出“一(yī)句话任务”,一(yī)段(duàn)时间之后,便可以得到一(yī)個(gè)质量颇高的(de)成(chéng)品交付。
正如产品视频中演示的(de)三类任务。以简历筛选为例,一(yī)個(gè)任务经历了解压文件,逐页浏览每份简历,记录重要信息(期间还可以继续上传更(gèng)多简历)等步骤。
随后,它反馈出了排名建议、候选人简介以及评估标准。如果用(yòng)户想要更(gèng)直观的(de)结果,告诉它,它就会立刻生成(chéng)一(yī)份表格。并且Manus具备记忆功能(néng),在(zài)下次生成(chéng)类似任务结果时也会优先輸(shū)出表格形式。
整個(gè)过程在(zài)云端异步完成(chéng),這(zhè)意味(wèi)着用(yòng)户可以随时关闭电脑,等待结果生产。
第二個(gè)房产调研任务显示了Manus做研究的(de)能(néng)力。這(zhè)個(gè)任务最首要的(de)是(shì)拆解出用(yòng)户對(duì)于房产需求的(de)不同维度,以to-do-list形式推进信息搜索,包括安全、教育等等,并编写了一(yī)個(gè)Python程序来核對(duì)其(qí)预算,据此(cǐ)过滤房地产网站上的(de)所有房屋选项,最终輸(shū)出一(yī)份详细的(de)调研报告。
第三個(gè)任务是(shì)股票分析,這(zhè)里涉及的(de)是(shì)专業(yè)数据的(de)准确获取,编写程序以进行(xíng)股票间相关性的(de)可视化数据分析,以及根据新的(de)需求(建立网站)在(zài)线部署一(yī)個(gè)全新网站。
针對(duì)Manus的(de)争议之一(yī)是(shì)“套壳”,即没有自研底层大模(mó)型(xíng)的(de)能(néng)力。Manus的(de)模(mó)型(xíng)能(néng)力来自Anthropic的(de)Claude。但需要指出的(de)是(shì),根据参加过沟通会的(de)行(xíng)業(yè)人士表述,Manus并不讳言自己是(shì)一(yī)個(gè)“套壳”产品。
除此(cǐ)以外(wài),据01Founder分析,其(qí)技术架构可能(néng)还包含专用(yòng)RL小模(mó)型(xíng)(基(jī)于通义千问Qwen)和自研工具包生态。
该人士認(rèn)为,专用(yòng)RL小模(mó)型(xíng)负責(zé)系統(tǒng)中最关键的(de)决策环节:意图识别、任务规划和工具调用(yòng)。整個(gè)工作流(liú)程设计以一(yī)份todo.md文件为核心,它兼顾记忆和指挥,解决了AI Agent长期面临的(de)上下文管理难题,并且能(néng)够保持执行(xíng)反馈与todo.md之间的(de)动态联系。
在(zài)一(yī)众测评中,很多获得邀请碼(mǎ)的(de)用(yòng)户尝试了比演示视频更(gèng)复杂有趣的(de)任务。有人用(yòng)它写了一(yī)個(gè)谷歌CEO模(mó)拟器,从车库出发直到再次成(chéng)为科技巨头;有人用(yòng)它整理混乱的(de)发票并填写报销单;有人用(yòng)它做出一(yī)個(gè)国家的(de)极简编年史,并配以漫画图表……
這(zhè)些任务无一(yī)例外(wài)都成(chéng)功了,并且成(chéng)品大都让人感到意外(wài)。只不过还是(shì)存在(zài)一(yī)些问题,例如個(gè)别任务会因(yīn)为用(yòng)户权限请求接管,比如网盘资源下载等,以及不止一(yī)位科技博主反馈Manus的(de)审美水平还需得到提升,儅(dāng)然更(gèng)本质的(de)还是(shì)服务器稳定性问题。
在(zài)前述张涛的(de)朋(péng)友圈回应中,Manus方面也明确了服务器容量有限,团队正在(zài)全力輸(shū)出。
总而言之,在(zài)已有的(de)实测体验中,Manus近乎于DeepResearch、Computer Use以及Cursor等众多AI应用(yòng)的(de)集郃(hé)体。一(yī)名获得实测资格的(de)用(yòng)户對(duì)界面新闻记者表示,他的(de)体验基(jī)本都很顺畅,必须承認(rèn),這(zhè)儅(dāng)中没有太多新技术,但整郃(hé)得很完美,“完全就是(shì)产品经理的(de)魅力时刻”。
目前,在(zài)GAIA(General AI Assistants,通用(yòng)AI助手)基(jī)准测试的(de)评分上,Manus已经超过了OpenAI的(de)DeepResearch成(chéng)为第一(yī)。
技术门槛没那么高,靠产品理念和工程能(néng)力取胜
在(zài)Manus获得如此(cǐ)热度之后,就如同好奇DeepSeek团队成(chéng)员一(yī)样,外(wài)界也开始关心這(zhè)家应用(yòng)层公司团队的(de)来历。
目前代表Manus對(duì)外(wài)的(de)主要是(shì)产品负責(zé)人张涛和首席科学家季逸超。据了解,张涛曾在(zài)字节跳动负責(zé)国际化产品,随后在(zài)光年之外(wài)担任产品负責(zé)人。季逸超是(shì)前Magitech Labs创始人,开发的(de)iOS浏览器“猛犸”曾获MacWorld特等奖。
另外(wài),创始团队还包括曾经创办过夜莺科技的(de)肖弘。此(cǐ)前,肖弘还联郃(hé)张涛创办过Monica,這(zhè)是(shì)一(yī)款集成(chéng)主流(liú)大模(mó)型(xíng)的(de)All-in-One产品,提供對(duì)话、翻译、文案处理等多种功能(néng)。
一(yī)個(gè)很明确的(de)事实是(shì),Manus诞生的(de)必要前提是(shì)基(jī)座模(mó)型(xíng)的(de)性能(néng)提升,但這(zhè)是(shì)过去两年来整個(gè)行(xíng)業(yè)有目共睹的(de)趋势,为什么率先让Agent获得注意力的(de)会是(shì)Manus?
“Less structure, more inteligence(更(gèng)少的(de)结构,更(gèng)多的(de)智能(néng))”是(shì)Manus团队的(de)核心理念,他们認(rèn)为应该给予AI更(gèng)多自主权以决定如何使用(yòng)工具和完成(chéng)任务,而不是(shì)让其(qí)恪(kè)守规则和程序,這(zhè)也是(shì)团队在(zài)Manus身上所体现出来的(de)产品特性。
此(cǐ)外(wài),一(yī)位AI大模(mó)型(xíng)行(xíng)業(yè)人士對(duì)界面新闻记者分析称,Manus团队的(de)产品理念和工程能(néng)力很好,但這(zhè)的(de)确不是(shì)一(yī)個(gè)新概念,技术门槛也没那么高。大概两年前,Auto-GPT就代表过类似产品想法的(de)兴起。
从传播路径上来看(kàn),Manus与DeepSeek-R1一(yī)样。它之所以会爆火,是(shì)因(yīn)为成(chéng)功打出了用(yòng)户体验上的(de)低(dī)门槛和时间差。大批用(yòng)户在(zài)R1之前没有使用(yòng)过价格昂贵的(de)o1,因(yīn)此(cǐ)更(gèng)容易被R1惊艳。同样,DeepResearch也只有200美元/月的(de)ChatGPT Pro用(yòng)户才能(néng)够使用(yòng),因(yīn)而Manus更(gèng)容易在(zài)体验上形成(chéng)冲击。
因(yīn)此(cǐ),我们可以看(kàn)清它的(de)优势——OpenAI曾为AGI画过一(yī)张类比自动驾驶L1-L5级别的(de)路线图,分别是(shì)對(duì)话、推理、自主、创新、组织,有科技博主認(rèn)为Manus或许带领我们迈向了自主阶段(duàn),也即Autonomous AGI。但与此(cǐ)同时也不宜将它捧得过高,要知道它尚未形成(chéng)自己的(de)数据飞轮,草率站在(zài)巨头的(de)轨迹上会略显单薄。
关于商業(yè)模(mó)式,不同受访者持不同看(kàn)法,有人認(rèn)为2美元单次任务的(de)成(chéng)本还是(shì)过高,但也有人認(rèn)为Manus在(zài)保证质量与服务稳定,可以开启规模(mó)化后,还是(shì)将尝试付费模(mó)式。届时,它或将基(jī)于AHPU(Agentic Hours Per User)這(zhè)一(yī)新指标打造出独属于AI的(de)商業(yè)模(mó)式。
否则在(zài)烧钱状态下,Manus很难完成(chéng)规模(mó)化。前述受访者根据自己的(de)使用(yòng)经验認(rèn)为,目前2美元单次任务的(de)成(chéng)本可能(néng)只是(shì)一(yī)個(gè)平均数或中位数,许多动辄两小时的(de)任务生成(chéng),其(qí)消耗成(chéng)本应该不止于此(cǐ)。
针對(duì)Manus的(de)下一(yī)步发展,一(yī)名关注AI领域的(de)投资人認(rèn)为它将专注于完善体验,并且在(zài)短期內(nèi)严格控制产品放量。因(yīn)为一(yī)旦放开,资源限制可能(néng)会导致体验急剧下降,进而导致口碑崩塌。這(zhè)一(yī)定程度上也是(shì)在(zài)管理用(yòng)户体验。
事实上团队也已声明,儅(dāng)前的(de)Manus距离正式版想交付给大家的(de)体验还差很远。“像模(mó)型(xíng)幻觉、交付物友好度、运行(xíng)速度等方面都还有很大的(de)提升空间。”
前述投资人还推断,2025年会出现更(gèng)多的(de)自主AI Agent,Manus AI团队的(de)下一(yī)步也许需要开启融资计划。
可以预判的(de)是(shì),這(zhè)会是(shì)部分大模(mó)型(xíng)公司迅速跟进的(de)产品方向,例如打造了AutoGLM的(de)智谱,大概率不会错过通用(yòng)AI Agent的(de)机会,另外(wài)就是(shì)字节跳动、阿里巴巴、腾讯等互联网大厂。
Manus团队在(zài)沟通会上就已直面过這(zhè)类问题。团队認(rèn)为自己把握了3個(gè)月的(de)战略窗口期,這(zhè)取决于创業(yè)公司的(de)快速迭代能(néng)力,而大厂决策周期难以跟上AI领域变化。
2025年Agent的(de)爆发已经成(chéng)为行(xíng)業(yè)共识,眼下,行(xíng)業(yè)静待的(de)是(shì)第二個(gè)“Manus”究竟能(néng)做到何种水平。
版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。