出品 | 搜狐科技
作者 | 梁昌均
这两天,从媒体圈到(dào)资本(běn)市场,一款名为Manus的(de)智能体(Agent)产品突然爆(bào)火,多个概念股掀起涨停潮。
在(zài)DeepSek、宇树科技等引發(fā)的(de)技术创新(xīn)轰动下,Manus背后的(de)中国年轻创業(yè)团队同样被冠以宏大的(de)AI突破叙事,甚至有人称其为又一个ChatGPT時(shí)刻或DeepSeek時(shí)刻。
在(zài)二手交易平台,Manus邀请码价格达到(dào)上千元或上万元,有的(de)炒到(dào)10万元,甚至还有人报价8000万,不(bù)少社交平台和(hé)交流群都被“求邀请码”刷屏。
这款号称是“全球首款通用智能体”的(de)产品,到(dào)底有着什么魔力?饥饿营销、套殼(ké)质疑背后,是否具备技术壁垒和(hé)产品护城河?李彦宏、黄仁勋等大佬看好(hǎo)的(de)智能体会迎來(lái)爆(bào)發(fā)吗?
首款通用智能体,击败OpenAI的(de)Manus体验到(dào)底如何?
筛选简历、研究房产、分(fēn)析股票、旅行规划、报告撰写、PPT制作……Manus官网上展示了(le)50多个可以帮用户完成的(de)各種(zhǒng)复杂任务。
让不(bù)少人颇为兴奋的(de)是,Manus又像DeepSek那般,再次击败了(le)更早布局智能体的(de)OpenAI。
官网显示,GAIA基准(用于评估AI助手实际问题解决能力)的(de)三个难度(dù)級(jí)别,Manus都实现最先进的(de)(SOTA)性能,大幅超过OpenAI的(de)Deep Research。
展开全文
从示例來(lái)看,Manus在(zài)接到(dào)用户指令后,可以直接操作电脑,完成报告撰写、表格制作等任务。同時(shí),还会把文档阅读、网页浏览、运行代码等执行过程,通过虚拟机图形用户界面在(zài)右侧对话框进行展示。
比如,在(zài)分(fēn)析特斯拉股价時(shí),展示了(le)收集信息-分(fēn)析报表-市场情绪-投资报告等思考的(de)全过程。这些过程看起來(lái)跟人類(lèi)解决问题的(de)思考和(hé)行动非常相似,根据指令需求都能自助完成。
“当其他AI只是在(zài)生产想法,Manus是交付成果。”Manus AI联合创始人兼首席科学家季逸超表示。
从業(yè)内反馈來(lái)看,相较ChatGPT、Claude等仅能提供建议的(de)聊天類(lèi)产品,Manus的(de)最大不(bù)同是可以直接交付成果,如报告、PPT等。“它真的(de)可以给人干活,可以取代实习生了(le)。”
同時(shí),相较专用Agent,Manus不(bù)再局限于单一任务和(hé)领域,而是能够理解复杂指令、自主学习,能够完成跨领域的(de)复杂任务。
此外,Manus采用了(le)云中异步的(de)工作方式。简单说就是,在(zài)等待当前任务执行時(shí),可以执行其它任务,实现多任务竝(bìng)行,直接关闭电脑也不(bù)会影响任务进程。
多位试用者向搜狐科技表示,Manus的(de)产品交互体验优于同類(lèi)产品,会清晰地展示任务执行逻辑,对用户的(de)意图识别和(hé)推理过程都不(bù)错,中间输入新(xīn)的(de)指令,也不(bù)会中斷(duàn)任务。
有体验者还观察到(dào)细节,在(zài)Manus遇到(dào)无法解决的(de)问题時(shí),还会向用户發(fā)出求助,比如输入登陆密码、验证码,或者选项太多会先让用户做选择,然后再繼(jì)续完成任务。
不(bù)过,对于比较复杂的(de)任务,Manus要跑1个多小時(shí),甚至好(hǎo)几个小時(shí),效率有待提高,有時(shí)还会出现bug卡住,无法顺利运行交付。
此外,由于底层模型固有的(de)幻觉,以及搜索的(de)不(bù)准确性、不(bù)完整性等因素,最终输出的(de)内容准确性、完成度(dù)和(hé)用户满意度(dù)还有待完善。
在(zài)应用场景方面,Manus目前聚焦在(zài)信息整理范围,而没有触及到(dào)现实的(de)物理世界。此前,国内不(bù)少企業(yè)都展示了(le)点咖啡、發(fā)红包的(de)智能体功能。
因此,有观点认为,Manus难以称得上是一款通用的(de)智能体产品。
“通不(bù)通用要看标准,标准低可能就通用,高的(de)话就都不(bù)通用了(le)。除了(le)基准测试,更关键的(de)还是要看用户体感。”国内某AI独角兽業(yè)务负责人王伟对搜狐科技表示。
当然,更多的(de)吐槽是邀请码太少,二手交易平台邀请码更有人报价8000万。初期各種(zhǒng)不(bù)吝赞美的(de)报道,拉高了(le)市场预期,但实际使用用户有限,这也让Manus面临饥饿营销的(de)质疑。
Manus AI合伙人张涛对此表示,从未开设任何付费获取邀请码的(de)渠道,从未投入任何市场推广预算,内测期间系统容量有限,将优先保障现有用户的(de)核心体验。
Manus到(dào)底有没有技术壁垒?套殼(ké)算不(bù)算创新(xīn)?
Manus取自拉丁文mens et manus(头脑和(hé)手),这也代表了(le)Manus团队的(de)理念,即让知识不(bù)仅存在(zài)于头脑之中,还要通过手应用到(dào)实际生活,从而对世界产生有益的(de)影响。
这个过程,Manus借助了(le)多个技术。有技术人士(shì)认为,Manus的(de)本(běn)质是Virtual Machine(虚拟机)+ Compute Use(计算机调用) + Artifacts (生成物)+ Multi-Agent(多智能体)。
这其中的(de)关键是多智能体架构,其运行在(zài)独立的(de)虚拟机中,规划、执行和(hé)验证三个子模块分(fēn)工协作,竝(bìng)由多个独立模型分(fēn)别解决不(bù)同的(de)任务,从而实现对复杂任务的(de)处理。
从公开信息來(lái)看,Manus模型采用了(le)美国AI独角兽Anthropic的(de)Claude模型和(hé)阿里通义的(de)Qwen模型,其中Claude负责输出,Qwen负责调度(dù)。
从底层模型和(hé)技术组成來(lái)说,Manus基本(běn)是站在(zài)前人的(de)肩膀上。虚拟机早在(zài)计算机领域广泛应用,Compute Use和(hé)Artifacts都不(bù)是Manus的(de)首發(fā),Anthropic的(de)Claude此前就已推出这两项功能。同样,多智能体也不(bù)是新(xīn)颖的(de)概念和(hé)应用。
“从实际结果看,Manus能实现的(de)更多,包括底层的(de)Claude也能进一步通过生成代码解决问题。”王伟对比自家智能体后表示。
这也导致Manus爆(bào)火后面临模型套殼(ké)、“缝合怪”、没有技术壁垒的(de)质疑。
有开發(fā)者就提到(dào),Manus的(de)自主规划能力,是基于现有大模型的(de)调用,竝(bìng)未有底层技术的(de)突破。例如,在(zài)股票分(fēn)析案例中, Manus仅通过调用雅虎金融API获取数据,再借助Python脚本(běn)生成可视化图表,本(běn)质仍是工具链的(de)拼接。
当然,也有观点认为,套殼(ké)到(dào)极致就是创新(xīn)、就是胜利。其实,不(bù)少AI应用产品都是套殼(ké),但套殼(ké)竝(bìng)非没有价值(zhí),关键看能否满足用户需求,更好(hǎo)地解决用户问题。
“创新(xīn)得看‘大家知道但还没發(fā)布’,还是‘大家不(bù)知道’。DeepSeek 能做出大家先前意想不(bù)到(dào)的(de)成果,比如通过纯强化学习就让 R1-Zero 获得了(le)反思能力。Manus更多的(de)是比别人快,有其它厂商也在(zài)研相似产品,但它是第一个發(fā)出來(lái)。”王伟表示。
因此,严格來(lái)说,那些把Manus视为下一个DeepSeek,或是将Manus和(hé)DeepSeek竝(bìng)列为中国AI技术创新(xīn)突破的(de)论调,可能犯了(le)逻辑上的(de)错误——DeepSeek本(běn)质是技术主导,而Manus则是产品主导,评判的(de)标准竝(bìng)不(bù)一样。
在(zài)王伟看來(lái),Manus本(běn)身是产品,不(bù)是模型,不(bù)会有很多技术上的(de)创新(xīn),但是把现有技术组装好(hǎo),也能显著提升解决问题的(de)效果。
他还提到(dào),Manus只是代表了(le)做智能体的(de)一種(zhǒng)路线,也可以不(bù)用虚拟机去做。“智能体如何正确解决一个问题,现在(zài)还存在(zài)很大分(fēn)歧。”他以查询阿里股价为例,介绍了(le)四種(zhǒng)方式及其优劣。
目前,Manus的(de)同類(lèi)型产品还有Flowith、Mgx等。在(zài)王伟看來(lái),Manus算比较成熟,在(zài)产品设计和(hé)工程构建上花了(le)很多心思。如果没有之前的(de)积累,从零去追得花三个月到(dào)半年時(shí)间。
这跟Manus团队背景分(fēn)不(bù)开,其创始人肖弘,是连续创業(yè)者,此前开發(fā)了(le)企業(yè)微信SaaS工具微伴助手和(hé)壹伴助手,后來(lái)推出AI浏览器插件Monica,实现上千万用户和(hé)盈利。
肖弘的(de)创業(yè)伙伴、Manus AI产品合伙人张涛先后在(zài)字节跳动、光年之外等负责产品;首席科学家季逸超则是Magitech Labs创始人,开發(fā)的(de)iOS浏览器“猛(měng)犸”曾获MacWorld特等奖。
可见,Manus主创团队基本(běn)是以产品为主,竝(bìng)不(bù)是聚焦底层技术,Manus符合团队基因。但或是正因如此,这也导致了(le)Manus的(de)护城河竝(bìng)不(bù)高。
有观点认为,Manus的(de)能力边界取决于基础模型本(běn)身,随着大模型能力的(de)进化,其能力会被大模型内化掉。在(zài)基础模型没有突破前,这類(lèi)产品的(de)价值(zhí)有限。
搜狐科技也不(bù)止一次看到(dào)过这種(zhǒng)观点:字节这種(zhǒng)大模型厂商很快就能做出來(lái)類(lèi)似Manus的(de)产品。
实际上,Manus在(zài)發(fā)布不(bù)到(dào)两天后,已有开發(fā)者至少复现了(le)两款Manus 开源版产品——开源平台CAMEL AI 的(de)OWL项目,以及MetaGPT团队花了(le)三个小時(shí)复刻出OpenManus。
Agent商業(yè)化元年,为何国内外都看好(hǎo)智能体?
客观地讲,Manus虽然不(bù)是類(lèi)似DeepSeek的(de)技术创新(xīn)突破,但它通过工程组合优化,进一步优化了(le)智能体产品的(de)体验,一定程度(dù)打开了(le)对智能体产品的(de)想象空间。
不(bù)过,至于它是否是智能体应用的(de)ChatGPT時(shí)刻或DeepSeek時(shí)刻,可能还有待商榷。
这次的(de)意外爆(bào)火,也超出Manus团队的(de)预料。张涛發(fā)文称,Manus还是襁褓中的(de)小婴儿,离正式版想交付的(de)体验还差很远,模型幻觉、交付物友好(hǎo)度(dù)、运行速度(dù)等还有很大提升空间。
Manus的(de)爆(bào)火,也反应出業(yè)内对真正好(hǎo)用的(de)智能体产品的(de)期待。Manus团队还需在(zài)产品上下更大的(de)功夫,有报道称其将开启新(xīn)的(de)融资。
目前,国内外普遍都认为,2025年会是智能体商業(yè)化元年,竝(bìng)被视为大模型超級(jí)应用的(de)突破点,不(bù)少公司都在(zài)布局智能体。
今年初的(de)CES上,英伟达發(fā)布了(le)基于Llama的(de)智能体服务模型。黄仁勋认为,智能体是新(xīn)的(de)数字勞(láo)动力,智能体時(shí)代已然到(dào)來(lái),有望成为万亿級(jí)的(de)机会。
OpenAI年初推出其首款AI智能体Operator,随后2月,又推出面向深度(dù)研究领域的(de)智能体Deep Research功能,其由o3模型支持,竝(bìng)计划扩展数据源和(hé)结合Operator执行复杂任务。
“我们相信2025年,会看到(dào)第一批AI智能体加入勞(láo)动力大军。”奥特曼表示,智能体将给AI领域带來(lái)全新(xīn)变革,改变AI的(de)应用模式和(hé)發(fā)展方向。
最新(xīn)报道称,OpenAI还将推出一款“博士(shì)水平”的(de)智能体,能够处理学术研究和(hé)软件开發(fā)领域中的(de)复杂任务,每月收费可能在(zài)2000美元到(dào)2万美元之间。
“智能体是AI应用的(de)最主流形态,即将迎來(lái)爆(bào)發(fā)点。”李彦宏在(zài)去年底表示。目前,百度(dù)文心智能体平台已吸引超80万开發(fā)者,其它大厂肯定也不(bù)会错过智能体的(de)机会。
独角兽也在(zài)跟进。智谱去年底就推出智能体AutoGLM,竝(bìng)在(zài)端侧落地。搜狐科技获悉,智谱将会發(fā)布智能体在(zài)信息处理领域的(de)更多功能。
阶跃星辰CEO姜大昕认为,智能体爆(bào)發(fā)的(de)两个必要条件——多模态和(hé)慢思考都已实现,智能体具备的(de)能力会从简单任务、组合任务、复杂任务,向主动發(fā)起任务、情感陪伴等升級(jí)。
Manus的(de)火爆(bào)或很难持续,但也给创業(yè)者不(bù)少启示。Manus团队提到(dào),初创团队具备更高的(de)敏捷性和(hé)决策速度(dù),跑过了(le)大公司的(de)惯性,从而把握了(le)3个月的(de)战略窗口期。
Manus坚持的(de)“Less Structure、More Intelliengence”的(de)理念,即用更少的(de)规则程序,给予AI更多自主权,从而提高产品智能,这種(zhǒng)非共识同样值(zhí)得借鉴。
他们还提出了(le)新(xīn)的(de)衡量AI产品成功的(de)指标,看 AHPU(Agentic Hours Per User),用來(lái)衡量每个用户使用了(le)多少Agent時(shí)间,摆脱了(le)传统看DAU的(de)互联网模式窠臼。
目前,Manus单次任务成本(běn)约2美元,低于OpenAI的(de)10美元。但动辄半小時(shí),甚至数小時(shí)的(de)运行,意味着整个过程算力消耗不(bù)会低。基于新(xīn)指标,或能探索出与之匹配的(de)商業(yè)模式。
无论如何,智能体已是行業(yè)共识,永远值(zhí)得期待的(de)是下一个“Manus”,从而真正地把智能体带入我们的(de)日常。
(应受访者要求,王伟为化名)
版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。