► 文 观察者网 张睿佳 编辑 张广凯
3月6日一早,国内AI圈被两件事刷屏了。一件是前一天深夜阿里通义千问发布的全新(xīn)推理模型QwQ-32B,该模型凭借小得多的参数量,實(shí)现了与DeepSeek-R1相当的表现,并且在理论层面也区别于DeepSeek,证明了强化学习(RL)路线仍有(yǒu)巨大潜力。
相比于此前已经积累了优异口碑的阿里通义,另一件事的主角Manus,就显得名不见经传了。
这个神秘的新(xīn)产品,目前还没有(yǒu)公开上线,只能通过邀请码使用(yòng),目前一码难求。但国内一些头部AI自媒体却几乎在同一时间蜂拥发文,宣传它是全球首款通用(yòng)Agent,實(shí)力碾压OpenAI,甚至(zhì)不惜使用(yòng)“唯有(yǒu)惊叹”“载入史册”这样的表述。
各家自媒体也不约而同地把Manus关联到“国家科技實(shí)力象征”,喊出“今夜这一片星空属于China”“2025,东方破晓”这样的口号。
那么Manus究竟是何方神圣?
据介(jiè)绍,Manus是一款AI Agent产品,背后公司名为Monica,创始人肖弘毕业于华中科技大学,是一名连续创业者。
在自媒体的宣传中,不少人宣称是Manus團(tuán)队的朋友,通过人脉获取了邀请码。在宣传文案中,Manus的评测绝大部分都是对官方宣传案例的各种解析,只有(yǒu)少数媒体提供了非官方案例测评。
在官方发布的演示视频中,展示了三个场景:上传包含多个简历的压缩包,根据提示词,自动解压缩并分析简历,然后给出建议;提出你对房产的需求,Manus自动幫(bāng)你做房价和信息的整理;对英伟达和特斯拉股价生成分析报告。
简而言之,使用(yòng)传统AI大模型时,用(yòng)户提一个需求,AI完成一个;再提一个,AI继续完成下一个……以此类推。而Manus则无需这么繁琐,用(yòng)户提一个需求后,Manus能够自动搜索、自动思考下一步,幫(bāng)助用(yòng)户做好分析,甚至(zhì)还能做出详细的表格、PPT等。
展开全文
有(yǒu)自媒体演示了使用(yòng)Manus生成一份介(jiè)绍小米SU7十页的PPT。演示中,用(yòng)户提示词只有(yǒu)“幫(bāng)我做一下介(jiè)绍小米SU7十页的PPT”这么一句话,随后Manus便自主收集信息,最终生成了十页PPT。
因此,Manus将自己标榜为全球第一个通用(yòng)AI Agent。
产品官网显示,Manus在GAIA基准测试中取得SOTA的成绩,该成绩大幅超过OpenAI,意味着Manus在解决现實(shí)世界问题方面表现优秀。
由于Manus目前尚未向公众开放,因此很多人还无法验证产品的實(shí)际表现。但是对于Manus的质疑已经很快到来。
自媒体“硅星人Pro”发文指出,Manus官方演示的几个功能,此前OpenAI的 Operator,以及智谱AI 的 Phone Use等都已经實(shí)机展示。
更有(yǒu)开发者质疑,Manus是否仅为海外(wài)技术的“本(běn)土化套壳”?其“自主性”是否被过度夸大?
有(yǒu)网友评论称,Manus的核心架构与 Anthropic的“ComputerUse”高度相似,均依赖多代理虚拟机环境完成任务。而其所谓的“自主规划”能力,實(shí)则是基于现有(yǒu)大语言模型(如GPT-4)的调用(yòng),并未展示底层技术的突破。例如,在股票分析案例中,Manus仅通过调用(yòng)雅虎金融(róng)API获取数据,再借助Python脚本(běn)生成可视化圖(tú)表,本(běn)质仍是工具链的拼接。
也有(yǒu)一些网友指出,目前关于Manus的讨论基本(běn)限于中文互联网,尽管其产品发布使用(yòng)的是英文而非中文,但极度发达的海外(wài)AI社区中对此基本(běn)没有(yǒu)关注。
而Manus的邀请码机制,也被质疑是“饥饿营销”。
截至(zhì)目前,Manus并未直接回应技术层面的质疑,但有(yǒu)自称Manus AI合伙人张涛的网友在社交平台回应称,“目前采取邀请码机制,是因为此刻服务器容量确實(shí)有(yǒu)限,不得已而为之,團(tuán)队也熬夜搞了一整天了。希望在接下来的时间里能让更多处在waitlist中的用(yòng)户优先体验Manus。”张涛表示,“恳请大家对一家几十人的创业公司多一点包容和理解,團(tuán)队正在全力输出,让大家早日体验上更好的产品。”
张涛还强调,公司从未投入任何市场推广预算。
来源|观察者网
版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。