国内AI新星Manus陷“高开低走”争议:是真突破还是过度炒作?
更新时间:2025-03-10 10:12 浏览量:2
上线才三天,Discord服务器就被挤爆13万用户涌入,邀请码在二手市场被炒得飞起——有个叫Manus的中国AI产品,现在火得比泰勒·斯威夫特演唱会门票还抢手。不过这个被某些专家吹成"史上最牛智能系统"的平台,实际用起来可没宣传片里那么神。
杭州那家叫蝴蝶效应的公司上周突然搞了个大新闻,说他们做出了"完全自主的AI管家"。Hugging Face那边有个产品总监在推特上说"这是我见过最带劲的AI",还有个叫Dean Ball的研究员也跟着捧场,说这是"用AI搭出来的最复杂电脑"。他们放出来的宣传视频里,有个叫季一超的技术头头信誓旦旦地说,在什么GAIA测试里比OpenAI的深度研究工具还厉害,能"把想法直接变成现实"。
然后,用户的实际测试后,发现效果难以让人满意
AI 初创公司 Pleias 的联合创始人亚历山大·多里亚在 X 上的一篇帖子中表示,他在测试 Manus 时遇到了错误信息和无尽的循环。其他 X 用户指出,Manus 在事实问题上出错,并且没有始终如一地引用其工作——而且经常遗漏那些在网上容易找到的信息。
TechCrunch记者们的测试更是让人头疼:
从我送货范围内的一家高评价快餐店订购一个炸鸡三明治。大约十分钟后,Manus 崩溃了。在第二次尝试中,它找到了一个符合我标准的菜单项,但 Manus 无法完成订购过程——甚至无法提供结账链接。
让 Manus 预订从纽约到日本的航班时,它同样失误了。考虑到我认为没有太多歧义的指示(例如“寻找商务舱航班,优先考虑价格和灵活的日期”),Manus 所能做的最好就是提供几个航空公司网站和像 Kayak 这样的机票搜索引擎的票价链接,其中一些链接是失效的。
后来有懂行的在社交媒体爆料,原来Manus根本不是完全自己搞的。他们主要用的是Anthropic的Claude和阿里的通义千问这些现成模型改装的,主要就处理些写报告、分析数据这些常规活。官网上那些买房、开发游戏的炫酷案例,实际用起来连简单指令都经常出错。
蝴蝶效应公司的人跟TechCrunch说现在还在"封闭测试阶段主要做压力测试",不过网上疯传的那个"Manus同时操作多个手机"的视频,季一超自己都承认是摆拍的。
现在这场狂欢明显有人在背后推波助澜:限量邀请码被黄牛炒到几千块,QQ新闻天天吹这是"国产黑科技",还有一堆科技博主夸大其词。虽然有人拿它跟DeepSeek比,但业内知道内情的都说根本不是一回事——人家DeepSeek坚持自己搞模型还开源,Manus到现在也没拿出真东西。
现在Manus的Discord群里每分钟几十条消息刷屏,有用户夸它"写行业报告真牛逼",也有人说"连基本事实都能搞错"。季一超之前说"我们正在改变人机协作的方式",现在看来变革是来了,不过可能要先经历阵痛期。