国内AI新星Manus陷“高开低走”争议：是真突破还是过度炒作？

更新时间：2025-03-10 10:12 浏览量：2

上线才三天，Discord服务器就被挤爆13万用户涌入，邀请码在二手市场被炒得飞起——有个叫Manus的中国AI产品，现在火得比泰勒·斯威夫特演唱会门票还抢手。不过这个被某些专家吹成"史上最牛智能系统"的平台，实际用起来可没宣传片里那么神。

杭州那家叫蝴蝶效应的公司上周突然搞了个大新闻，说他们做出了"完全自主的AI管家"。Hugging Face那边有个产品总监在推特上说"这是我见过最带劲的AI"，还有个叫Dean Ball的研究员也跟着捧场，说这是"用AI搭出来的最复杂电脑"。他们放出来的宣传视频里，有个叫季一超的技术头头信誓旦旦地说，在什么GAIA测试里比OpenAI的深度研究工具还厉害，能"把想法直接变成现实"。

然后，用户的实际测试后，发现效果难以让人满意

AI 初创公司 Pleias 的联合创始人亚历山大·多里亚在 X 上的一篇帖子中表示，他在测试 Manus 时遇到了错误信息和无尽的循环。其他 X 用户指出，Manus 在事实问题上出错，并且没有始终如一地引用其工作——而且经常遗漏那些在网上容易找到的信息。

TechCrunch记者们的测试更是让人头疼：

从我送货范围内的一家高评价快餐店订购一个炸鸡三明治。大约十分钟后，Manus 崩溃了。在第二次尝试中，它找到了一个符合我标准的菜单项，但 Manus 无法完成订购过程——甚至无法提供结账链接。

让 Manus 预订从纽约到日本的航班时，它同样失误了。考虑到我认为没有太多歧义的指示（例如“寻找商务舱航班，优先考虑价格和灵活的日期”），Manus 所能做的最好就是提供几个航空公司网站和像 Kayak 这样的机票搜索引擎的票价链接，其中一些链接是失效的。

后来有懂行的在社交媒体爆料，原来Manus根本不是完全自己搞的。他们主要用的是Anthropic的Claude和阿里的通义千问这些现成模型改装的，主要就处理些写报告、分析数据这些常规活。官网上那些买房、开发游戏的炫酷案例，实际用起来连简单指令都经常出错。

蝴蝶效应公司的人跟TechCrunch说现在还在"封闭测试阶段主要做压力测试"，不过网上疯传的那个"Manus同时操作多个手机"的视频，季一超自己都承认是摆拍的。

现在这场狂欢明显有人在背后推波助澜：限量邀请码被黄牛炒到几千块，QQ新闻天天吹这是"国产黑科技"，还有一堆科技博主夸大其词。虽然有人拿它跟DeepSeek比，但业内知道内情的都说根本不是一回事——人家DeepSeek坚持自己搞模型还开源，Manus到现在也没拿出真东西。

现在Manus的Discord群里每分钟几十条消息刷屏，有用户夸它"写行业报告真牛逼"，也有人说"连基本事实都能搞错"。季一超之前说"我们正在改变人机协作的方式"，现在看来变革是来了，不过可能要先经历阵痛期。

国内AI新星Manus陷“高开低走”争议：是真突破还是过度炒作？

相似文章