ad1

狂热过后,我和几位硬件工程师聊了聊Manus的价值和意义

来源:投资界2025-03-11 07:57阅读量:7364      

在昨天拿到 Manus AI 的测试码、连续进行了数个小时的测试之后,有不少在手机/PC 厂商的工程师/产品经理朋友,来找我「打听」Manus AI 的真正能力如何。

为什么硬件行业这么关注 Manus?这与当下硬件行业最受关注的概念——LAM 有关。LAM 是一个从 LLM 延伸而来的名词,全名为大型行动模型 ,也称为大型智能体模型。

与 LLM 致力于「超越人类」,因此在训练方法上也经常突破人类经验完全不同,现阶段 LAM 想要做到的,是成为人类的手,去作为人类用户在数字世界中的代理人。

这与 Manus 的核心理念有相通之处。目前而言,Manus AI 的体验,围绕在一个运行在云端的 Ubuntu 操作系统虚拟机上,同时在操作系统中打开 Chrome 浏览器界面,在网页中或是调用其他软件,来完成各种用户的请求。

为了完成这个要求,Manus 需求同时具备「自然语义理解和计算机视觉」,以及「用户行为习惯学习与场景感知」,同时拥有「意图识别自主决策」的能力,当然最重要的,同时也是让 Manus AI 与此前的 Computer Use 在体验上拉开明显差距的,还是「跨应用调用工具」的能力。

举例来讲,对于常见的「能不能用 Manus AI 生成一段视频」这个问题,严格来讲回答是「可以」,但 Manus AI 去生成一段视频的方式,也是通过在网络上搜索第三方 AI 视频生成工具,并在这个过程中使用到各种工具,来完成用户的请求。

一、LAM 真正的未来

进入 2025 年,Agent AI,或者说 LAM 在端侧的落地,已经是再明显不过的趋势。但怎么落地,以及最终呈现给用户的会是怎样的商业产品,仍然有很多问题。

早在 2024 年初,彼时发布的 Rabbit R1 硬件,以及对应的 LAM 工具——Rabbit LAM Playground 其实已经展现出了今天我们在 Manus AI 中看到的能力雏形。

在官方的演示中,Rabbit R1 所搭载的 LAM Playground,能主动帮助用户完成类似音乐播放、打车等服务,实际上背后的技术原理,就是通过使用 LAM 来访问对应服务的网站,通过模拟人类与网站的交互方式,完成用户指令中的工作内容。

但彼时的 Rabbit Playground 受限于模型以及开发能力的限制,还并不能做到像人类一样,在互联网中畅通无阻。

在实际用户的测试中,面对类似人机验证这样的场景 Rabbit Playground 仍然难以通过,也无法使用第三方工具,来完成生成复杂表格、导出 PPT 这样的用户需求。

由于在实际使用中面临着诸多挑战,Rabbit R1 作为一款明星 AI 硬件,很快就退出主流用户的视野,AI 时代的热点变化的是如此之快,以至于到了 2025 年年初,在互联网上已经很难找到关于这款产品讨论的声音。

但 LAM 这个概念,作为一个可能改变人类用户与智能硬件设备交互的火种,留存了下来,仍然作为行业中一个重要的研究方向而存在。

Manus AI 的出现,尤其是它在自然语义理解,以及在互联网访问网站时,面对各种各样的人机识别,都能「畅行无阻」的能力,让不少仍然在致力于 LAM 产品开发、并希望在今年推出相关测试产品的人,再次看到了一个契机,并希望通过 Manus AI 目前的能力以及展现出的短板,来进一步完善自己的产品。

目前,在致力于开发 LAM 产品、来提升用户对手机/电脑等产品使用体验的硬件厂商中,系统级厂商在做 LAM 中,有着最明显的优势。

「Manus AI 这种命令执行方式,对于算力要求非常高,但如果是浏览器或智能手机操作系统来做这件事,能通过获得更多高质量数据的方式,大幅降低算力成本与提升运行速度」。

「做通用 LAM 并不用针对某些单一网站去适配,虽然在某些场景下可能」

「ManusAI中的一些简单的场景,并不需要完全搬到上面去处理,反而是留在端侧效果会更好」据这位面向桌面端开发 LAM 应用的开发者介绍,当前的端侧模型经过针对性训练之后,目前也能实现简单的通用网页访问并内容识别能力,已经能初步完成例如「访问旅游相关网站并制定旅游计划」这样的需求。

此外由于端侧有着更便捷的文件管理系统,同时也有更强大的本地文件管理工具,遇到类似「整理并分析简历」这样的需求,端侧 LAM 同样能做到更好的效果。

在我的实际测试中,我想要让 Manus AI 帮我生成一个 PPT 文件,它就能自动在电脑上安装对应的依赖环境,然后利用工具来自动完成 PPT 生成,虽然最终仍然完成了用户指令中的需求,但仍然因此大幅拉低了对请求的响应时间。

二、如何理解 Manus 的意义

当前,Manus AI 展示出的逻辑中,已经向外界展示了 LAM 在「生产力」领域能带来怎样的改变,但仍然有很多问题亟待解答。

其中最重要的,也是被问到最多的,或许就是商业化这件事:不少用户对于 Manus AI 这样的服务,最终会定价多少有着诸多的猜测。

除了类似 Manus AI 这样,完全交给云端运行,用户端只需要「输入命令 - 返回成果」的模式,前面提到的不少硬件厂商,实际上是将端侧/云端混合运行的模式作为主流方案。

这其实也暗示了,未来 LAM 的发展,或许将分为两个不同的主流方向;不仅有基于现有硬件算力,在端侧实现性能稍差的 LAM,也有完全基于云端的「数字代理」服务。

但这样的服务,距离最终投向市场可能还有不小的距离。「Manus AI 如果订阅的话,这样的服务 20 美元显然是完全不够的。」一位目前就职于手机厂商,研发 LAM 端侧应用的工程师对此评价道。

仅仅是全程虚拟机运行以及以及实时显示内容串流的高昂成本,就足以成为此类服务现阶段面向普通消费级市场的*阻力。

对于以 ChatGPT 为代表的 LLM 产品来讲,过去几年已经迅速建立起一套行之有效的订阅系统,用户也在「每个月 20 美元」的周期往复中,建立起了一个准确的心理预期。

如果 LAM 未来想要以这种「前端硬件 + 后端云服务」的方式继续存在,同样也要经历这样一个过程,同时在这个过程中将订阅成本快速拉低,最终将这一商业模式跑通。

随着完全在云端部署的 LAM 进一步完善,我们大概率会再次看到像 Rabbit R1 这样、有着更灵活形态的 AI 硬件设备出现:它可以是智能手表、也可以是 AI 眼镜,甚至都可能是完全不需要屏幕的智能耳机等设备。

到这个阶段,LAM 实际上已经进化成了 Agent UI:用户并不再需要传统手机桌面、浏览器那样的用户交互界面,只需要一个供用户输入指令的方式,以及接受 LAM 最终交付成果的终端。

它或许不如 LLM 那样科幻,但它却是在现有硬件的基础上,短期内我们能看到最明显、最有能力给用户与硬件的交互,带来改变的方向。

随着 Manus AI 进一步将 LAM 以及 Agent AI 能做到什么,展现给更多普通用户,这或许就是 Manus AI 在这场浪潮最终退去之后,给我们留下的最重要的收获。

「即便最终赢家不是它,它也足够意义重大。」一位 LAM 产品经理这样评价 Manus AI 的行业价值。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

责任编辑:许一诺

相关

我国原研双周制剂新型降糖药进医保价格下调为2型糖尿病患者提供新选
近期,国内的2型“糖友”兴奋不已——单次口服两片可平稳降糖14天的DDP-4抑制剂考格列汀片开始按新版医保目录执行,价格整体下调明显,未来的治疗成本将进一步下降。 除了个人的经济受益和治疗成本下降之外,各类新型降糖药的...
2025-03-11 05:28
榆中新先事金融活水精准滴灌民营企业
为助力民营经济开年稳增长、促发展,近日,榆中县工商联联合兰州银行榆中支行实施“银行行长进民企送服务早春行动”,深入县域重点企业走访调研,通过“面对面”问需、“一对一”纾困,为民营企业送上新春金融“及时雨”。 活动中,先...
2025-03-11 03:00
和讯投顾朱一鸣:全天缩量深V走势,调整到位了吗?
3月10日,和讯投顾朱一鸣分析认为,在今天的行情里,可以看到指数出现了一个低开之后,在中午收低,然后尾盘拉起,又是一个长下影线。今天的走势,朱一鸣认为似曾相识,就在3月4号,指数并不是一个低开之后的高走,而今天指数是一个...
2025-03-10 23:39
科达利通过高新技术企业复审,享15%优惠税率至2026年
雷达财经最新资讯,科达利近日通过了高新技术企业复审,获得由深圳市工业和信息化局、深圳市财政局、国家税务总局深圳市税务局联合颁发的《高新技术企业证书》,证书编号为GR202444202923,有效期三年,自2024年至20...
2025-03-10 20:52
独家对话尤洋:"部署DeepSeek月亏4亿"争议背后,潞晨不想
从上线DeepSeekAPI服务,到成为第一波官宣弃用DeepSeek的公司,AIInfra创企潞晨科技只用了不到一个月的时间。与此同时,在科技圈子里被传得沸沸扬扬的,还有伴随在创始人尤洋身上的争议。 其中一些原因,要...
2025-03-10 12:04
图文