附内测地址AI开始接管物理世界

今天在智谱,很震撼。先看视频:

这两天,正在写一篇文章:《物理世界的接口,探索 AI 如何与世界交互》,并打算吐槽一下:

几乎所有 AI 大厂,都在做一件事:更好的 Chatbot,然后疯狂刷榜&PR」

却少有人关心:AI 如何真正有效的改变世界、改变生活。

文章还没写完,就被拎到了智谱发布会...

被发了个群红包(喜

红包很大,两万块(大喜

红包很多,100个(特喜

我没抢到(悲

附内测地址AI开始接管物理世界-2

但最终,

发现智谱走在了更前面... (喜

链接物理世界

放个片子:

上个月,Claude 发布了一款新的 API,Computer Using:

革命序章:Claude 3.5 新 API,可操作电脑

这次,智谱更进一步,发布了成熟产品:GLM-PC,也可以叫「牛牛」,Logo 是头牛

附内测地址AI开始接管物理世界-3

形式上虽是 ChatBot,落地完全不同:

从纯语言理解转,向物理世界的交互

因现场没有过于演示,我自己测了下:「让 AI 自动给B站上战鹰点赞投币」

附内测地址AI开始接管物理世界-4

任务完成,很顺利,看下面的视频:

这里有个细节,让我挺惊讶:当 GLM-PC 准备投币时,会主动暂停并询问确认 - 由 AI 主动发起,这就有意思了。

从技术角度看,这个行为意味着 GLM 实现了:

语义理解:它知道"投币"和"点赞"虽然都是互动行为,但投币会消耗用户的虚拟货币

场景认知:它能识别出哪些操作需要额外确认,而不是简单地执行所有指令

决策判断:它会在关键节点主动暂停,等待用户的二次确认

这是一种有趣的思路: AI 再是一个单纯的"执行者",而是在执行的过程中,判定是否合理 。

(刚好的,OpenAI 之前讨论过这个: OpenAI:搞 Agent 时,你要注意这些 )

另一个牛逼的是... 它支持我用手机来操作电脑

在绑定了手机后,输入指令:「给渤海小吏投币」后,

附内测地址AI开始接管物理世界-5

电脑也会完成这一操作

附内测地址AI开始接管物理世界-6

这个操作可以定时... 所以非常适合... 打卡。

牛牛这东西,内测地址在这(Mac 可用):https://www.wjx.top/vm/mOs9cHw.aspx

还有一个基于浏览器的,更通用(智谱清言浏览器版):

https://new-front.chatglm.cn/webagent/landing/index.html?channel=ads_news_openday

来自异次元的红包

最能打动我的,总是红包。

发布会现场,张鹏总对着手机说了句:往群里发个红包,2万块,100个

于是... 人类收到了来自 AI 发送的第一个红包(虽然我没收到...碎碎念ing)

同样,发红包的过程中,对于敏感操作如支付,也会主动请求用户确认。

附内测地址AI开始接管物理世界-7

2万块的微信红包

附内测地址AI开始接管物理世界-8

微信没抢到(悲)

附内测地址AI开始接管物理世界-9

一份支付宝红包

附内测地址AI开始接管物理世界-10

支付宝抢到了(喜)

这个在手机里的产品,叫做 AutoGLM,内测地址

https://agent.aminer.cn/

再度开源

这些之外,端侧模型 GLM4-Edge 今天也有发布

由两种尺寸的大语言对话模型和多模态理解模型组成

1.5B / 2B模型主要面向手机、车机等平台

4B / 5B 模型主要面向 PC 等平台

附内测地址AI开始接管物理世界-11

发布即开源

附内测地址AI开始接管物理世界-12

https://github.com/THUDM/GLM-Edge

最后,我想说的是

从实验室数字,到物理世界的操控

从语言理解,到现实世界改变

可能是 AI 下一个突破口

版权声明:
作者:小火箭
链接:https://www.xiaohuojian9.top/274.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>