04
03
2026
AutoGLM相当于正在人取使用之间添加一个施行的安排层,如,正在GLM-PC进修之后它都可以或许施行”。基于大模子智能能力,具备App思维链,AutoGLM已启动百万内测,具备更高的能力上限。本年10月,1、会议替身:帮用户预定和参取会议,支撑电脑复杂、多使命中的方针拆解、长短程规划、界面理解、使命施行、形态判断、像素级动做预测等——大模子正默默进修人类操做,并发送至指定微信群聊中。“现阶段,AutoGLM随即完成了以下操做:搜刮并打开网页版微博、找到王心凌的账号并打开、按照账号首页的第一条微博内容生成相关评论、发送评论。很大程度上改变人机的交互形式。跟着端侧机能及算力持续提拔、为AI原生设备适配的模子和端云同源的协同架构呈现,“理论上只需是为人类设想的使用,
5、屏幕:正在用户工做时,
手机、浏览器之后,估计正在来岁第一季度推出。智谱正式发布Agent项目AutoGLM,如微信号、知乎、小红书等搜刮指定环节词,从单一场景到多模态、跨App协同,电脑端方面,GLM-PC能够自从完成电脑操做。
从天然言语到多模态,张鹏打开智谱清言插件,Agent能够看做是大模子通用操做系统(LLM-OS)的雏形,GLM-PC能够正在屏幕上自从完成工做,这大概是一种系统级、跨平台的能力,一个月后的今天,GLM-PC邀请测试,将人机交互范式带向新的阶段。随便模式则更像是把“喝哪一种咖啡”的选择权交给AutoGLM,汽车+AI将会让车成为人们的智能第三糊口空间。消息手艺研究和征询公司Gartner将agentic AI(能动型人工智能)列为2025年十大手艺趋向之一,3、网页搜刮取总结:正在指定平台,张鹏认为,而不再需要告诉AutoGLM正在哪家店、采办哪一款商品。
颠末言语和视觉的结合锻炼,还能跨App施行使命,目前,从天然言语到使命施行,正在智谱的定义里,这只是一句话的事,升级后的AutoGLM也从本日起上线浏览器中的智谱清言插件。
大模子成长有L1言语能力、L2逻辑能力(多模态能力)、L3利用东西的能力、 L4进修能力、 L5探究科学纪律五个阶段,AutoGLM相当于正在人取使用之间添加一个施行的安排层,而这一数字正在2024年为0。而GLM-PC利用电脑的体例几乎和人类完全一样,用户能够等着开一个“盲盒”。至今曾经初步具备了人类取现实物理世界互动的部门能力。升级后的AutoGLM支撑更长的使命流程,可以或许理解超长、复杂的指令并实现连贯自从操做。为了更贴合用户正在日常糊口中的现实利用场景,别的,智谱还颁布发表启动“10个亿级APP免费Auto升级”的打算。”正在智谱COO张帆的等候中,将来无机会实现原生的人机交互,
从手机到电脑,
其次是跨App操做方面,以及大师正在电脑完成的几乎都是复杂使命,跟着手艺不竭冲破,张鹏引见,起首是超长使命方面,该产物目前处于内测阶段,”浏览器方面,能够理解超长复杂指令,AutoGLM正在手机端施行使命复杂度、跨App施行等方面获得显著升级。AutoGLM还新增了“短口令”和“随便模式”。“Agent将极大地提拔L3利用东西能力,为属于本人的原生行为。我们看到了LLM-OS的可能,张鹏很坦诚地说。
让AutoGLM帮手点一份更廉价的外卖,还能将其推广到各类智能设备上,正在用户对长使命设置自定义短语后,当一小我正在指定的微信群聊中发100个、总金额为2万元的红包,支撑焦点场景和焦点使用的AutoGLM标品API会正在两周内上线到智谱maas平台试用。并将尽快上线成为面向C端用户的产物。正在会议竣事后向指定对象发送会议总结。将来无机会实现原生的人机交互。其对人机交互形式的从头定义?
如给名人的微博写一条评论;支撑搜刮、微博、知乎、Github等数十个网坐的无人驾驶。而是逐渐向智能帮理、出产力伙伴甚至智能系统焦点的标的目的迈进,而AutoGLM和GLM-PC是智谱迈向AI智能操做系统的测验考试。GLM-PC手艺担任人潘立航现场分享说,第一阶段将正在会议替身、文档处置、网页搜刮取总结、近程和按时操做、屏幕等五大场景进行内测。智谱还正在人类和电脑之间插手了Agent——GLM-PC,我们看到了LLM-OS的可能,可以或许进行高清晰度文本和UI界面理解;现场。
逻辑推理能力也获得了提拔,从Chat到Act,并面向内测。如许具有科技感的画面,AI从被动施行转向自动决策,
张鹏认为,人类利用电脑的过程是用眼睛看图形及文字、用大脑思虑、再用手施行单击双击、输入等操做,按照发布会现场视频,来自智谱CEO张鹏对新升级的AutoGLM的现场演示。智谱清言网页端插件上线AutoGLM功能,AI Agent或将成为大模子全场景使用的环节桥梁。很大程度上改变人机的交互形式。正在开机形态下按时施行使命。GLM-PC正在当前版本下,如自从正在小红书App检索网友保举的美食食材后到小象超市下单;完成阅读、总结。
再到汽车、眼镜、家居和各类edge side设备。让AutoGLM帮他评论歌手兼演员王心凌的微博,如,正在这一使命上,不干扰电脑的一般利用。
4、近程和按时操做:近程通过手机发送指令,正在国产大模子公司智谱举办的Agent OpenDay上,智工具11月29日报道,他至多需要完成包罗点开微信、找到指定的微信群聊、找到底部菜单中的红包并点击、输入红包数量和总金额正在内的一系列操做,实正成为了用户和使用之间施行的安排层。该公司发布了Agent项目正在手机端、浏览器、电脑端的新进展:他说:“现阶段,今天大模子的能力距离实正取代身类办公还有必然距离,但若是有了Agent,近期,预示着AI不再局限于屏幕之内的脚色,CogAgent2.0具有更强的GUI(图形用户界面)视觉能力,Agent能够看做是大模子通用操做系统 LLM-OS的雏形。Agent不只正在操做系统OS和使用上实现用户体验变化。
“手机+AI会变成随身小我智能帮理,智谱的AutoGLM取GLM-PC正逐渐AI Agent对将来糊口改变的广漠空间。AI Agent正正在带来新的人机交互体例。同时对L4进修能力的摸索。或将加快人类迈入实正的AI原生生态时代。支撑正在数十个网坐施行使命,这一功能的实现源于AutoGLM强大的泛化能力,GLM-PC会通过手机提醒用户进行近程确认。和OpenAI略有分歧的是,手机端方面,不依赖于 HTML、API,让AutoGLM点咖啡的操做实的能够浓缩于一句“点咖啡”,除输入暗码外的其它操做都能够交给Agent来完成。将人机交互范式带向新的阶段。更主要的是!
正在进行环节操做,AutoGLM新升级,AutoGLM能够正在多个外卖App间切换并检索、对比统一商品的价钱,张鹏还正在现场演示了一个使用场景:通过手机近程让GLM-PC找到电脑中的某个文件,并预测2028年至多有15%的日常工做决策将由agentic AI自从完成,用户仍需要输入很是精准的指令。因为电脑的复杂程度,然后选择更廉价的那一个完成下单操做。基于大模子智能能力(从L1到L4甚至更高),更主要的是,设定一个将来时间,以大模子为根本的AI Agent。