标签:GUI操作

看懂

CogAgent-9B-20241220:智能体任务的开源模型 智谱技术团队于12月26日宣布,正式开源了专为智能体任务设计的基座模型——CogAgent-9B-20241220。该模型基于GLM-4V-9B训练而成,旨在通过屏幕截图输入,预测用户在图形用户界面(GUI)上的下一步操作。这一特性使得CogAgent能够广泛应用于个人电脑、手机和车机设备等各类GUI交互场景。 模型升级亮点 相较于2023年12月发布的首版CogAgent模型,CogAgent-9B-20241220在多个方面实现了显著提升: 1. GUI感知与推理预测准确性:新版本在理解和预测用户意图方面更加精准。 2. 动...