Project Jarvis

谷歌计划推出“Project Jarvis”，助力用户自动化日常任务

据IT之家报道，谷歌计划在12月预览其大型动作模型“Project Jarvis”。知情人士透露，这一项目将帮助用户执行各种任务，如收集研究资料、购买产品或预订航班。图源来自Pexels。

“Jarvis”将基于谷歌Gemini技术，专为Chrome浏览器优化

据报道，“Jarvis”将由未来版本的谷歌Gemini驱动，并且专门针对Chrome浏览器进行了优化。该工具能够通过截取屏幕截图、解析并自动点击按钮或输入文本，帮助用户自动化日常的网页任务。目前，该工具在执行不同操作时，中间会有几秒钟的间隔时间。

大型AI公司纷纷推出类似功能

目前，所有大型AI公司都在研发类似功能的模型。例如，微软的Copilot Vision可以与用户讨论正在浏览的网页；苹果的Apple Intelligence预计将在明年具备跨多个应用程序的屏幕识别能力；Anthropic刚刚推出的Claude测试版已经能够在计算机上执行操作；而OpenAI也在研发类似的功能。

谷歌“Jarvis”计划可能调整，先向测试者发布

据称，谷歌展示“Jarvis”的计划也可能有所变动，预计会首先向少量测试者发布，以便公司能够及时修复潜在的Bug。广告声明：本文内含对外跳转链接（包括但不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

本文来源：