Project Jarvis

谷歌计划推出“Project Jarvis”,助力用户自动化日常任务

据IT之家报道,谷歌计划在12月预览其大型动作模型“Project Jarvis”。知情人士透露,这一项目将帮助用户执行各种任务,如收集研究资料、购买产品或预订航班。图源来自Pexels。

“Jarvis”将基于谷歌Gemini技术,专为Chrome浏览器优化

据报道,“Jarvis”将由未来版本的谷歌Gemini驱动,并且专门针对Chrome浏览器进行了优化。该工具能够通过截取屏幕截图、解析并自动点击按钮或输入文本,帮助用户自动化日常的网页任务。目前,该工具在执行不同操作时,中间会有几秒钟的间隔时间。

大型AI公司纷纷推出类似功能

目前,所有大型AI公司都在研发类似功能的模型。例如,微软的Copilot Vision可以与用户讨论正在浏览的网页;苹果的Apple Intelligence预计将在明年具备跨多个应用程序的屏幕识别能力;Anthropic刚刚推出的Claude测试版已经能够在计算机上执行操作;而OpenAI也在研发类似的功能。

谷歌“Jarvis”计划可能调整,先向测试者发布

据称,谷歌展示“Jarvis”的计划也可能有所变动,预计会首先向少量测试者发布,以便公司能够及时修复潜在的Bug。广告声明:本文内含对外跳转链接(包括但不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

本文来源: IT之家【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...