谷歌Gemini实时人工智能视频功能结合Project Astra与多模态AI技术，提升智能手机摄像头的拍摄体验

随着科技的快速发展，人工智能技术正在不断革新我们的日常生活。近日，谷歌公司宣布了一项全新的功能升级，引发了广泛关注。根据IT之家3月24日的报道，谷歌发言人亚历克斯・约瑟夫在一封发给The Verge的邮件中确认，谷歌已经开始为Gemini Live引入新一代的人工智能技术。这项技术的核心亮点在于，它能够通过用户的智能手机摄像头实时捕捉屏幕，并提供与画面相关的即时解答。

这一新功能的推出距离谷歌首次展示“阿斯特拉项目”（Project Astra）已经接近一年。回顾去年5月举行的2024年I/O开发者大会，谷歌展示了基于Gemini模型的全新多模态AI项目——Project Astra。该项目不仅可以在Pixel手机上本地运行，还被视为OpenAI GPT-4o的有力竞争者。

谷歌表示，Project Astra是一个前沿的多模态AI项目，其核心功能是通过用户打开的摄像头，实时解释和分析画面中的物品信息。这意味着，用户可以通过简单的摄像头操作，快速获取关于画面的详细解析。这一技术的推出，无疑将极大地提升用户体验，并为未来的智能设备交互方式开辟新的可能性。

需要注意的是，文章内可能包含对外跳转链接（如超链接、二维码或口令等形式），旨在为读者提供更多参考信息。但这些仅供了解，最终结果需用户自行甄别。根据IT之家的规定，所有文章均包含此声明。

本文来源：