谷歌Gemini实时人工智能视频功能结合Project Astra与多模态AI技术,提升智能手机摄像头的拍摄体验

随着科技的快速发展,人工智能技术正在不断革新我们的日常生活。近日,谷歌公司宣布了一项全新的功能升级,引发了广泛关注。根据IT之家3月24日的报道,谷歌发言人亚历克斯・约瑟夫在一封发给The Verge的邮件中确认,谷歌已经开始为Gemini Live引入新一代的人工智能技术。这项技术的核心亮点在于,它能够通过用户的智能手机摄像头实时捕捉屏幕,并提供与画面相关的即时解答。

这一新功能的推出距离谷歌首次展示“阿斯特拉项目”(Project Astra)已经接近一年。回顾去年5月举行的2024年I/O开发者大会,谷歌展示了基于Gemini模型的全新多模态AI项目——Project Astra。该项目不仅可以在Pixel手机上本地运行,还被视为OpenAI GPT-4o的有力竞争者。

谷歌表示,Project Astra是一个前沿的多模态AI项目,其核心功能是通过用户打开的摄像头,实时解释和分析画面中的物品信息。这意味着,用户可以通过简单的摄像头操作,快速获取关于画面的详细解析。这一技术的推出,无疑将极大地提升用户体验,并为未来的智能设备交互方式开辟新的可能性。

需要注意的是,文章内可能包含对外跳转链接(如超链接、二维码或口令等形式),旨在为读者提供更多参考信息。但这些仅供了解,最终结果需用户自行甄别。根据IT之家的规定,所有文章均包含此声明。

本文来源: IT之家【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...