标签:Imagen 2

谷歌推出 Gemini 1.5 Pro 公共预览版,现已支持处理音频

谷歌近期在其AI应用平台Vertex AI上推出了Gemini 1.5 Pro的公共预览版,这是一个具备音频处理能力的中量级模型,能分析音频文件并进行内容总结。据称,Gemini 1.5 Pro在性能上已超过大型模型Gemini Ultra,且能理解复杂指令,无需额外微调。虽然Gemini Ultra提供更丰富功能,但处理速度不及Gemini 1.5 Pro。同时,谷歌的文生图模型Imagen 2也升级了,新增图片修复和扩充功能,并引入了数字水印“SynthID”以确保图像来源可追溯。值得注意的是,这些功能在其他文生图模型和一些先进设备中已有应用。谷歌还计划在公开预览阶段探...