标签：多模态语言模型

三星Gauss2多模态语言模型亮相，助力资源受限设备与Galaxy智能生态，开启生成式AI新篇章

11月21日，据IT之家报道，三星公司在韩国举办的开发者大会上正式发布了第二代生成式AI模型——Samsung Gauss2。这款多模态语言模型具备处理文本、代码和图像等多种数据类型的能力，性能和效率得到了显著提升。为了适应不同的计算环境和应用场景，Gauss2提供了“精简版”、“均衡版”和“至尊版”三种不同规格的模型。具体来说，“精简版”适用于资源受限的设备，能够在低功耗环境下高效运行；“均衡版”在性能、速度和效率之间取得了良好的平衡，适合大多数应用场景；“至尊版”则采用了“专家混合”技术，不仅保证了高性能，还大幅降低了...

来源：

IT之家【阅读原文】
Tags：三星 Gauss2 代码辅助服务多模态语言模型生成式AI 资源受限设备

4个月前

微软 Phi-3-vision 基准测试：和 Claude 3-haiku、Gemini 1.0 Pro 相当

在2024年的微软Build大会上，一项名为Phi-3-vision的新技术引起了关注。这款创新的多模态小型语言模型（SLM）主打视觉理解和图文解析能力，并且能在移动设备上实现高效运行。Phi-3-vision拥有42亿参数和128k token的上下文长度，专为本地AI场景设计，能有效支持各种视觉推理任务。微软通过发表的论文展示了Phi-3-vision与Claude 3-haiku和Gemini 1.0 Pro等其他模型的竞争力，尽管其参数量不大，但在ScienceQA、MathVista和ChartQA等测试中的性能表现出色。此前，微软还对比了Phi-3-vision与其他知名模型，如字节跳动的Llam...

来源：

IT之家【阅读原文】
Tags：Phi-3-vision 多模态语言模型微软移动平台视觉推理

10个月前

看懂网飞版「三体」！Reka Core登场：挑战GPT-4、Claude 3

AI初创公司Reka近期推出了创新的多模态语言模型Reka Core，该模型展现出理解图像、音频和视频等多元数据的卓越能力，成为继谷歌Gemini Ultra之后的又一瞩目之作。Reka Core在性能上与GPT-4相当，证明了其研发团队的努力成果。这款模型是通过数千台H100设备训练得出，支持32种语言和大量词汇上下文，尤其擅长处理长篇文档。Reka Core不仅在视频感知测试中超越Gemini Ultra，在图像任务的MMMU基准测试中也有出色表现，与行业领先模型相媲美。尽管训练时间较短，但其性能已超越许多顶级AI模型。值得注意的是，Reka Core具备强大...

来源：

新智元公众号【阅读原文】
Tags：AI初创公司 GPT-4 Reka Core 图像理解多模态语言模型

12个月前