标签:自然语言推理

苹果公司震撼发布300亿参数多模态AI大模型MM1.5:卓越的图像识别与自然语言推理能力引领科技新潮流

近日,苹果公司推出了一款名为MM1.5的多模态AI大模型,参数规模达到了惊人的300亿。这款模型基于前一代MM1的架构进行了全面升级,并且已经在Hugging Face平台上发布了相关文档。 MM1.5模型在数据驱动的原则下进行了训练,重点研究了在不同训练周期中混合多种数据对模型性能的影响。该模型提供了一系列不同的参数规模选项,从10亿到300亿不等,具备强大的图像识别和自然语言推理能力。 在MM1.5的新版本中,苹果的研发团队改进了数据混合策略,显著提升了模型在多文本图像理解、视觉引用与定位以及多图像推理等方面的表现。...