标签:Qwen2.5-Max

阿里除夕新春发布Qwen2.5-Max,通义千问AI模型全面升级,轻松超越DeepSeek V3,助力开发者快速打造创意小游戏

阿里发布Qwen2.5-Max,性能超越DeepSeek V3及多个大模型 农历除夕夜,阿里云旗下的通义千问(Qwen)团队发布了最新的Qwen2.5-Max模型,为新春佳节献上了一份特别的礼物。这款新模型在多个基准测试中表现优异,超越了当红炸子鸡DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o和Claude-3.5-Sonnet。 多个基准测试中的卓越表现 Qwen2.5-Max在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等多个基准测试中均表现出色,尤其在MMLU-Pro等针对模型知识理解和推理能力的基准测试中,其表现尤为突出。该模型经过超过20万...