阿里除夕新春发布Qwen2.5-Max，通义千问AI模型全面升级，轻松超越DeepSeek V3，助力开发者快速打造创意小游戏

阿里发布Qwen2.5-Max，性能超越DeepSeek V3及多个大模型

农历除夕夜，阿里云旗下的通义千问（Qwen）团队发布了最新的Qwen2.5-Max模型，为新春佳节献上了一份特别的礼物。这款新模型在多个基准测试中表现优异，超越了当红炸子鸡DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o和Claude-3.5-Sonnet。

多个基准测试中的卓越表现

Qwen2.5-Max在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等多个基准测试中均表现出色，尤其在MMLU-Pro等针对模型知识理解和推理能力的基准测试中，其表现尤为突出。该模型经过超过20万亿token的预训练数据和精心设计的SFT+RLHF后训练方案训练而成，确保了其强大的多模态处理能力。

网友热烈反响与开发者的积极推广

Qwen2.5-Max一经发布便受到了AI社区的广泛关注，网友们纷纷点赞并收入囊中。阿里研究员们也在第一时间分享了这一成果，高级算法专家林俊旸表示：“Qwen2.5-Max在基准测试中表现出色，欢迎大家试用，祝大家新年快乐！”

实际应用场景展示

Qwen2.5-Max展示了其在多个实际应用场景中的强大能力。首先是在联网搜索功能方面，每句话的来源出处都有详细标注，整体运行流畅。其次，在代码生成方面，Qwen2.5-Max能够帮助用户快速完成各种可视化创作，例如仅用一句话就能创建一个旋转的球体，并且网友改造后还能让球体内有三个弹跳的小球。

此外，Qwen2.5-Max还具备Artifacts功能，能够通过一句话开发各种小应用和小游戏。例如，制作一个扫雷小游戏，只需几秒钟即可完成并直接开始游戏。同时，它还能轻松处理复杂的任务，如数单词中的特定字母数量。

上线平台与体验方式

目前，Qwen2.5-Max已在Qwen Chat中上线，用户可以通过Hugging Face的Demo进行体验，还可以通过Any Chat和阿里云服务使用API。感兴趣的朋友们可以立即尝试，感受这款强大模型的魅力。

本文来源：

量子位【阅读原文】

# 每日AI快讯 # AI模型 # Deepseek-v3 # Qwen2.5-Max # 新春发布 # 通义千问

文章版权归作者所有，未经允许请勿转载。

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

阿里除夕新春发布Qwen2.5-Max，通义千问AI模型全面升级，轻松超越DeepSeek V3，助力开发者快速打造创意小游戏

利用DeepSeek技术，AI拜年更添春节喜庆：AI表情包、AI视频与春节红包封面创意大集合

软银重金加码人工智能领域，据悉将向机器人初创公司Skild AI投资5亿美元，助力AI技术创新与发展

相关文章

暂无评论

AI最新资讯