标签:开源模型

最强开源模型Qwen2.5-Coder深夜发布!320亿参数,代码生成与修复能力超越GPT-4,成为编程助手的不二选择

一夜之间,AI编程模型的开源领域迎来了一位新的霸主!Qwen2.5-Coder-32B正式发布,不仅在多个主流基准测试中取得最佳成绩,更是彻底打破了闭源模型的垄断地位。这款强大的模型拥有320亿参数,凭借其卓越的代码生成、修复和推理能力,成功超越了GPT-4o等知名闭源模型。 强大的代码生成能力 Qwen2.5-Coder-32B在代码生成方面表现出色,能够在多个流行的基准测试中取得开源领域的最佳成绩。无论是简单的计算器还是复杂的音乐播放器,只需输入自然语言指令,Qwen2.5-Coder-32B就能迅速生成完整的代码。这对于编程新手来说,无...

创造历史:阿里通义开源模型Qwen2.5在Chatbot Arena上超越Llama,引领大语言模型潮流

近日,基准测试平台Chatbot Arena公布了最新的大模型盲测排行榜,阿里巴巴的通义千问开源模型Qwen2.5再次成功跻身全球前十。具体而言,Qwen2.5-72B-Instruct在大语言模型(LLM)榜单中排名第10,成为唯一进入前十名的中国大模型。此外,Qwen系列中的视觉语言模型Qwen2-VL-72B-Instruct也在Vision榜单中排名第九,是当前得分最高的开源大模型。 与此同时,Qwen系列在全球开源社区中的影响力显著提升,基于Qwen系列的衍生模型数量已突破7.43万个,超过了Llama系列的7.28万个。这标志着通义千问Qwen已经成为世界上最大的生成式...

对话阿里云CTO周靖人:AI算力时代,通义千问引领大模型降价风潮,探索开源模型新未来

一、技术优化助力全线降价,企业级用户与开发者共享红利 在2024云栖大会的主论坛上,阿里云智能集团CTO周靖人宣布了通义大模型的一系列重大更新。其中,通义千问的三款主力模型再次大幅降价,最高降幅达到了85%,百万tokens的价格低至0.3元。周靖人表示,这次降价主要得益于规模效应和技术优化,使得模型推理成本显著降低。阿里云希望通过这种方式将技术红利带给企业级用户和开发者,推动整个产业的发展。 周靖人还提到,目前模型的应用仍处于早期阶段,很多新的模型迭代和Agent的使用都需要大量的并发调用。如果模型推理...

探索OLMoE:首个100%开源的混合专家模型,拥有7B参数与1B稀疏激活的高效推理成本

训练代码、中间checkpoint、训练日志和训练数据都已经开源。尽管大语言模型(LM)在各类任务中取得了显著进展,但在训练和推理方面,性能与成本之间的权衡仍然是一个问题。对于很多学者和开发者而言,高性能的语言模型由于高昂的成本而难以触及。一种改善成本-性能的方法是采用稀疏激活混合专家(MoE)。MoE在每一层都有多个专家,每次只激活其中的一部分,从而使得MoE模型比密集模型更高效。因此,许多前沿模型如Gemini-1.5和GPT-4等都采用了MoE。 然而,大多数MoE模型都是闭源的,即便有些模型公开了权重,但对于训练数据...

中国在生成式AI领域领跑:开源模型、论文及专利数量超越美国之人工智能竞争 —— ITIF研究报告

8月26日,美国著名的非营利科技智库ITIF在其官网上发布了一份题为《中国在AI领域的创新程度如何?》的深度调查报告。该报告旨在评估中国在人工智能(AI)领域的发展状况,特别是大模型和生成式AI方面的进展,并将其与美国进行比较。 报告指出,中国已经成为全球AI研究出版物的领头羊,在生成式AI领域与美国不相上下。北京的清华大学被赞誉为中国AI初创企业的摇篮,孕育出了一批引领生成式AI领域的佼佼者,如智谱AI、百川AI、月之暗面以及MiniMax。中国的大型模型正在迅速缩小与美国之间的性能差距;在中英文双语基准测试中...

OpenAI 对抗美国 SB1047 法案:保护开源人工智能大模型免受监管政策威胁

近期,OpenAI致函美国加州参议员Scott Wiener,表达了对SB1047法案的反对立场。这项于今年2月7日提出的法案旨在加强对开源大型模型的监管,却因其一系列不合理的规定而引发争议。例如,法案规定若第三方调整如Meta最新发布的Llama-3.1模型用于非法目的,Meta将面临严惩,并需定期上报用户信息。此举无疑加大了科技巨头们的负担,可能导致大型模型开源活动锐减,进而抑制人工智能领域的创新活力。 OpenAI认为,尽管适度监管对于保障用户安全至关重要,但SB1047法案采取的“一刀切”方式过于激进,容易引起业界恐慌。此外,美国...

FLUX.1与Auraflow引领风潮:当Stable Diffusion开源模型推动AI图像生成技术的爆发

自从黑森林实验室推出了FLUX.1,这款被视为Stable Diffusion精神续作的模型,引起了业界的广泛关注。FLUX.1不仅在技术上进行了改进,还包含了三个变种模型,并且其中一个版本FLUX.1[schnell]实现了完全开源,体现了团队的开源精神。与此同时,美国初创公司Fal.ai也发布了开源模型Auraflow,旨在延续开源社区的传统。这两款新模型的出现,为AI图像生成领域带来了新的活力。 SD3面前,连Auraflow都“很能打”? 为了评估这些新模型的实际表现,我们选取了几种不同的风格进行测试,包括动漫风、奇幻风、印象派艺术风、写实场景...

Nemotron-4 340B对决英伟达:开源模型新秀,LLM训练与合成数据的胜利

英伟达近日开源了Nemotron-4 340B,一个3400亿参数的大型AI模型,该模型在Hugging Face RewardBench排行榜上取得佳绩,尤其是在处理复杂任务和长文本查询时表现出色。Nemotron-4 340B超越了多个知名开源模型,如Llama-3-70B,尽管在某些对决中仅以微弱优势获胜。模型的亮点在于其对合成数据的利用,这可能革新LLM的训练方式。合成数据的生成使得AI行业不再过度依赖昂贵的真实世界数据集,Nemotron-4 340B支持生成各种语言和编程语言的数据,并且允许免费使用。通过奖励模型和指令模型,Nemotron-4 340B能够生成高质量数据并...

一上线就爆火出圈!中文语音AI天花板ChatTTS官网上线

ChatTTS,中文语音AI的杰出代表,近日推出官方网站,让用户可以直接在线体验其文本转语音的强大功能。这款备受瞩目的项目自上线以来,在GitHub上迅速积累了超过16.9K的Star,成为了替代GPT-4o的热门选择。ChatTTS不仅提供基础的文字转语音服务,还能实现实时语音对话,用户可以通过调整“Audio Seed”来定制音色,甚至通过特殊标记控制笑声和停顿。此外,它支持多种语言,包括流利的英文,并能出色地处理中英文混合语音。 ChatTTS的一大亮点是它的细粒度控制功能,允许用户精准调控语音中的细节,如笑声、停顿和语气,使得生...

AI的未来是一个巨大的模型,还是多个specialized小模型

Octopus v4模型是一种创新的开源语言模型,它通过整合多个针对特定任务优化的开源模型,使用functional token引导用户查询到最合适的垂直模型。相较于昂贵且能源消耗大的专有模型,如GPT-4和Anothropic,Octopus v4在性能上展现出竞争力。模型利用图数据结构协调多个开源模型,提高效率和准确性。Octopus v4-3B是Nexa AI推出的30亿参数模型,擅长将查询转换为专业格式,适用于MMLU任务。此外,Octopus模型在设备上运行,保证数据隐私和低延迟。通过“云-在设备上”协作,AI系统结合在设备和基于云的模型,实现高性能和灵活性。...
12