标签:开源

自动驾駛与智能体新篇章!联汇科技OmAgent框架开源发布,引领行业应用爆发式增长

在科技创新的前沿,自动驾驶和大模型的发展轨迹相互映照。Google不仅是自动驾驶的先驱,其Transformer模型也引领了大模型的革新。如今,自动驾驶技术已从概念变为现实,彻底改变了传统驾驶方式,而大模型行业正在经历相似的快速发展阶段,各大顶尖团队竞相角逐,推动技术边界不断扩展。 联汇科技,作为大模型赛道的领先者,始终走在行业的最前沿。早在行业关注大模型初期,他们便聚焦多模态大模型,并荣获了工信部的首个大模型检测证书。去年,他们发布了OmModel V3,并推出国内首批发起的大模型驱动的自主智能体应用。今年...

Open-Sora开源视频生成:一键创造720p高清16秒创意内容,效果优化再升级

潞晨 Open-Sora 团队在视频生成领域取得了重大突破,他们成功地开发出了一种能够生成高清720p短片的模型,且风格多样,包括海浪、森林、赛博朋克等。令人兴奋的是,该团队决定将整个项目开源,分享给全球的开发者和创作者。在GitHub(https://github.com/hpcaitech/Open-Sora)上,用户可以获取模型权重和训练代码,自由创建各种视觉效果,如动画镜头和电影级镜头,提供高度逼真的体验。潞晨团队通过创新的视频压缩网络(VAE)和 Stable Diffusion 3 模型,实现了质量和成本之间的平衡,同时提升了生成速度和图像质量。此外...

为什么斯坦福大学生要抄袭中国大模型?

斯坦福大学AI团队涉嫌抄袭中国面壁智能公司开源成果的事件引发了广泛关注。该团队发布的大模型Llama3V被指与面壁智能的MiniCPM-Llama3-V2.5高度相似,后者在5月中旬发布。尽管模型开源允许二次开发,但未标明基于面壁智能成果的行为被批评为不诚实。面壁智能团队证实,他们的模型曾用于识别战国古文字,而斯坦福团队的模型不仅识别出了同样的文字,连错误也一致,坐实了抄袭嫌疑。事件特别之处在于涉及的两方——斯坦福大学和清华大学,都在全球AI领域具有重要地位。斯坦福团队成员已道歉,指出是由于团队内一人为了快速成名而...

首个智慧城市大模型UrbanGPT,全面开源开放|港大&百度

港大与百度携手开发的UrbanGPT是首个智慧城市大模型,该模型全面开源开放。UrbanGPT针对时空预测技术的挑战,如数据稀缺、高昂的训练成本和泛化能力不足,提出了一种新型时空大型语言模型。该模型通过时空依赖编码器和指令微调方法,强化了对时间和空间复杂关系的理解,即使在数据有限的情况下也能提供精确预测。实验表明,UrbanGPT在零样本学习和多种城市任务上表现出卓越性能,尤其在跨区域和跨城市预测中,展示了强大的泛化能力和对时空模式的精确理解。

最难方言温州话被攻克!中国电信语音大模型支持30种方言,这题GPT-4o可不会做啊

中国电信推出创新语音大模型,星辰语音,能识别和理解30多种包括温州话在内的方言,打破了以往单一模型仅支持特定方言的局限。该模型在多项国际比赛中表现出色,如INTERSPEECH2024和NIST低资源粤语识别任务,并已在智能客服等领域应用。中国电信是首个完成大语言模型研发并开源的央企,其语音大模型以超大规模语音预训练和多方言联合建模为核心技术,有效降低了新方言的数据需求。此外,中国电信还构建了丰富的方言数据库,并拥有强大的算力资源。他们选择方言作为重点,旨在保护和传承语言文化,提高沟通效率,特别是帮助老...

微软发布Phi-3 Mini:3.8B参数小到能塞进手机,性能媲美GPT-3.5

微软近日在其官网上开源了名为 Phi-3-mini 的小型语言模型,这是 Phi-3 系列的第一个模型,拥有38亿参数和丰富的训练数据。Phi-3-mini 在多项语言、推理、编码和数学基准测试中表现出色,超越了许多百亿参数规模的模型。该模型有两种上下文长度变体,经过预训练和指令调整,能更好地理解和执行各种指令。与大型语言模型相比,Phi-3-mini 更易于操作,适合在端侧部署和运行。微软表示,该模型的成本远低于类似功能的模型,例如可能是GPT-3.5成本的十分之一。Phi-3-mini 的出色性能得益于合成数据集的训练,该数据集由过滤的网...

大模型开源还是闭源好,周鸿祎与李彦宏针尖对麦芒

在大模型的开源与闭源之争中,360创始人周鸿祎与百度创始人李彦宏发表了不同的看法。李彦宏认为闭源大模型在能力和商业模式上优于开源,而开源可能无法聚集足够的资源。在百度AI开发者大会上,他进一步指出开源模型可能会落后。周鸿祎则坚信开源的力量,认为开源模型能推动技术进步,且发展迅速。然而,尽管开源模型在某些方面取得进步,如Llama3,但目前它们在技术和应用上仍落后于闭源模型,如GPT-4、Claude-3和Gemini Ultra。 周鸿祎支持开源可能是为了360智脑在市场竞争中的位置,鼓励创业者使用开源模型,避免重复研发...

最强开源大模型Llama 3来了!4000亿参数模型狙击GPT-4,训练数据量达Llama 2七倍

Meta公司最近发布了其最先进的开源大模型——Llama 3系列,包括8B和70B两个版本,这些模型在多项基准测试中超越了其他开源和闭源模型。Llama 3 8B在MMLU、GPQA等任务上优于谷歌的Gemma 7B和Mistral 7B Instruct,而70B版本则在相同基准上超过了闭源的谷歌Gemini Pro 1.5和Claude 3 Sonnet。Llama 3系列的最大模型规模预计将超过4000亿参数,标志着开源模型的一个重要里程碑。 Llama 3基于超过15T的公开数据进行预训练,数据量是前一代Llama 2的七倍,代码量也增加了四倍。训练效率相较于Llama 2提高了三倍。Meta的AI助手已经...

剑指Sora!120秒超长AI视频模型免费开玩

近年来,Picsart AI Research等团队合作推出了创新工具StreamingT2V,该工具能够生成长达1200帧、持续2分钟的高质量视频,超越了之前的Sora模型。这款开源软件无缝对接SVD和animatediff等模型,推动了AI视频生成技术的进步。尽管目前的演示效果可能较为抽象,但随着技术的不断发展,未来有望实现更长时长的AI视频生成。StreamingT2V采用了先进的自回归技术,保证视频时间一致性、文本对齐以及高图像质量。此外,它通过条件注意力模块和外观保留模块解决了视频生成中的长期记忆问题,以实现平滑过渡和对象特征保持。用户可以...

360 智脑 7B 参数大模型开源,支持 50 万字长文本输入

360公司最近在GitHub上公开了其创新项目——360智脑7B,这是一个具有70亿参数的大型模型,旨在推动人工智能技术的发展。该模型基于3.4万亿的Tokens语料库进行训练,涵盖了中文、英文和代码等多种语言类型。360公司强调,360K版本(约50万字)是目前中国国产开源模型中最长的文本长度。 在OpenCompass的一系列主流评估数据集中,360智脑7B表现出色,参与了C-Eval、AGIEval、MMLU、CMMLU、HellaSwag、MATH、GSM8K、HumanEval、MBPP、BBH、LAMBADA等任务,展示了其在自然语言理解、知识、数学计算推理、代码生成和逻辑推理等多个...
123