标签:AI模型

字节跳动AI技术新突破:7月19日揭晓文生图及长视频模型重大进展,豆包大模型引领语音识别创新

在即将到来的7月19日,字节跳动科技公司计划在其人工智能(AI)技术领域迈出重要一步。据钛媒体AGI报道,该公司将在本周五首次大规模展示其先进的AI模型技术,其中包括文生图和类Sora新视频技术。这些创新技术尤其在长视频和高动态图像处理方面展现出强大的潜力,有可能与Sora效果相媲美。内部消息透露,字节跳动已将AI大模型列为集团最高优先级P0项目。 不仅如此,抖音和剪映等多个内部团队也正致力于研发AI视频模型的应用,并有望在不久的将来对外公布。字节跳动将在新加坡主办一场名为“ByteDance AI Luminary Talks”的活...

AI模型遭遇常识挑战:数字比较出错,9.11与9.9大小分辨,tokenizer与角色扮演提示揭示问题所在

在人工智能的世界里,即使是最新最先进的模型也可能面临尴尬的挑战。近期,一些顶级大模型在面对“9.11 和 9.9 哪个大”的简单问题时,竟然给出了错误的答案。GPT-4o 和谷歌的 Gemini Advanced 付费版都认为 9.11 更大,而 Claude 3.5 Sonnet 提供了荒谬的计算方法。这个问题揭示了尽管AI在复杂数学问题上的能力日益增强,但在基本常识方面仍有不足。 一位名叫 Riley Goodside 的提示词工程师发现了这个问题,他在测试 GPT-4o 时发现模型错误地认为 9.11 更大。当他尝试改变提问方式或限定为实数比较时,结果并未改善。有趣的...

苏妈掷48亿现金吞下AI模型公司,英伟达有的AMD也要有

AMD近期宣布以48亿人民币的全现金交易收购AI模型公司Silo AI,旨在强化自身在AI领域的实力。Silo AI是欧洲最大的私营AI实验室,由多名业界知名人士共同创立,拥有300名AI专家。此次收购将加速AMD在AI解决方案的采用,扩展其开源AI软件能力。Silo AI专注于定制化AI模型和端到端解决方案,服务包括安联、飞利浦等知名企业。AMD的这一举措表明其正积极扩大AI生态系统,与英伟达展开竞争。AMD高级副总裁Boppana表示,尽管交易不会立即影响财务,但有可能释放未来商业潜力。 Silo AI的CEO Peter Sarlin将继续领导团队,成为AMD A...

Meta的LLM Compiler:AI模型驱动的代码优化利器,提升编译效率与生成质量

在近日,Meta 推出了一项创新技术——LLM Compiler,这是一款基于Code Llama构建的新型代码优化工具。这款模型已经在Hugging Face平台上发布,提供了70亿和130亿参数两种版本,供学术界和商业领域免费使用。欲了解更多详情,敬请访问该项目的官方链接(点此进入)。 Meta指出,虽然当前的多种语言模型在处理编程任务时表现出色,但在代码优化方面仍有提升空间。LLM Compiler应运而生,它是一个专门针对代码优化任务设计的预训练模型,能效仿编译器对代码进行智能优化,甚至可以将优化过的代码还原为原始语言形式。 为了实现...

高通骁龙X Elite平台赋能:AI模型开放,神经处理单元驱动开发者创新中心

在科技日新月异的今天,高通公司近期在Computex大会上推出的骁龙 X Elite平台备受关注。尽管在发布会上,高通主要突显了该平台的AI能力,但要充分利用其Hexagon神经处理单元(NPU)的45 TOPS强大性能,离不开配套的AI软件。现在,高通已经为开发者准备了针对Hexagon NPU的定制化、优化和验证过的AI模型,这些资源可在高通的AI Hub获取,助力快速创建AI应用程序。 高通AI Hub不仅提供多样化的边缘设备优化AI模型,覆盖图像识别、物体检测、语义分割及创新AI等多个领域,还配备工具和文档,使开发者能轻松将AI模型应用于视觉...

AI功能仅两款iPhone能用!苹果被存储卡了脖子

近期,苹果新推出的Apple Intelligence特性引发关注,但由于存储空间的局限,该功能无法在所有设备上运行,揭示了苹果在端侧人工智能(AI)发展的存储困境。据业内专家郭明錤分析,只有iPhone 15系列中的高端型号15 Pro和Pro Max才能享受到Apple Intelligence的支持,关键因素可能是这些型号搭载的DRAM内存大小。 虽然A16芯片的AI处理能力强大,可达到17TOPS,但其6GB的DRAM容量相对较小,相比之下,M1芯片设备的8GB内存可以支持Apple Intelligence运行。Apple Intelligence需要大约0.7-1.5GB的DRAM空间,如果苹果计划采用...

为什么斯坦福大学生要抄袭中国大模型?

斯坦福大学AI团队涉嫌抄袭中国面壁智能公司开源成果的事件引发了广泛关注。该团队发布的大模型Llama3V被指与面壁智能的MiniCPM-Llama3-V2.5高度相似,后者在5月中旬发布。尽管模型开源允许二次开发,但未标明基于面壁智能成果的行为被批评为不诚实。面壁智能团队证实,他们的模型曾用于识别战国古文字,而斯坦福团队的模型不仅识别出了同样的文字,连错误也一致,坐实了抄袭嫌疑。事件特别之处在于涉及的两方——斯坦福大学和清华大学,都在全球AI领域具有重要地位。斯坦福团队成员已道歉,指出是由于团队内一人为了快速成名而...

【解读】费电但极具潜力的“大脑”:如何理解AI耗能问题?

1. Meta推出了新AI模型Llama3,其训练使用了比前代模型Llama2多8倍的H100 GPU,加剧了AI训练对电力的依赖。 2. AI发展的电力需求引发关注,OpenAI CEO、马斯克和黄仁勋等业界领袖警告,电力短缺可能成为AI发展的瓶颈,而AI的能耗远超预期。 3. AI的能耗分为软件和硬件两部分,硬件中的芯片制造尤其耗水,如台积电每年耗水约8000万吨。软件和硬件的能耗对比,AI尚未在能耗和成本上优于人脑。 4. AI的能耗产出比需综合考虑,其在各行业的应用潜力巨大,能提高生产力。专家探讨了AI能耗的计算方法和降低能耗的途径,包括改进硬...

全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用

在AI领域,一项重大突破引发热议,被誉为“真·Open AI”的LLM项目推出了首个开源GPT-4级模型——Llama3。这款模型迅速登上Hugging Face排行榜首,Meta公司共开源了Llama3的8B和70B两个版本,预训练和指令微调双版本。Llama3在定制集群上使用15万亿个token训练而成,即使是最小的8B版本,其性能也超越了Llama2的某些大版本。未来,Llama3还将推出更多版本。Llama3400B作为性能野兽,预训练版本在ARC-Challenge上得分高达96,指令微调版在多任务语言理解等方面表现出色。与GPT-4和其他模型对比,Llama3400B在多语言推理和代码生成...

AI日报:天工SkyMusic开启公测;UP主用AI技术“复活”巨人族;通义千问开源代码模型CodeQwen1.5;免费AI音乐生成工具Sonauto

昆仑万维推出两款创新AI模型——「天工3.0」和「天工SkyMusic」,公测开启,展现公司在AI领域的技术领先地位。其中,「天工3.0」作为全球最大开源MoE模型,拥有超过4000亿参数,提供多轮搜索和图表绘制等功能;而「天工SkyMusic」是中国首个音乐SOTA模型,支持多种方言,能进行端到端音乐生成。此外,CodeQwen1.5是基于Qwen1.5的代码模型,具备7B参数和92种编程语言支持,显著提升开发者效率。Spline发布的3D生成工具AI3D Generation,提供了直观界面和AI辅助设计,推动3D设计进步。CTRL-F-VIDEO项目则实现了视频内搜索,通过O...
123