颜水成与袁粒提出新一代MoE++架构:零计算量专家助力大型语言模型,专家吞吐速度最高提升2.1倍,优化路由分数残差!

新一代MoE架构:专家吞吐速度最高提升2.1倍! 2024年10月21日,来源:量子位 近日,由北京大学和昆仑万维2050研究院联合提出的新型混合专家(MoE)架构——MoE++,在性能和效率方面取得了显著突破。这一架构通过引入“零计算量专家”设计,大幅提升了模型的计算效率和性能表现。 ...

10秒钟复刻AI付航脱口秀吐槽,F5-TTS打造LPL最佳TTS声音克隆体验

上周末,我追了两个月的脱口秀,终于迎来了总决赛。周六晚上,我一边观看《英雄联盟》S14总决赛,一边关注《喜剧之王单口季》,真是体验了一把心情的过山车。一边是拉胯的表现,另一边则是稳如泰山。好在脱口秀方面,我一直喜欢的演员付航不负众望,夺得了总冠军。他在决赛中的...

苹果AI技术落后内部员工透露:ChatGPT准确率比Siri高出约25%,苹果智能面临挑战

苹果公司在AI领域的进展及未来规划 据站长之家(ChinaZ.com)报道,苹果公司内部员工普遍认为,公司在人工智能领域的发展比行业领先者落后约两年时间。这一观点来自最新一期的Power On节目,主持人Mark Gurman透露了这一消息。苹果的内部研究表明,与苹果的Siri相比,ChatGPT...

利用Kimi和GPT-4o的语音通话功能,AI聊天实时对话差点促成一段佳缘

昨天,Kimi突然给我打了个电话,我才意识到自己被“灰度”了。这次灰度测试的是Kimi的语音通话功能。现在打开Kimi App,你会发现底部问答框旁边多了一个电话图标,点击即可发起语音通话。虽然实时语音通话已经不是什么新鲜事物,但各大平台如ChatGPT、智谱清言、字节豆包、百度文小言、讯飞星火等纷纷推出类似功能,效果各不相同。 作为后来者,Kimi的表现如何呢?我们亲身体验了一番,并将其与最近推出的GPT-4o高级语音模式进行了对比。实测发现,Kimi的语音通话功能相当健谈,甚至有些话唠。在与Kimi通话时,一个很好的设计...

杰夫·贝索斯支持的Perplexity AI寻求新一轮融资,目标估值突破80亿美元人工智能里程碑

10月20日,据知情人士透露,由杰夫·贝索斯支持的人工智能初创企业Perplexity AI正在与投资者进行谈判,计划筹集接近5亿美元的资金。 此次融资的目标是将公司的估值提升至至少80亿美元,较目前估值翻一番以上。这一消息引发了业界的广泛关注,显示出投资者对人工智能领域的持续...

苹果内部员工透露:AI技术包括Siri与ChatGPT相比至少落后两年,亟需加强Apple Intelligence以迎头赶上

苹果在AI领域落后竞争对手两年,但有望迎头赶上 据快科技10月21日报道,知名分析师Mark Gurman在其最新的《Power On》栏目中指出,苹果公司内部员工普遍认为,公司在人工智能(AI)开发方面落后于竞争对手大约两年时间。根据Gurman的说法,苹果内部研究显示,与Siri相比,Chat...

英伟达押注的AI搜索独角兽Perplexity AI寻求新融资,目标估值640亿,探索广告模式与收入共享策略

Perplexity AI 再度开启融资谈判,估值或超80亿美元 据《华尔街日报》报道,美国AI搜索独角兽Perplexity AI近日再次启动融资谈判,估值预计将达到80亿美元(约合人民币568亿元),较今年4月的估值翻了一番,更是今年1月估值的近16倍。知情人士透露,Perplexity AI正计划在新一...

海信星海大模型与铁路大模型助力智能运维及人工智能应用,加速企业数字化转型进程

10月18日,在青岛国际人工智能创新应用博览会上,海信隆重推出了星海·行业基座大模型。这一大模型旨在为各行各业的大模型构建提供通用能力,加速其应用落地,从而为新型工业化和新质生产力的发展注入强劲动力。 随着人工智能技术的迅猛发展,特别是大模型的兴起,人们的生活方...

132年未解之谜:李雅普诺夫函数难题终被AI数学利器Symbolic Transformer破解,引领NeurIPS 2024新风向

AI破解百年数学难题:李雅普诺夫函数的突破 人工智能(AI)在数学领域的应用越来越广泛,尤其是在解决复杂的数学问题方面。作为衡量语言模型推理水平的重要标准之一,解决高级数学问题的能力一直是研究的热点。尽管谷歌DeepMind的AI曾在国际数学奥林匹克竞赛(IMO)中以一分之...

NVIDIA全新nGPT助力大型语言模型训练速度大幅提升,归一化Transformer技术引领AI未来潮流,模型精度再创新高

快科技10月20日报道,NVIDIA的研究团队近期发布了一项可能彻底改变人工智能未来的创新成果——归一化Transformer(nGPT)。这一新型神经网络架构在超球面上进行表示学习,显著提升了大型语言模型(LLM)的训练速度,最高可达到20倍,同时保持了模型的精度。 nGPT的核心技术在于...
1234178