每日AI快讯

OpenAI开发者大会揭晓四大革新:实时API与视觉微调引领未来,提示词缓存技术降低50%输入token成本

10月2日的消息显示,OpenAI于美东时间10月1日在年度开发者大会DevDay上发布了一系列创新工具。这些新工具包括实时API、视觉微调、提示词缓存及模型蒸馏四大亮点,旨在帮助开发者降低模型成本、提升视觉理解能力和语音AI功能,并改善小模型的性能。 实时API(Realtime API) 在OpenAI DevDay大会上推出的实时API正处于公开测试的beta阶段。这一API能够构建低延迟、多模式对话体验,支持文本和音频作为输入与输出,并具备函数调用功能。音频功能由GPT-4o模型“gpt-4o-realtime-preview”支持,允许开发人员将任何文本或音频输...

Liquid AI:采用自注意力机制与Transformer架构的LFM模型,展示出卓越的数据处理能力,性能超越Meta Llama及微软Phi

IT之家报道,近日,成立于去年的Liquid AI公司发布了一系列全新的基础模型——Liquid Foundation Models(LFM)。这批模型包括LFM-1.3B、LFM-3.1B和LFM-40.3B三个版本。这些模型采用了不同于传统Transformer架构的设计,宣称在多项基准测试中表现优异。 目前,Transformer架构在深度学习和自然语言处理领域占据主导地位。该架构通过自注意力机制捕捉序列中单词之间的关系,例如OpenAI的GPT、Meta的BART和谷歌的T5等模型都基于这一架构。然而,Liquid AI却选择了不同的路径,其基础模型重新设计了架构,受到交通信号处理系统和...

Cerebras Systems:AI芯片领域的独角兽凭借WSE-3技术申请IPO,挑战英伟达,尽管两年净亏21亿

AI芯片初创企业Cerebras Systems提交IPO申请 AI芯片初创企业Cerebras Systems近日正式提交了IPO申请,计划在纳斯达克上市,股票代码为“CBRS”。这家公司成立于2016年4月,总部位于美国加州,以其独特的晶圆级引擎(WSE)而著称。Cerebras Systems不仅专注于AI训练和推理芯片的设计,还在云端服务领域取得了显著进展。 WSE-3芯片与竞争对手的对比 Cerebras Systems的WSE-3芯片在性能上远超竞争对手。例如,与英伟达的H100 GPU相比,WSE-3的核心数量是H100的52倍,片上内存是H100的880倍,内存带宽更是H100的7000倍。此外,C...

提升工作效率与体验!深入探索Windows 11的24H2及LTSC版本发布:全新AI功能、优化文件资源管理器、支持Wi-Fi 7及增强节能模式带来的一系列实用改进!

微软正式发布 Windows 11 2024 更新(24H2) 据快科技报道,微软于10月2日正式推出了全新的 Windows 11 2024 更新 (版本号为26100.1742)。此次更新不仅带来了许多实用的新功能,还在开始菜单、文件资源管理器和设置等方面进行了改进。 24H2 版本引入了多项 AI 功能 新版本中加入了诸多人工智能功能,例如 实时字幕、画图应用中的 CoCreator 功能、 Windows Studio 特效、自动超分辨率处理以及图像生成与重塑等功能。这些功能主要针对 Copilot+ PC 用户。 其他重要更新 除了上述 AI 功能外,24H2 版本还增加了以下几项...

OpenAI为开发人员开启语音AI引擎时代:深入探讨ChatGPT与Twilio API的应用

近日,鞭牛士报道了OpenAI的一项重大举措。该公司宣布将向其他开发人员开放其语音AI引擎,这一引擎正是ChatGPT高级语音模式的核心技术。这意味着开发人员现在可以实时访问这项技术,使AI能够理解和处理语音命令,并在类似通话的场景中进行语音交流。 此前,实现这一功能需要经过三个步骤:首先将音频转换为文本,然后通过生成的文本模型得出答案,最后再使用独立的文本转语音模型。现在,OpenAI简化了这一过程,为开发对话式语音界面的人工智能应用提供了便利。这一新功能是在OpenAI于旧金山举办的DevDay活动中宣布的几项更...

AMD发布AMD-135M:开源小型语言模型通过推测解码实现性能提升3.88倍

AMD发布首款小型语言模型AMD-135M 10月1日,快科技报道,AMD正式发布了其首款小型语言模型(SLM),命名为“AMD-135M”。相较于当前日益庞大的大型语言模型(LLM),这款小型语言模型体积更小、灵活性更高,并且具有更强的专业性和隐私保护能力,非常适合企业内部部署。 AMD-135M的两个版本 AMD-135M属于Llama系列模型,共有两个版本:基础型“AMD-Llama-135M”和扩展型“AMD-Llama-135M-code”。基础型“AMD-Llama-135M”拥有6700亿个token,在八块Instinct MIM250 64GB加速器上进行了为期六天的训练。而扩展型“AMD-Llama-135M-c...

国防科大提出灵巧手抓取策略迁移新方案:智能图形学与Transformer助力泛化能力提升

本文介绍的是国防科技大学智能图形计算团队在智能图形学、具身智能、机器学习及三维视觉等方面的研究成果。该团队拥有众多国家级人才,长期致力于数据驱动三维感知、建模与交互的研究,并在国际上发表了大量高质量论文,荣获多个奖项。 在机器人操作领域,抓取任务一直是核心难题之一。该任务的目标是使机械手准确地移动到指定位置并成功抓取物体。近年来,基于学习的方法显著提升了对不同物体抓取的泛化能力,但在灵巧手(多指机械手)上的泛化研究相对较少。由于灵巧手在结构和几何上有很大差异,抓取策略难以在不同灵巧...

科大讯飞与字节跳动迎战GPT-4:端到端大模型引领语音AI技术革新与生死挑战

引言 最近,OpenAI 推出了 GPT-4 的高级语音功能,引发了新一轮的关注。这项功能不仅提升了语音交互的真实感,还加入了多种新特性,如自定义指令、记忆功能以及五种新声音。更重要的是,GPT-4 的语音交互变得更加自然,用户可以在任何时候打断对话,即便不说话时,系统也会保持安静。这一切都让 GPT-4 的交互体验更加贴近人类。 国内语音AI的发展现状 尽管 OpenAI 在语音AI领域取得了显著进展,国内的大厂也在努力追赶。科大讯飞和字节跳动等公司纷纷推出了各自的语音AI产品。科大讯飞通过在教育、医疗等垂直领域的深耕细...

钢铁侠

在美国,一场激烈的商业竞争正如火如荼地展开,这场对决比电影中的情节还要精彩。一方是OpenAI的CEO山姆·奥特曼,另一方则是特斯拉和SpaceX的创始人埃隆·马斯克。这场较量不仅仅是技术和创新的竞争,更是资金实力的比拼。 根据彭博社9月11日的消息,OpenAI正计划以1500亿美元的估值进行65亿美元的新一轮融资,并考虑通过循环贷款的方式向银行借款50亿美元。这一估值几乎是去年年底的两倍。与此同时,埃隆·马斯克的X AI虽然成立不到一年半,但已经成为OpenAI的主要竞争对手之一,目前估值达到了240亿美元,并且曾获得过60亿...

三星 Galaxy Z Fold6 在 Unpacked 活动中首发 Gemini AI 助手,带来强大分屏操作与浮动窗口体验

IT之家报道,科技记者 Mishaal Rahman 在 9 月 30 日发表了一篇博客文章,介绍了一项令人兴奋的新功能。根据他的报道,在三星 Galaxy Z Fold6 折叠屏手机上,用户可以通过更新 Gemini AI 助手应用来实现分屏或浮动窗口操作。 更新到新版 Gemini 应用后,用户会在浮动叠加层顶部看到一条白色条带,指示用户可以像常规 Android 应用一样使用 Gemini。这意味着 Gemini 不仅支持浮动窗口模式,还能进行上下和左右分屏操作。这项功能首次在三星最新的 Unpacked 活动中展示,目前仅适用于部分三星设备,已知支持的设备为三星 Gala...
13435363738199