标签:大型语言模型
利用开源框架BioChatter和大型语言模型,无缝集成知识图谱降低生物医学研究中的LLM使用门槛
大型语言模型在生物医学研究中的新突破:BioChatter开源框架 大型语言模型(LLMs)已经显著改变了人们的工作方式,从创作、编程到改进搜索引擎等。然而,LLMs 在透明度、可重复性和定制化方面的不足仍然限制了其在生物医学研究中的广泛应用。对生物医学研究人员来说,针对特定研究问题优化 LLMs 是一项艰巨的任务,因为这需要编程技能和机器学习专业知识。这些障碍减少了 LLMs 在许多研究任务中的应用。 为了克服这些限制,海德堡大学和欧洲生物信息研究所(EMBL-EBI)等机构的研究人员在《Nature Biotechnology》杂志上发...
Mistral Small 3与Tülu 3 405B:探索更小、更便宜的大型语言模型及量化技术在后训练方法中的应用进展
Mistral AI 和 Allen 人工智能研究所发布最新大型语言模型 1月31日,站长之家(ChinaZ.com)报道,Mistral AI 和 Allen 人工智能研究所(简称 Ai2)分别发布了最新的大型语言模型(LLM)。Mistral 推出的 Mistral Small 3 模型参数量为240亿,远少于市场上的其他先进 LLM。这使得它在启用量化后可以在某些 MacBook 上运行。量化技术旨在降低硬件资源需求的同时,减少输出质量的损失。 Mistral 在内部评估中将 Mistral Small 3 与 Meta Platforms Inc. 的开源 LLM Llama 3.3 70B Instruct 进行了对比。尽管 Mistral Small 3...
深入解析大型语言模型扩展范式:思维链作者Jason Wei详述下一词预测与强化学习在LLM中的应用
一、Jason Wei 的背景与贡献 关注 AI 领域的人对 Jason Wei 这个名字一定不陌生。他是 OpenAI 的一位资深研究科学家,经常在 OpenAI 的发布活动中露面。作为思维链概念开山之作《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》的第一作者,他的工作使这一技术广为人知。Jason Wei 在谷歌期间推广了思维链提示概念,并共同领导了指令微调的早期工作。2023 年初,他加入了 OpenAI,参与了 ChatGPT 和其他重大项目。 二、演讲概要 去年 11 月 20 日,Jason Wei 在宾夕法尼亚大学计算机与信息科学...
谷歌人工智能研究科学家菲利克斯·希尔离世,生前两月曾透露大型语言模型研究使其深受社交焦虑和心理健康问题困扰
告别菲利克斯・希尔:人工智能社区的共同哀思 本周四,人工智能社区以各自的方式向一位杰出的科学家告别——菲利克斯・希尔(Felix Hill),他是 Google DeepMind 的研究科学家,于 2024 年 12 月 5 日去世。自 2023 年初以来,他一直在与严重的精神疾病作斗争。在离世之前,菲利克斯已在 Google DeepMind 工作了近 9 年。 纽约大学计算机科学和数据科学教授、生物技术公司 Prescient Design 联合创始人 Kyunghyun Cho 表示,他至今仍心痛不已。Kyunghyun Cho 回忆起 2014 年在蒙特利尔做博士后时,指导老师是 Yoshua Bengio...
人工智能与意图经济:剑桥大学研究揭示新趋势
根据剑桥大学研究人员的最新发现,人工智能(AI)工具正逐渐被用于操纵在线用户的决策,影响范围涵盖购物选择、投票对象等多个方面。这种操纵基于新兴的“意图经济”,AI 助手在其中不仅理解、预测人类意图,甚至能够操纵这些意图,并将相关信息出售给相关企业以牟利。 意图经济取代注意力经济 剑桥莱弗休姆智能未来中心(LCFI)的研究人员认为,“意图经济”将取代传统的“注意力经济”。在信息爆炸的时代,注意力经济是指通过争夺用户的注意力来实现商业利益的一种模式。企业和平台通过提供引人入胜的和个性化推荐,吸引用户花...
26年前的Windows 98古董电脑成功运行大型语言模型:EXO Labs推动人工智能普及,搭载奔腾II处理器和128MB内存,再现BitNet时代辉煌
运行 Windows 98 的奔腾 II 电脑成功运行大型语言模型 近日,一个名为 EXO Labs 的组织在社交媒体上发布了一段视频,展示了在一台拥有 26 年历史的奔腾 II 电脑(配备 128MB 内存)上成功运行大型语言模型(LLM)的过程。这台古老的 350MHz Elonex 奔腾 II 电脑运行了基于 Andrej Karpathy 开发的 Llama2.c 定制纯 C 推理引擎,并生成了一个关于“Sleepy Joe”的故事。令人惊讶的是,整个过程非常流畅,故事生成速度也相当可观。 EXO Labs 的愿景与使命 EXO Labs 由牛津大学的研究人员和工程师组成,致力于“普及人工智能”。...
提升芯片上市速度30%:业界首个专为半导体行业打造的大型语言模型SemiKong重磅发布,助力半导体设计与AI工具融合,赋能数字专家高效创新。
专为半导体行业打造的AI工具SemiKong正式发布 近日,由Aitomatic公司及其“AI联盟”合作伙伴共同开发的大型语言模型(LLM)——SemiKong已正式推出。作为全球首个专门为满足半导体行业需求而设计的AI工具,SemiKong旨在融入半导体设计公司的日常工作中,充当“数字专家”,从而显著加快新芯片的上市速度。 应对半导体行业的专业知识流失挑战 据Aitomatic公司介绍,半导体行业正面临着一个严峻的问题:随着越来越多的资深专家退休,他们的宝贵经验和知识也随之流失,导致许多公司面临严重的人才短缺。为了应对这一挑战,专门为半...
刚刚,马斯克为xAI大模型项目融资438亿,黄仁勋和苏姿丰助力AI大模型发展,共同推动大型语言模型创新
xAI融资120亿美元,加速AI基础设施建设与产品创新 近日,马斯克创办的AI大模型公司xAI宣布完成60亿美元(约合人民币438亿元)的C轮融资,投资方包括A16Z、Blackrock等知名机构。英伟达和AMD作为战略投资者也参与其中,并继续支持xAI扩展其先进的基础设施。这笔新资金使xAI的总融资额达到120亿美元(约合人民币876亿元),估值超过500亿美元,与京东相当。xAI已成为全球大模型独角兽中的佼佼者,仅次于OpenAI。 融资用途及未来计划 本轮融资将用于加速xAI的基础设施建设,推出数十亿人使用的突破性产品,并加快未来技术的...
深入解析AI技术与通用人工智能:大型语言模型与人工智能生成内容的官方中文译名确定,全面了解高级加密标准在其中的应用
近期,快科技报道指出,随着AI技术的迅猛发展,诸如AIGC、AGI等新术语频繁出现在各类新闻中,令许多人感到困惑。为了解决这一问题,官方最近发布了规范的中文翻译。 据教育部最新消息,外语中文译写规范部际联席会议专家委员会已审议通过第十六批18组推荐使用的外语词中文译名。这批译名主要涉及人工智能和信息技术领域的专业术语。 具体来说,这些推荐使用的中文译名包括: - AES:全称Advanced Encryption Standard,译名为“高级加密标准” - AGI:全称Artificial General Intelligence,译名为“通用人工智能” - AIGC:全...
苹果计划在iOS 19和macOS 16中利用大型语言模型和人工智能技术对Siri进行重大革新!
据消息人士透露,苹果公司正致力于开发一款具有更强对话功能的Siri数字助手,目标是迎头赶上OpenAI的ChatGPT和其他语音服务。消息人士表示,这款新Siri的具体细节尚未公布,但将采用更先进的大型语言模型(LLMs),支持更流畅的对话交互。此外,新系统将能够更快地处理更复杂的请求。 据了解,改进后的Siri将依赖于苹果公司最新的AI模型,使其更加人性化,并能像ChatGPT和谷歌的Gemini一样高效处理任务。新版本的Siri还将增强对第三方应用程序的控制能力,并集成“苹果智能”(Apple Intelligence)的功能,如文本写作和摘要...