标签:大模型

北大王立威解析:从理论视角审视大模型与Transformer,探索人工智能的聪明与愚蠢之谜 | 智者访谈

人工智能的卓越发展与洞察 人工智能的快速发展得益于对技术和产业本质的深刻洞察。机器之心推出全新视频栏目“智者访谈”,邀请领域内的专家,解析AI核心技术与行业趋势,为从业者提供深入的认知,激发创新思考。本期节目邀请了北京大学智能学院教授王立威,探讨机器学习理论对AI未来发展的深远影响。 市场对AI泡沫破裂的担忧 近期美股科技巨头市值大幅缩水,引发了市场对AI泡沫破裂的担忧,特别是在大模型领域。尽管当前AI成果令人惊叹,但其过程中的诸多问题仍需解决。大语言模型(LLM)的通用能力是一个意外收获,Transf...

深势科技李小兵:以科学方法优化大模型,引领AI与医疗的未来研究

在2024年9月6日举办的界面REAL科技大会上,深势科技生命科学事业部总经理李小兵参加了一场以“AI+医疗”为主题的圆桌对话。他指出,在当前的大模型领域,GPT更像是一个“文科生”,擅长处理语言和文字类的任务。然而,在AI for Science这一赛道上,需要解决的是更加复杂且具有科学性质的问题。 李小兵进一步解释说,在科学研究中,涉及到多种不同的数据类型和模态,例如化学领域的分子式和结构式,以及生物领域的序列等。这些科学问题需要更为精确和专业的处理方法。因此,我们需要通过“理科生”的思维方式来对大模型进行优化和...

利用开源大模型VideoGameBunny提升游戏开发中的视觉AI与LoRA微调技术深度解析

大模型在游戏开发领域中发挥着重要作用,涵盖了从AI机器人的生成到游戏场景的构建等多个方面。然而,在游戏场景理解、图像识别和描述方面仍存在一些挑战。为解决这些问题,加拿大阿尔伯塔的研究人员推出了一款名为VideoGameBunny(简称“VGB”)的大模型,并将其开源。VGB可以作为视觉AI助手,帮助玩家理解和应对游戏环境。 在探索型3A游戏中,VGB能够识别关键物品并提供实时反馈,从而帮助玩家更快地掌握游戏技巧,提升游戏的互动性和沉浸感。此外,VGB通过分析大量游戏图像数据,能够检测图形渲染错误和物理引擎的不一致等...

【无问芯穹】清华系AI Infra创企获近10亿融资,联想小米参投,打造AI算力大模型与异构云平台

无问芯穹(Infinigence AI),一家成立于2023年5月的清华系AI基础设施初创公司,在短短1年4个月内已经完成了近10亿元的融资。该公司由清华大学电子工程系教授汪玉发起,他的第一位博士毕业生夏立雪担任联合创始人兼CEO。无问芯穹的使命是“释放无限算力,让AGI触手可及”,致力于成为大模型时代的“算力运营商”。 无问芯穹刚刚宣布完成近5亿元的A轮融资,联合领投方包括社保基金中关村自主创新专项基金(君联资本担任管理人)、启明创投、洪泰基金等。跟投方包括联想创投、小米、软通高科等战略投资方,以及国开科创、上海人工...

Character.AI 选择联合谷歌:深入解析 AI 创业公司在大模型市场下的自然语言处理之路

近期,AI领域再次见证了一家独角兽公司的命运转折——Character.AI。这家以“AI伴侣”闻名的初创企业,在经历了一段时间的辉煌后,最终选择与谷歌达成合作,将其模型授权给后者,同时也获得了来自谷歌的资金支持。这一事件不仅仅是Character.AI的故事,它也反映了当前AI创业公司面临的普遍挑战。 Character.AI 的起落 Character.AI由Noam Shazeer和Daniel De Freitas共同创立,两人皆有着深厚的谷歌背景。Shazeer曾是LaMDA项目的主要负责人,而De Freitas则是资深的谷歌软件工程师。凭借“AI伴侣”这款创新产品,Character.AI迅...

中国具身智能领域顶尖交流!20多位产业与学术专家深入探讨通用人工智能、人形机器人、大模型及灵巧手技术的突破方向与面临的挑战

具身智能:开启AI新篇章 在2024科技创变者大会上,多位业内顶尖科学家和企业家围绕具身智能的新技术、趋势与应用场景展开了深入讨论。具身智能被视为通往通用人工智能(AGI)的关键路径之一,强调实体与环境互动以实现智能进化。 北京智源人工智能研究院黄铁军:具身智能的大脑与视觉 北京智源人工智能研究院理事长黄铁军认为,当前的大模型代表着真正智能,尤其在神经网络架构上取得了显著进展。他指出,具身智能研究中,眼睛的角色尚未得到充分探讨,而实际上,人类大脑通过脉冲神经网络处理视觉信息,这一机制启发了...

阿里开源Qwen2-Audio:全新大模型在语音识别与音频分析超越OpenAI的Whisper!

阿里巴巴推出全新语音模型 Qwen2-Audio:功能与技术解析 近期,阿里巴巴在原有Qwen-Audio基础上,发布了全新升级版语音模型——Qwen2-Audio。这款模型不仅在技术架构上进行了革新,还在功能上实现了突破性的进展,为语音识别和音频分析领域带来了新的可能性。 技术升级与功能拓展 Qwen2-Audio分为基础版和指令微调版,支持多语言和方言识别,包括中文、粤语、法语、英语、日语等,极大地方便了开发者进行翻译和情感分析等工作。该模型采用了自然语言提示的方法,取代了前一代复杂的分层标签系统,简化了训练流程,增强了模...

大模型公司:运用AI技术创新,打造卓越用户体验,精准营销策略

在当前的大模型产品竞争中,线上线下的营销策略已成为各家公司不可或缺的一部分。线下,诸如地铁站、写字楼等人流量大的地方随处可见大模型公司的广告;线上,特别是社交媒体平台如B站、小红书等,也成为了宣传的主战场。据统计,仅在6月份的第一周,B站上AI相关的广告投放量就达到了去年同期的三到四倍。 投放策略分析 在众多投放渠道中,B站成为了Kimi等大模型公司的重要阵地。Kimi不仅覆盖了B站上与AI相关的几乎所有关键词,还引发了其他大模型厂商的跟进,形成了一场营销大战。相比之下,字节跳动旗下的豆包则选择了...

京东云的大模型策略:致力于让‘炮火声’引领数字人与供应链的商业化创新

大模型的发展正迅速改变各行各业的面貌,然而多数突破仍局限于基础模型阶段,难以实现真正的商业化。京东云选择了一条不同的路径,利用其深厚的供应链背景,让大模型技术在实际业务中得到应用和发展。7月30日在京东云峰会上,京东宣布已在100多个AI场景中全面部署大模型技术,并取得显著成果,如京东云言犀数字人的成功商业化。 数字人:技术融合与商业化突破 数字人被视为当前多模态技术落地最快的领域之一,它整合了文案生成、语音融合等多种技术,能够有效降低直播电商的门槛。京东云言犀数字人不仅在电商直播场景中表...

大模型化私人导游:港大MIT联合打造ITINERA,一键实现个性化城市漫步与空间优化路线规划

大型语言模型(LLM)与空间优化技术的融合,催生了一款全新的城市探索工具——ITINERA。这款由香港大学与麻省理工学院合作开发的应用程序,旨在为用户提供个性化的城市漫步(Citywalk)路线规划服务。用户只需简单地提出自己的游览偏好,ITINERA便能迅速生成一条量身定制的路线,甚至能够理解并满足诸如“寻找适合情侣的酒吧”或“探访二次元文化圣地”这样的特定需求。 实现个性化旅程规划 ITINERA的强大之处在于它不仅能根据用户的个性化要求规划路线,还能确保这些路线在空间布局上的合理性。例如,当用户提出希望体验一条充...
12349