标签:大语言模型

大语言模型与智能体融合:ICLR 2025北京论文分享会跨模态扩散模型最新进展本周日等你来探索

(由多段落组成) 从 OpenAI o1 到 DeepSeek R1,推理模型已经迈入了全新的发展阶段。这些模型所展现的「慢思考、强推理」能力正加速推动从语言智能到认知智能的演进,并为未来的人工通用智能(AGI)奠定了重要基础。与此同时,学术界对大语言模型的研究仍在深入展开,扩散模型不断向主流的自回归架构发起挑战。 在 2025 年智能体元年,大语言模型(LLM)驱动的智能体通过手机等移动终端落地,彻底改变了人机交互的方式。此外,多模态大模型的竞争也愈发激烈,各大厂商不仅致力于提升跨模态理解与生成能力,还注重实现低成...

大语言模型与推理模型进展:ICLR 2025论文分享会自回归架构与多模态大模型趋势解析,迈向AGI北京见

从 OpenAI o1 到 DeepSeek R1,推理模型已经迈入了全新的发展阶段。这些模型展现出的「慢思考、强推理」能力正在加速推动语言智能向认知智能的转变,并为未来的通用人工智能(AGI)奠定了重要基础。与此同时,学术界对大语言模型的研究仍在深入,扩散模型持续挑战主流的自回归架构。随着 2025 年智能体元年的到来,由大语言模型(LLM)驱动的智能体通过手机等移动终端实现落地,彻底改变了人机交互的传统模式。此外,多模态大模型的竞争日益激烈,不仅提升了跨模态的理解与生成能力,还注重低成本和低门槛的应用。 为了帮助...

AI代理与大语言模型结合:科技趋势下聊天机器人与AI助手的未来发展

近年来,AI技术的迅速发展使其成为全球关注的焦点。根据凤凰网科技讯报道,北京时间3月30日,《华尔街日报》指出,硅谷科技巨头们正在热烈讨论一个新概念——“AI Agents”(AI代理或AI智能体),并将其视为未来的重要趋势。然而,目前对于这一术语的定义尚未形成统一标准,这导致了市场上的一定混乱。 金融服务公司第一资本(Capital One)的首席科学家兼企业AI负责人普雷姆·纳塔拉詹(Prem Natarajan)形象地将这种现象比喻为“盲人摸象”。他表示,不同的人对AI代理的理解可能大相径庭,就像每个人都在触摸大象的不同部位,得出的...

人工智能大语言模型在时间推理任务上的挑战:时钟识别与日历任务为何难倒AI?

(由多段落组成) 随着人工智能技术的飞速发展,AI 已经能够生成逼真的图像、创作小说,甚至预测蛋白质结构。然而,一项最新的研究发现,这些看似无所不能的 AI 在一项非常基础的任务上却频频出错——那就是读取时间。爱丁堡大学的研究团队测试了七款知名的多模态大语言模型,评估它们通过时钟或日历图像回答时间相关问题的能力。 这项研究将在 4 月正式发布,但目前已在科研共享平台 arXiv 上公开。研究表明,即使是当前最先进的大型语言模型,在处理这种基础任务时也表现不佳。研究人员指出:“从视觉输入中解读时间并进行...

AI Agent与大语言模型:从思考到行动的数字员工革命及伦理问题探讨

2025年3月,一款名为Manus的AI产品在社交媒体上引起了广泛关注。它的内测邀请码一码难求,甚至被炒至数万元,并带动了超过150只AI智能体概念股涨停。Manus之所以受到如此关注,不仅因为它在GAIA基准测试中超越了OpenAI的Operator模型,达到了当前技术的最佳水平(SOTA),更因为它代表了一种全新的AI形态——AI Agent(人工智能智能体)。与我们熟悉的ChatGPT等生成式AI不同,AI Agent实现了从“思考”到“行动”的跨越。 ChatGPT更像是一个超级大脑,擅长回答问题和生成,但仅停留在思考层面。而AI Agent则更进一步,不仅能思考...

AI搜索引擎优化标题:揭秘ChatGPT与Perplexity背后的大语言模型错误率及哥伦比亚大学关于AI搜索工具准确率仅六成的研究成果

AI搜索引擎的准确性测试:哥伦比亚大学数字新闻研究中心的研究结果 据IT之家报道,哥伦比亚大学数字新闻研究中心(Tow Center for Digital Journalism)近期对八款AI搜索引擎进行了深入研究。这些引擎包括ChatGPT Search、Perplexity、Perplexity Pro、Gemini、Deepseek Search、Grok-2 Search、Grok-3 Search和Copilot。研究人员通过一系列严格的测试,评估了这些AI工具在处理新闻查询时的表现。 研究人员从20家知名新闻机构中随机挑选了200篇报道(每家10篇),确保这些文章在谷歌搜索中能排在前三位。然后,他们用相同...

利用生成式人工智能与大语言模型,REVOLVE智能优化框架如何通过深度学习破解传统AI优化瓶颈,实现响应演化驱动的高效解决方案

iDreamer:激发科研热情的全球中心 iDreamer 致力于打造一个激发科研热情的全球中心。我们帮助教授将愿景变为现实,为学生照亮塑造未来的道路。在这里,没有资源的壁垒,没有思想的界限,只有团结一心追求卓越。我们相信,真正的研究应该属于每一个有才华、有梦想的人。通过整合全球资源、优化协作,我们确保每一位科研人员在这里都能找到自己理想的伙伴和方向。 生成式人工智能(Generative AI)的发展趋势 生成式人工智能正在从单一模型训练阶段过渡到更加复杂的系统优化时代。随着大语言模型(LLM)及其相关组件在多种...

深入解析大语言模型中的安全对齐机制:如何通过RACE框架防止推理增强对话中的越狱攻击并确保逻辑推理题不被滥用实现自我越狱

机器之心AIxiv专栏:促进学术交流与技术传播 机器之心的AIxiv专栏致力于发布高质量的学术和技术,自成立以来已报道了超过2000篇来自全球顶尖高校和企业的研究成果,有效促进了学术界的交流与知识传播。如果您有优秀的工作或研究想要分享,欢迎通过以下邮箱投稿或联系: - 投稿邮箱:liyazhou@jiqizhixin.com - 联系邮箱:zhaoyunfeng@jiqizhixin.com 北航智能安全团队:大模型越狱攻防的研究进展 应宗浩是北航复杂关键软件环境全国重点实验室的一名博士生,由刘艾杉教授、刘祥龙教授和陶大程教授共同指导,专注于大模型...

谷歌 CEO 皮查伊展望 2025 年:面对高风险与大赌注,推广 Gemini 应用成首要任务,推动 AI 发展与大语言模型创新

谷歌 CEO 皮查伊展望 2025:竞争激烈、AI 快速发展与 Gemini 应用的战略布局 据美国媒体 CNBC 报道,谷歌 CEO 桑达尔·皮查伊在上周向公司员工传达了对 2025 年的展望。他表示,这一年将充满挑战和机遇,是谷歌发展的关键节点。面对日益激烈的市场竞争、监管压力以及人工智能(AI)技术的迅猛进步,皮查伊强调了紧迫感的重要性,并呼吁全体员工加快步伐,积极应对变革。 皮查伊指出,“我认为 2025 年将是至关重要的时刻。我们必须深刻认识到当前形势的紧迫性,加速推动技术创新,以解决用户面临的实际问题。”他特别提到了正...

CCF-CV与合合信息联手打造技术分享论坛,深入探讨大语言模型时代的智能向善、人工智能安全治理及图像篡改检测等视觉安全前沿热点

2024年度十大流行语发布:“智能向善”引领AI治理新方向 近日,《咬文嚼字》杂志公布了2024年度十大流行语,“智能向善”榜上有名。在过去的一年中,深度伪造和AI诈骗等事件频繁成为热点话题,引发了公众对AI技术“野蛮生长”的担忧。为了应对这些挑战,全国网络安全标准化技术委员会于今年9月发布了《人工智能安全治理框架》,强调了AI技术面临的内外部风险,包括技术缺陷、不当使用和恶意利用。 《打造大模型时代的可信AI》论坛成功举办 为探讨AI安全治理的有效路径,由中国计算机学会计算机视觉专委会主办,合合信息承办,...
1234