标签:大语言模型

AI代理与大语言模型结合:科技趋势下聊天机器人与AI助手的未来发展

近年来,AI技术的迅速发展使其成为全球关注的焦点。根据凤凰网科技讯报道,北京时间3月30日,《华尔街日报》指出,硅谷科技巨头们正在热烈讨论一个新概念——“AI Agents”(AI代理或AI智能体),并将其视为未来的重要趋势。然而,目前对于这一术语的定义尚未形成统一标准,这导致了市场上的一定混乱。 金融服务公司第一资本(Capital One)的首席科学家兼企业AI负责人普雷姆·纳塔拉詹(Prem Natarajan)形象地将这种现象比喻为“盲人摸象”。他表示,不同的人对AI代理的理解可能大相径庭,就像每个人都在触摸大象的不同部位,得出的...

人工智能大语言模型在时间推理任务上的挑战:时钟识别与日历任务为何难倒AI?

(由多段落组成) 随着人工智能技术的飞速发展,AI 已经能够生成逼真的图像、创作小说,甚至预测蛋白质结构。然而,一项最新的研究发现,这些看似无所不能的 AI 在一项非常基础的任务上却频频出错——那就是读取时间。爱丁堡大学的研究团队测试了七款知名的多模态大语言模型,评估它们通过时钟或日历图像回答时间相关问题的能力。 这项研究将在 4 月正式发布,但目前已在科研共享平台 arXiv 上公开。研究表明,即使是当前最先进的大型语言模型,在处理这种基础任务时也表现不佳。研究人员指出:“从视觉输入中解读时间并进行...

AI Agent与大语言模型:从思考到行动的数字员工革命及伦理问题探讨

2025年3月,一款名为Manus的AI产品在社交媒体上引起了广泛关注。它的内测邀请码一码难求,甚至被炒至数万元,并带动了超过150只AI智能体概念股涨停。Manus之所以受到如此关注,不仅因为它在GAIA基准测试中超越了OpenAI的Operator模型,达到了当前技术的最佳水平(SOTA),更因为它代表了一种全新的AI形态——AI Agent(人工智能智能体)。与我们熟悉的ChatGPT等生成式AI不同,AI Agent实现了从“思考”到“行动”的跨越。 ChatGPT更像是一个超级大脑,擅长回答问题和生成,但仅停留在思考层面。而AI Agent则更进一步,不仅能思考...

AI搜索引擎优化标题:揭秘ChatGPT与Perplexity背后的大语言模型错误率及哥伦比亚大学关于AI搜索工具准确率仅六成的研究成果

AI搜索引擎的准确性测试:哥伦比亚大学数字新闻研究中心的研究结果 据IT之家报道,哥伦比亚大学数字新闻研究中心(Tow Center for Digital Journalism)近期对八款AI搜索引擎进行了深入研究。这些引擎包括ChatGPT Search、Perplexity、Perplexity Pro、Gemini、Deepseek Search、Grok-2 Search、Grok-3 Search和Copilot。研究人员通过一系列严格的测试,评估了这些AI工具在处理新闻查询时的表现。 研究人员从20家知名新闻机构中随机挑选了200篇报道(每家10篇),确保这些文章在谷歌搜索中能排在前三位。然后,他们用相同...

利用生成式人工智能与大语言模型,REVOLVE智能优化框架如何通过深度学习破解传统AI优化瓶颈,实现响应演化驱动的高效解决方案

iDreamer:激发科研热情的全球中心 iDreamer 致力于打造一个激发科研热情的全球中心。我们帮助教授将愿景变为现实,为学生照亮塑造未来的道路。在这里,没有资源的壁垒,没有思想的界限,只有团结一心追求卓越。我们相信,真正的研究应该属于每一个有才华、有梦想的人。通过整合全球资源、优化协作,我们确保每一位科研人员在这里都能找到自己理想的伙伴和方向。 生成式人工智能(Generative AI)的发展趋势 生成式人工智能正在从单一模型训练阶段过渡到更加复杂的系统优化时代。随着大语言模型(LLM)及其相关组件在多种...

深入解析大语言模型中的安全对齐机制:如何通过RACE框架防止推理增强对话中的越狱攻击并确保逻辑推理题不被滥用实现自我越狱

机器之心AIxiv专栏:促进学术交流与技术传播 机器之心的AIxiv专栏致力于发布高质量的学术和技术,自成立以来已报道了超过2000篇来自全球顶尖高校和企业的研究成果,有效促进了学术界的交流与知识传播。如果您有优秀的工作或研究想要分享,欢迎通过以下邮箱投稿或联系: - 投稿邮箱:liyazhou@jiqizhixin.com - 联系邮箱:zhaoyunfeng@jiqizhixin.com 北航智能安全团队:大模型越狱攻防的研究进展 应宗浩是北航复杂关键软件环境全国重点实验室的一名博士生,由刘艾杉教授、刘祥龙教授和陶大程教授共同指导,专注于大模型...

谷歌 CEO 皮查伊展望 2025 年:面对高风险与大赌注,推广 Gemini 应用成首要任务,推动 AI 发展与大语言模型创新

谷歌 CEO 皮查伊展望 2025:竞争激烈、AI 快速发展与 Gemini 应用的战略布局 据美国媒体 CNBC 报道,谷歌 CEO 桑达尔·皮查伊在上周向公司员工传达了对 2025 年的展望。他表示,这一年将充满挑战和机遇,是谷歌发展的关键节点。面对日益激烈的市场竞争、监管压力以及人工智能(AI)技术的迅猛进步,皮查伊强调了紧迫感的重要性,并呼吁全体员工加快步伐,积极应对变革。 皮查伊指出,“我认为 2025 年将是至关重要的时刻。我们必须深刻认识到当前形势的紧迫性,加速推动技术创新,以解决用户面临的实际问题。”他特别提到了正...

CCF-CV与合合信息联手打造技术分享论坛,深入探讨大语言模型时代的智能向善、人工智能安全治理及图像篡改检测等视觉安全前沿热点

2024年度十大流行语发布:“智能向善”引领AI治理新方向 近日,《咬文嚼字》杂志公布了2024年度十大流行语,“智能向善”榜上有名。在过去的一年中,深度伪造和AI诈骗等事件频繁成为热点话题,引发了公众对AI技术“野蛮生长”的担忧。为了应对这些挑战,全国网络安全标准化技术委员会于今年9月发布了《人工智能安全治理框架》,强调了AI技术面临的内外部风险,包括技术缺陷、不当使用和恶意利用。 《打造大模型时代的可信AI》论坛成功举办 为探讨AI安全治理的有效路径,由中国计算机学会计算机视觉专委会主办,合合信息承办,...

AI搜索与大语言模型:技术革新与商业模式的双面棋局,挑战小红书的搜索引擎与广告模式

大模型的更新速度让人叹为观止。从技术突破到全面商业化的进程中,AI搜索成为了大模型面向消费者市场的最佳应用场景之一:它不仅引领了语言大模型的发展潮流,还满足了用户对高效信息获取的需求。特别是在中国,拥有10.92亿网民和8.27亿搜索引擎用户的巨大市场中(根据CNNIC 2023年的数据),AI搜索正处于流量爆发的中心。 然而,这只是开始。传统的搜索引擎依赖于关键词匹配的方式,通过索引网页并根据搜索词的相关性排列结果。这种方式存在诸多问题,如信息过载、相关性低、广告干扰、质量不一、时效性差、个性化不足、交...

利用大语言模型进行中文简短问答的真实性评估:RAG策略下的对齐代价分析——OpenAI o1与豆包的表现对比及其它模型的挑战

中文简短问答:评估大语言模型中文真实性能力的新基准 引言 随着人工智能技术的迅猛发展,确保语言模型生成的真实性成为了一项重要挑战。目前,尽管前沿的大语言模型(LLM)在许多任务上表现出色,但它们有时会产生错误或缺乏证据支持的输出,这被称为“幻觉”问题。这种问题严重限制了大语言模型在实际应用中的广泛使用。因此,评估大语言模型的真实性能力变得尤为重要。 新的评估基准 近日,淘宝天猫集团的研究者们提出了一种新的中文简短问答(Chinese SimpleQA)基准,这是首个全面评估大语言模型中文真实性能力的基准...
1234