标签:GPT-4

无需人类或GPT-4打标签!南大&旷视研究院无监督范式大幅降低视觉大模型对齐成本

南大和旷视研究院的专家们开发了一种创新的无监督范式,名为Self-Supervised Visual Preference Alignment(SeVa),旨在降低视觉大模型的偏好对齐成本。研究团队发现现有的视觉大模型在用户体验方面存在不足,如不遵循指令、产生误导性回答等问题。为了解决这些问题,他们提出了一套自动化构建偏好数据的方法,无需GPT-4或人工打标签。 SeVa通过构造正负样本对比数据集,利用LLaVa-1.5模型的图像增广技术,生成正样本(原始图像的回答)和负样本(增广图像的回答)。这种方法提高了模型的指令遵循能力和用户友好性,减少了...

苹果终于交出AI答卷:结果一夜没了4000亿

在全球科技巨头积极探索人工智能的背景下,苹果在备受瞩目的WWDC24大会上揭晓了其AI领域的创新成果——Apple Intelligence。尽管市场反应导致苹果股价下跌,但这并未影响发布会的亮点。Apple Intelligence是一个全面的AI解决方案,包含了智能助手、邮件摘要、图像编辑和自动翻译等功能,展示了苹果强大的集成能力。 特别突出的是,苹果引入了OpenAI的GPT-4技术,赋予Siri更为先进的理解和交互性能。新的Siri不仅支持文本和语音交互,还能跨应用程序执行任务,提升了用户体验。然而,这样的升级对硬件要求较高,仅限于iPhone 1...

成功率达 53%,研究显示 GPT-4 可自主利用“零日”漏洞攻破网站

近期,一项由研究人员实施的创新实验揭示了人工智能技术的新风险。他们利用一组协同工作的GPT-4机器人,成功渗透了超过半数的测试网站,这些机器人能够自我协调并生成新的辅助工具。令人惊讶的是,这些机器人利用的是前所未见、现实世界中未公开的“零日”漏洞。研究人员在早前的论文中展示了GPT-4自动利用已知但未修复的“N天”漏洞的能力。现在,他们进一步突破,揭示了对未知“零日”漏洞的利用方法。 研究人员采用了一种称为“任务特定智能体分层规划”(HPTSA)的策略,让一群自主传播的大型语言模型协同工作。与以往单个模型...

OpenAI开源GPT-4 SAE,提供1600万个解释模式

OpenAI近期开源了其GPT-4的稀疏自动编码器(SAE),旨在解决大模型生成内容不可控的问题。SAE通过引入稀疏性约束,帮助模型学习更有意义的特征,以提高输出的精确性和安全性。 Anthropic之前的研究也表明,分解神经网络特征可以增强解释性和可控性。OpenAI不仅提供了SAE的论文和源代码,还有在线体验,以促进全球开发者理解和控制大模型的输出。尽管神经网络的复杂性使得精确控制输出成为挑战,但SAE的引入为理解并优化模型行为提供了新途径。N2G方法是OpenAI用来理解神经元行为的关键,它通过识别激活条件来揭示模型行为的...

科大讯飞:讯飞星火 V4.0 正在训练中,对标 GPT-4o 的产品也在研发

科大讯飞在最新的互动交流中宣布,其正在研发的讯飞星火V4.0模型,一款与GPT-4相当的人工智能产品,预计将于2024年6月底面世。此外,公司还透露了一个针对GPT-4o的项目正处于研发阶段。科大讯飞致力于将人工智能的最新进展应用于智慧教育领域,以提升产品体验和市场覆盖率。此前,科大讯飞董事长刘庆峰在今年4月提及,讯飞星火V4.0将在6月27日发布,而当前的星火大模型V3.5在多个长文本处理任务上的表现已接近或超越了GPT-4 Turbo。

​OpenAI 有望在两到三年内成为价值万亿美元的公司

中国著名投资人及连续创业者李开复近期在《财富》杂志访谈中表达了对OpenAI的高度期待,认为这家人工智能公司在未来两到三年内有潜力成长为一家市值万亿美元的企业。他表示,OpenAI的GPT-4模型至今仍保持领先,即便面临其他竞争产品的挑战,其性能与成本效益依然出色。尽管李开复对OpenAI的封闭性有所保留,但他若有机会投资,首选会是OpenAI。 去年,李开复创办了01.AI,目标是为中国市场打造本土化的大型语言模型,并选择了开源路线,与OpenAI的策略形成对比。OpenAI在最近的春季更新中推出的GPT-4o引起了广泛关注,因其...

击穿全网底价,通义千问GPT-4级大模型直降97%!1块钱能买200万tokens

阿里云近期推出重大降价策略,针对旗下9款通义大模型,其中包括性能媲美GPT-4的Qwen-Long模型,其API输入价格大幅下降97%,达到0.0005元/千tokens,使得每块人民币能购买200万个tokens,性价比极高。Qwen-max超大杯模型的输入价格也降低67%,降至0.04元/千tokens。开源模型如Qwen1.5-72B等也有超过75%的降价。此举不仅刷新全网最低价,也为企业和程序员带来了618购物节般的优惠。降价后,通义千问系列模型相对于GPT系列,基本实现1折价格,且在长文本处理方面表现出色,支持长达1000万tokens的输入。此外,阿里云通过优化技...

阿尔特曼最新访谈,多次“点名”苹果公司,什么信号?

OpenAI将在5月13日举行春季更新活动,通过线上直播展示ChatGPT和GPT-4的最新功能,但CEO萨姆·阿尔特曼确认GPT-5和自研搜索引擎不会亮相。苹果公司计划将ChatGPT技术融入即将发布的iOS 18操作系统,这将对智能手机领域产生深远影响。阿尔特曼在访谈中讨论了AI监管、开源模型、AI未来交互方式等多个议题,对AI的未来发展表达了乐观态度。他还提到,OpenAI正在探索将先进模型以免费或低成本方式提供给更多用户。

最新中文大模型测评:百川智能 Baichuan 3 国内第一

在最新的《中文大模型基准测评 2024 年度 4 月报告》中,SuperCLUE 评测机构对国内外32个知名大模型进行了全面评估。这份报告揭示了百川智能的 Baichuan 3 在国内大模型中占据领先地位,紧随其后的是智谱 GLM-4、通义千问 2.1、文心一言 4.0和 Moonshot (Kimi)。尽管如此,国际上的GPT-4和Claude3在测评中表现出更高的得分。 SuperCLUE 不仅局限于传统的选择题形式,还引入了开放性问题的测评,以模拟实际应用中的大模型场景。通过多轮对话的设定,深入评估模型的上下文理解、记忆和对话能力。本次测评涵盖了逻辑推理、代码...

GPT-4 化身黑客搞破坏,成功率 87%!OpenAI 要求保密提示词,网友复现 ing

伊利诺伊大学香槟分校的研究团队揭示了一项惊人的发现,他们设计了一个黑客智能体框架,测试了10个模型,包括GPT-4和GPT-3.5,以评估其利用CVE漏洞的能力。结果显示,只有GPT-4能够在阅读漏洞描述后成功执行攻击,成功率高达87%,而其他模型则完全失败。这一研究引起了广泛关注,但OpenAI已要求不要公开相关提示词。实验中,研究人员使用了91行代码构建智能体,其通过LangChain的ReAct框架模拟攻击,如双花攻击,并考虑了并发攻击和响应策略。尽管GPT-4在某些特定场景下未能成功,如Iris XSS和Hertzbeat RCE,但总体表现突出...