标签：安全性

奥特曼被逼急：深夜紧急上线o3-mini对抗OpenAI，网友热议安全性与STEM推理性能，免费体验引发DeepSeek选择难题

OpenAI 推出全新推理模型 o3-mini，提升效率与性能在经过一周的 DeepSeek 狂轰滥炸后，OpenAI 终于发布了备受期待的新模型 o3-mini。此次发布的 o3-mini 包含 low、medium 和 high 三个版本，旨在为用户提供更具成本效益的选择。o3-mini 已经上线 ChatGPT 和 API，用户可以在这些平台上体验到这一新模型的强大功能。尽管 o3-mini 目前还不支持视觉功能，开发者仍需使用 OpenAI o1 进行视觉推理任务，但其在其他方面的表现令人印象深刻。ChatGPT Plus、Team 和 Pro 用户从今天起就可以访问 o3-mini，企业版用户则将在一周...

来源：

机器之心【阅读原文】
Tags：ChatGPT o3-mini OpenAI STEM 推理安全性

2个月前

OpenAI首播震撼登场！o1满血版与ChatGPT Pro同步推出，多模态推理与安全性全面升级，月费高达1450元的顶级体验

OpenAI首次直播震撼登场，最强推理模型o1满血版上线，月费高达1450元来源：量子位 2024-12-06 04：36：08 在“双十二”购物节的第一天，OpenAI以一场震撼的直播拉开了序幕，发布了其最强推理模型o1的满血版及其Pro版本。同时，ChatGPT也推出了Pro订阅计划，月费高达200美元，成为全球最昂贵的语言模型之一。 CEO山姆·阿尔特曼与几位团队成员围坐在桌前，向观众展示了新产品的强大功能。整个发布会虽然只有短短15分钟，但信息量巨大，令人印象深刻。与之前的预览版相比，满血版o1在数学和代码能力方面有了显著提升，Pro...

来源：

量子位【阅读原文】
Tags：ChatGPT Pro o1满血版 OpenAI 多模态推理安全性

4个月前

国泰君安分析：随着AI技术的不断进步，聚焦虚拟陪伴领域在儿童市场中的用户体验与安全性提升

12月2日，据国泰君安证券最新研报指出，随着人工智能技术的不断进步和用户体验的持续优化，虚拟陪伴的需求将逐渐被挖掘出来。这一领域的发展潜力巨大，主要可以从两个方面进行探索：首先，在软件层面，可以通过开发更多元化的娱乐功能来满足用户的需求。这类应用需要注重产品的丰富性和交互的多样性，以提升用户的使用体验和黏性。例如，通过引入更多的虚拟角色、互动场景以及个性化定制服务，可以让用户在虚拟世界中获得更加丰富的娱乐体验。其次，在硬件层面，特别是针对儿童市场的虚拟陪伴产品，安全性和隐私保护是至...

来源：

界面新闻【阅读原文】
Tags：AI技术儿童市场安全性用户体验虚拟陪伴

4个月前

Heeyo：探索AI聊天机器人在儿童教育领域的安全性和盈利模式新机遇

Heeyo 不仅仅是为了给孤独的孩子们提供一个 AI 朋友，更重要的是帮助他们学习感兴趣的，并激发他们对某些事物的兴趣。该平台利用孩子们喜爱的角色，以轻松、非正式的教学方式传授知识。一、Heeyo 的安全防护措施 Heeyo 以安全性为核心，从数据处理到敏感问题的处理以及家长控制措施，确保为儿童和家庭提供健康的学习体验。尽管技术仍然新颖，但 Heeyo 正在采取适当步骤，使其应用程序成为孩子们独自或与家人一起进行情感支持和互动学习的安全平台。二、Heeyo 的丰富形式 Heeyo 提供 AI 聊天机器人和超过 2000 种互动...

来源：

深思SenseAI公众号【阅读原文】
Tags：AI 聊天机器人 Heeyo 儿童教育安全性盈利模式

6个月前

OpenAI最新力作：探索超级对齐理论，模型间验证者-证明者博弈提升安全性与可读性

OpenAI近期发布了一篇关于“超级对齐”研究的最终论文，提出了一种让大、小模型互相博弈以提升生成内容可读性的方法。该研究旨在在保持准确率的同时，使模型输出更易于人类理解。通过模拟多伦多大学的“证明者-验证者”博弈框架，OpenAI让大模型作为“证明者”，小模型作为“验证者”，二者在相互竞争中共同进步。这种方法使得大模型的输出变得更加易懂，且准确率没有显著下降，同时小模型的判断能力也得到提高。论文作者之一Yining Chen认为，这种方式可能使未来的模型超越人类智慧。尽管超级对齐团队已解散，但这项研究仍引起热...

来源：

量子位【阅读原文】
Tags：OpenAI 安全性模型可读性证明者-验证者博弈超级对齐

9个月前

GPT-5红队测试邮件曝光，最早6月发布？网友在线逼问Altman，数十亿美元超算26年启动

随着网上流传的OpenAI红队测试录取通知书，GPT-5的发布似乎越来越近。尽管官方未确认，但有传闻称GPT-5将在6月推出，与红队测试的时间线相吻合。安全测试至关重要，因为ChatGPT的广泛使用使得OpenAI必须确保新模型的安全性，特别是考虑到企业级应用的需求。据信，红队测试将持续90到120天，如果针对GPT-5，那么用户可能在三个月内就能接触到。网友们对GPT-5的期望很高，期待它在上下文窗口、速度、策略规划等方面有所突破。同时，有消息称GPT-5已经在推理能力上取得显著进步，甚至可能实现自主解决ChatGPT的登录问题。OpenAI...

来源：

新智元公众号【阅读原文】
Tags：AGI GPT-5 OpenAI 安全性红队测试

12个月前

遏制 AI 失控，微软发布系列工具减少 Copilot“幻觉”情况

随着生成式AI技术的广泛应用，其潜在的安全隐患、隐私疑虑和可靠性问题引起了广泛关注。微软公司近期采取了一系列措施，以确保生成式AI系统的稳定与可控，避免类似Supremacy AGI事件的发生。微软强调，AI系统可能受到提示词注入攻击，导致它们执行恶意操作，如产生有害内容或泄露敏感信息。微软针对这一问题进行了多方面应对。首先，对Copilot的字符数量进行了限制，以减少因输入过长而引发的错误响应。此外，微软还推出了“基础检测”功能，能检测并提示用户识别文本中的不实信息，提升AI输出的准确性和可信度。为了增强A...

来源：

IT之家【阅读原文】
Tags：Copilot 安全性幻觉发作微软生成式AI

1年前 (2024)