标签：模型训练

百度文心大模型：多模态融合技术引领AI研发，模型训练助力商业应用新突破——实测X1功能全面解析

百度文心大模型在技术领域再次取得突破，发布了全新版本的文心大模型4.5和X1。此次更新不仅提前实现了全面免费开放，更在中文知识问答、文学创作、逻辑推理等方面展现出更强的能力。文心大模型X1作为首个自主运用工具的深度思考模型，具备卓越的理解、规划与进化能力。而文心大模型4.5则以其多模态融合特性，在图片理解、音视频分析等领域表现突出。百度创始人李彦宏曾在署名文章中提到，原生多模态大模型通过统一架构实现多模态数据的深度融合，是迈向通用人工智能的重要一步。目前，文心大模型4.5已面向企业和开发者开放...

来源：

智东西【阅读原文】
Tags：AI技术研发商业应用多模态融合模型训练百度文心大模型

2周前

利用生成式AI与Agent Instruct：微软通过数据合成为大模型训练打造2500万对高质量数据集，显著增强模型性能与应用潜力！

随着ChatGPT和Copilot等生成式AI技术的迅速发展，对高质量训练数据的需求不断攀升，这已成为提升大型模型性能的重要因素之一。为了解决训练数据不足和质量低下的问题，微软研究院推出了一款名为Agent Instruct的AI代理工具，专门用于生成高质量的合成数据。相关论文已发布在《arXiv》上，详细介绍了这一创新技术。为了克服传统合成数据存在的拟合性差和多样性不足等问题，Agent Instruct采用了一种全新的方法——“生成教学”（Generative Teaching）。这种方法通过多个智能体的协同工作，自动完成数据的转换、清洗和优化，最...

来源：

AIGC开放社区公众号【阅读原文】
Tags：Agent Instruct 数据合成模型训练生成式AI 高质量数据集

7个月前

GPT-4o 与 OpenAI：人工智能模型训练中的安全风险探究——一场诡异尖叫引发的32页技术研究报告

近期，OpenAI发布了关于其最新模型GPT-4o的红队安全报告，揭示了这款“全能”模型的一些意外行为和潜在风险。原本期待重大更新的网友们，收到了一份长达32页的详细报告，而非期待中的功能升级。引人关注的异常行为报告中最引人注目的部分之一是GPT-4o偶尔会模仿用户的语音，甚至发出尖叫声。这一行为不仅令人惊讶，也让用户感到不安。此外，报告还提到在特定的恶意提示下，模型可能会产生不适宜的内容，如色情呻吟或暴力声音。技术挑战与安全考量 GPT-4o是一款能够处理文本、音频、图像和视频输入的模型，其复杂性带来...

来源：

新智元公众号【阅读原文】
Tags：GPT-4o OpenAI 人工智能安全风险模型训练

8个月前