标签:GPT-4
科大讯飞:讯飞星火 V4.0 正在训练中,对标 GPT-4o 的产品也在研发
科大讯飞在最新的互动交流中宣布,其正在研发的讯飞星火V4.0模型,一款与GPT-4相当的人工智能产品,预计将于2024年6月底面世。此外,公司还透露了一个针对GPT-4o的项目正处于研发阶段。科大讯飞致力于将人工智能的最新进展应用于智慧教育领域,以提升产品体验和市场覆盖率。此前,科大讯飞董事长刘庆峰在今年4月提及,讯飞星火V4.0将在6月27日发布,而当前的星火大模型V3.5在多个长文本处理任务上的表现已接近或超越了GPT-4 Turbo。
OpenAI 有望在两到三年内成为价值万亿美元的公司
中国著名投资人及连续创业者李开复近期在《财富》杂志访谈中表达了对OpenAI的高度期待,认为这家人工智能公司在未来两到三年内有潜力成长为一家市值万亿美元的企业。他表示,OpenAI的GPT-4模型至今仍保持领先,即便面临其他竞争产品的挑战,其性能与成本效益依然出色。尽管李开复对OpenAI的封闭性有所保留,但他若有机会投资,首选会是OpenAI。 去年,李开复创办了01.AI,目标是为中国市场打造本土化的大型语言模型,并选择了开源路线,与OpenAI的策略形成对比。OpenAI在最近的春季更新中推出的GPT-4o引起了广泛关注,因其...
击穿全网底价,通义千问GPT-4级大模型直降97%!1块钱能买200万tokens
阿里云近期推出重大降价策略,针对旗下9款通义大模型,其中包括性能媲美GPT-4的Qwen-Long模型,其API输入价格大幅下降97%,达到0.0005元/千tokens,使得每块人民币能购买200万个tokens,性价比极高。Qwen-max超大杯模型的输入价格也降低67%,降至0.04元/千tokens。开源模型如Qwen1.5-72B等也有超过75%的降价。此举不仅刷新全网最低价,也为企业和程序员带来了618购物节般的优惠。降价后,通义千问系列模型相对于GPT系列,基本实现1折价格,且在长文本处理方面表现出色,支持长达1000万tokens的输入。此外,阿里云通过优化技...
阿尔特曼最新访谈,多次“点名”苹果公司,什么信号?
OpenAI将在5月13日举行春季更新活动,通过线上直播展示ChatGPT和GPT-4的最新功能,但CEO萨姆·阿尔特曼确认GPT-5和自研搜索引擎不会亮相。苹果公司计划将ChatGPT技术融入即将发布的iOS 18操作系统,这将对智能手机领域产生深远影响。阿尔特曼在访谈中讨论了AI监管、开源模型、AI未来交互方式等多个议题,对AI的未来发展表达了乐观态度。他还提到,OpenAI正在探索将先进模型以免费或低成本方式提供给更多用户。
最新中文大模型测评:百川智能 Baichuan 3 国内第一
在最新的《中文大模型基准测评 2024 年度 4 月报告》中,SuperCLUE 评测机构对国内外32个知名大模型进行了全面评估。这份报告揭示了百川智能的 Baichuan 3 在国内大模型中占据领先地位,紧随其后的是智谱 GLM-4、通义千问 2.1、文心一言 4.0和 Moonshot (Kimi)。尽管如此,国际上的GPT-4和Claude3在测评中表现出更高的得分。 SuperCLUE 不仅局限于传统的选择题形式,还引入了开放性问题的测评,以模拟实际应用中的大模型场景。通过多轮对话的设定,深入评估模型的上下文理解、记忆和对话能力。本次测评涵盖了逻辑推理、代码...
GPT-4 化身黑客搞破坏,成功率 87%!OpenAI 要求保密提示词,网友复现 ing
伊利诺伊大学香槟分校的研究团队揭示了一项惊人的发现,他们设计了一个黑客智能体框架,测试了10个模型,包括GPT-4和GPT-3.5,以评估其利用CVE漏洞的能力。结果显示,只有GPT-4能够在阅读漏洞描述后成功执行攻击,成功率高达87%,而其他模型则完全失败。这一研究引起了广泛关注,但OpenAI已要求不要公开相关提示词。实验中,研究人员使用了91行代码构建智能体,其通过LangChain的ReAct框架模拟攻击,如双花攻击,并考虑了并发攻击和响应策略。尽管GPT-4在某些特定场景下未能成功,如Iris XSS和Hertzbeat RCE,但总体表现突出...
开源模型打败GPT-4!LLM竞技场最新战报,Cohere Command R+上线
在AI领域,开源模型Cohere的Command R+近期在LLM竞技场中击败了GPT-4,引发了广泛关注。这款模型在4月11日的排行榜上超越了早期版本的GPT-4,与GPT-4-0314并列第7,成为首个在性能上胜过GPT-4的开源模型。尽管OpenAI迅速推出了GPT-4-Turbo-2024-04-09版本夺回榜首,但Command R+的开源特性仍为开源社区带来了荣耀。Cohere的机器学习总监Nils Reimers指出,Command R+的真正实力在于RAG和工具使用,而这在竞技场中并未完全展现。 Command R+不仅在性能上优于竞争对手,而且价格更低。Cohere已与多家大企业合作,将LLM部署到A...
看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3
AI初创公司Reka近期推出了创新的多模态语言模型Reka Core,该模型展现出理解图像、音频和视频等多元数据的卓越能力,成为继谷歌Gemini Ultra之后的又一瞩目之作。Reka Core在性能上与GPT-4相当,证明了其研发团队的努力成果。这款模型是通过数千台H100设备训练得出,支持32种语言和大量词汇上下文,尤其擅长处理长篇文档。Reka Core不仅在视频感知测试中超越Gemini Ultra,在图像任务的MMMU基准测试中也有出色表现,与行业领先模型相媲美。尽管训练时间较短,但其性能已超越许多顶级AI模型。值得注意的是,Reka Core具备强大...
AI日报:PR重大更新!Sora加入Adobe全家桶;文心大模型4.0工具版发布;世界首届AI选美大赛开始;GPT-4整顿学术圈
在这个快速发展的AI时代,每天都有新变化。今天,让我们一起探索一下人工智能领域的最新动态。首先,Adobe Premiere Pro引领了一场视频编辑革命,引入AI工具Firefly,让编辑工作变得前所未有的简单高效。用户现在可以享受到对象添加、移除等创新功能,大大提升了创作自由度。 另一边,百度Create AI开发者大会释放了三大重要信号:文心大模型4.0的发布、智能计算操作系统万源的推出,以及AgentBuilder、AppBuilder、ModelBuilder工具的诞生,降低了开发门槛。同时,GPT-4Turbo在Chatbot Arena中脱颖而出,重新证明了其作为...
GPT-4推理能力为0?开发者悬赏1万美金被打脸,神秘提示正确率直冲100%
本文讲述了关于人工智能模型GPT-4和Claude3在解决一个看似简单的脑筋急转弯推理题上的表现。一位开发者质疑GPT模型在训练集之外缺乏推理能力,认为它们无法实现人工智能(AGI),并悬赏1万美元发起挑战。然而,很快就有网友通过巧妙的提示让GPT-4和Claude3成功解决了这个问题,证明了模型的潜力。开发者Taelin承认了自己的错误,并支付了奖金。文章还讨论了模型的局限性,如无法进行长期逻辑推理,以及提示的重要性。尽管如此,人们还是对GPT模型的性能表示了赞赏,认为它们在很多领域已经展现出强大的应用价值。