标签:Microsoft

【微软推出Windows Agent Arena基准测试框架,评估AI代理在主流Windows应用中的卓越性能与运行效率】

IT之家于9月15日报道,据科技媒体NeoWin的消息,微软官方正式推出了全新的“Windows Agent Arena”基准测试框架,旨在评估生成式AI代理在Windows个人电脑上的性能表现。 据微软介绍,“Windows Agent Arena”基准测试框架主要关注AI代理在使用主流Windows应用程序时的能力与速度,涵盖的应用范围广泛,包括Microsoft Edge和Google Chrome浏览器、Visual Studio Code等开发工具,以及预装的Windows应用程序如记事本、时钟和画图等。此外,该框架还支持对VLC等流行媒体播放器进行测试。 微软在其官方博文中提到,他们基于OSWorld...

为OpenAI解释一切的人离开了OpenAI

OpenAI的未来之路:离开与开源之争 OpenAI的开发者关系负责人洛根·基尔帕特里克的离职引发关注,他在X上暗示对OpenAI的开源立场有所不满。此前,OpenAI内部的Allie K. Miller也已离开。洛根的离职被视作OpenAI日益封闭的一个信号,他的离职动态提到开源AI对所有人的重要性,引发外界猜测其离职原因可能与此相关。马斯克近期起诉OpenAI,指控其违背开源使命,成为微软的闭源子公司。与此同时,微软投资的Mistral AI转向闭源,加剧了开源与闭源的讨论。 洛根在开源领域有着深厚的背景,曾任Julia语言首席开发者,并积极推动...

下一个OpenAI来了?Mistral超大杯模型直逼GPT-4,93年创始人6人公司被微软认领

Mistral AI,被誉为“下一个OpenAI”,发布了其旗舰模型Mistral Large,该模型在多语言任务处理上表现出色,直逼GPT-4。尽管未开源,Mistral已引起广泛关注,特别是微软已将其纳入麾下。由年轻创始人Arthur Mensch领导的团队,仅用4周时间、6人阵容、7页PPT便筹集到8亿欧元资金,打造了这家与OpenAI和Anthropic抗衡的公司。Mistral Large擅长逻辑推理,能处理多种语言,包括代码生成,且在多个基准测试中超越 Anthropic的Claude2和谷歌的Gemini Pro。 近期,Mistral修改网站内容引发开源社区担忧,但CEO确认将继续秉持开源理...