标签:基准测试

【微软推出Windows Agent Arena基准测试框架,评估AI代理在主流Windows应用中的卓越性能与运行效率】

IT之家于9月15日报道,据科技媒体NeoWin的消息,微软官方正式推出了全新的“Windows Agent Arena”基准测试框架,旨在评估生成式AI代理在Windows个人电脑上的性能表现。 据微软介绍,“Windows Agent Arena”基准测试框架主要关注AI代理在使用主流Windows应用程序时的能力与速度,涵盖的应用范围广泛,包括Microsoft Edge和Google Chrome浏览器、Visual Studio Code等开发工具,以及预装的Windows应用程序如记事本、时钟和画图等。此外,该框架还支持对VLC等流行媒体播放器进行测试。 微软在其官方博文中提到,他们基于OSWorld...