微软发布Windows Agent Arena基准框架

发布日期:2024-09-16 22:48    点击次数:103

微软发布Windows Agent Arena基准框架

IT之家 9 月 15 日音讯,科技媒体 NeoWin 昨日(9 月 14 日)发布博文,报谈称微软官方推出了 Windows Agent Arena 基准框架,用于评估生成式 AI Agents 在 Windows PC 上的性能。

Windows Agent Arena 基准框架

微软暗意该基准框架 AI Agents 使用主流 Windows 诓骗方面的智商和速率,其中包括 Microsoft Edge 和谷歌 Chrome 浏览器,Visual Studio Code 等编程诓骗,记事本、时钟和绘画等预装 Windows 诓骗,VLC 等主流媒体播放器。

IT之家翻译部分微软官方博文本体如下:

咱们领受 OSWorld 框架,构建了横跨代表性领域的 150 多项各样化 Windows 任务,这些任务条目代理具备野心、屏幕看法和器具使用的智商。

咱们的基准测试相似具有可延伸性,大略在 Azure 上无缝并行化,从而在最短 20 分钟内完周详面评估。

Navi

微软议论院也打造了我方的多模态 Agents Navi,并在 Windows Agent Arena 基准测试中对其进行了检修。

它被条目字据特定文本教唆推论任务,举例:“你能将我正在浏览的网页诊治成 PDF 文献并甩掉在我的主屏幕上吗,便是阿谁桌面?”效用败露,Navi 的平均任务得手率为 19.5%,相较于东谈主类 74.5% 的弘扬评分,这一获利仍显偏低。





Powered by 来宾透幌集团 @2013-2022 RSS地图 HTML地图

Copyright 站群系统 © 2013-2022 本站首页 版权所有