Sahara AI 与微软联合推出 AI 推理评测基准 MATHVISTA

okx 3月18日消息,人工智能公司 Sahara AI 宣布与微软合作,为微软提供高精度标注数据,共同推出开源基准 MATHVISTA。该基准专为测试 GPT-4V、Claude、Gemini 等模型在真实场景下的推理与决策能力,目前历史下载量已超 27 万次。这类高质量标注数据正是 AI Agent 能有可靠推理与决策能力的基础,直接影响数百万用户每日使用的agent表现。目前微软、亚马逊、Snap 及麻省理工学院(MIT)等机构均已采用 Sahara AI 的数据服务与 Agentic AI 解决方案。