FlagEval

模型评测平台

提供大语言模型和多模态模型的评测服务
支持开源和闭源模型的评测
提供专项评测，如K12学科测验和金融量化交易评测
累计查看人数和模型总数的统计
模型参数规模的分类评测
主观评测和客观评测两种评测方式
提供模型的详细信息，包括名称、版本、总分等

产品详情

FlagEval是一个模型评测平台，专注于大语言模型和多模态模型的评测。它提供了一个公正、透明的环境，让不同的模型在同一标准下进行比较，帮助研究者和开发者了解模型性能，推动人工智能技术的发展。该平台涵盖了对话模型、视觉语言模型等多种模型类型，支持开源和闭源模型的评测，并提供专项评测如K12学科测验和金融量化交易评测。

FlagEval

产品详情

相关项目

Kipps.AI

CrossPrism for MacOS

ZETIC.ai

Kerqu.Ai