Findy Tools
開発ツールのレビューサイト
検索結果がありません

LM Evaluation Harnessとは?機能や特徴・製品の概要まとめ

LM Evaluation Harness

LM Evaluation Harness

EleutherAI

プロダクト情報
アーキテクチャ
0
LM Evaluation Harness
LM Evaluation Harness
EleutherAI
LM Evaluation Harness
プロダクト情報
アーキテクチャ
0

LM Evaluation Harnessのプロダクト概要

LM Evaluation Harnessとは

数十以上の学術ベンチマークに対応する、生成系言語モデルの性能評価向けオープンソースフレームワーク。Transformers、GPT-NeoX、API モデルなど多様な環境に対応。

利用企業数非公開日本語サポートなし無料トライアルなし
カスタマーサクセスなし公式ドキュメントあり

LM Evaluation Harnessの特徴

1. ベンチマーク評価

多数の標準的な学術ベンチマークに対応し、モデルの性能を包括的に評価。様々なタスクや言語での評価が可能。

2. モデル互換性

Hugging Face Transformers、GPT-NeoX、OpenAI APIなど、多様なモデルフォーマットやAPIに対応。統一的なインターフェースで評価可能。

3. カスタマイズ性

新しいタスクやメトリクスの追加が容易で、特定のユースケースに合わせた評価が可能。分散評価にも対応。