Langfuse

LLM アプリケーション向けのオープンソース observability プラットフォーム。トレース・評価・データセット管理を提供する。

  • トレース取り込み: opentelemetry-observability (OTel) 経由の取り込みをサポート(2026/2 対応)。OpenAI Agents SDK の独自トレースとの連携も可能。
  • Datasets: 入力と期待する出力の集合を保持し、これを使ってプロンプト/モデルの性能評価を行う。

llm-observability の中心ツールの一つ。プロンプト評価に特化した promptfoo と役割が補完的。

関連