skills/mixseek-evaluator-config/SKILL.md
MixSeekの評価設定ファイル(evaluator.toml、judgment.toml)を生成します。「評価設定を作成」「スコアリング設定」「判定設定を作って」「メトリクスを設定」といった依頼で使用してください。Submissionの評価基準と最終判定ロジックを定義します。
npx skillsauth add drillan/mixseek-plus mixseek-evaluator-configInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
MixSeek-Coreの評価設定ファイル(evaluator.toml)と判定設定ファイル(judgment.toml)を生成します。TUMIXトーナメントにおけるSubmissionの評価基準、スコアリング方法、最終判定ロジックを定義します。
mixseek-workspace-init参照)MIXSEEK_WORKSPACE が設定されていること(推奨)| ファイル | 用途 | 配置場所 |
|---------|------|---------|
| evaluator.toml | Submissionのスコアリング設定 | configs/evaluators/ |
| judgment.toml | 最終判定の設定 | configs/judgment/ |
ユーザーに以下を確認してください:
標準メトリクスから選択:
| メトリクス | 説明 | 用途 |
|-----------|------|------|
| ClarityCoherence | 明確性と一貫性 | 読みやすさ重視のタスク |
| Coverage | カバレッジ | 網羅性重視のタスク |
| LLMPlain | 汎用LLM評価 | カスタム評価基準が必要なタスク |
| Relevance | 関連性 | 的確さ重視のタスク |
evaluator.toml:
default_model = "google-gla:gemini-2.5-pro"
temperature = 0.0
[[metrics]]
name = "ClarityCoherence"
weight = 0.34
[[metrics]]
name = "Coverage"
weight = 0.33
[[metrics]]
name = "Relevance"
weight = 0.33
judgment.toml:
model = "google-gla:gemini-2.5-pro"
temperature = 0.0
timeout_seconds = 60
$MIXSEEK_WORKSPACE/configs/evaluators/evaluator.toml
$MIXSEEK_WORKSPACE/configs/judgment/judgment.toml
重要: カスタムパス(configs/evaluators/やconfigs/judgment/)を使用する場合は、必ずorchestrator.tomlでパスを明示的に指定してください。指定しないとデフォルトパス(configs/evaluator.toml、configs/judgment.toml)が検索され、設定が反映されません。
# orchestrator.toml
[orchestrator]
evaluator_config = "configs/evaluators/evaluator.toml"
judgment_config = "configs/judgment/judgment.toml"
生成後は必ず検証を実行してください。
# Evaluator設定の検証
uv run python skills/mixseek-config-validate/scripts/validate-config.py \
$MIXSEEK_WORKSPACE/configs/evaluators/evaluator.toml --type evaluator
# Judgment設定の検証
uv run python skills/mixseek-config-validate/scripts/validate-config.py \
$MIXSEEK_WORKSPACE/configs/judgment/judgment.toml --type judgment
検証が成功したら、ユーザーに結果を報告します。失敗した場合は、エラー内容を確認して設定を修正してください。
回答の読みやすさと論理的一貫性を評価します。
評価観点:
推奨用途:
質問に対する回答の網羅性を評価します。
評価観点:
推奨用途:
回答が質問に対してどれだけ的確かを評価します。
評価観点:
推奨用途:
system_instructionで定義したカスタム評価基準に基づいてLLMが評価します。
特徴:
system_instructionで完全にカスタマイズ可能推奨用途:
設定例:
[[metrics]]
name = "LLMPlain"
weight = 0.5
system_instruction = """
セキュリティ観点から回答を評価してください:
1. 機密情報の漏洩リスク
2. 安全なコーディング実践
3. 脆弱性の有無
0-100のスコアで評価してください。
"""
User: 評価設定を作成して
Agent: 評価設定を提案します。
メトリクス(均等重み付け):
- ClarityCoherence: 33.4%
- Coverage: 33.3%
- Relevance: 33.3%
この構成でよろしいですか?
User: はい
Agent: 設定ファイルを生成しました:
✓ configs/evaluators/evaluator.toml
✓ configs/judgment/judgment.toml
User: 正確性を重視した評価設定を作って
Agent: 関連性(Relevance)を重視した設定を提案します。
メトリクス:
- Relevance: 50%(重視)
- ClarityCoherence: 30%
- Coverage: 20%
この構成でよろしいですか?
User: はい
evaluator.toml(カスタム重み付け):
# MixSeek Evaluator Configuration
# Generated by mixseek-evaluator-config skill
default_model = "google-gla:gemini-2.5-pro"
temperature = 0.0
timeout_seconds = 300
max_retries = 3
[[metrics]]
name = "Relevance"
weight = 0.5
[[metrics]]
name = "ClarityCoherence"
weight = 0.3
[[metrics]]
name = "Coverage"
weight = 0.2
judgment.toml:
# MixSeek Judgment Configuration
# Generated by mixseek-evaluator-config skill
model = "google-gla:gemini-2.5-pro"
temperature = 0.0
timeout_seconds = 60
max_retries = 3
重み付けには以下のルールがあります:
# 有効: 全て指定
[[metrics]]
name = "ClarityCoherence"
weight = 0.5
[[metrics]]
name = "Coverage"
weight = 0.5
# 有効: 全て省略(均等配分)
[[metrics]]
name = "ClarityCoherence"
[[metrics]]
name = "Coverage"
# 無効: 一部のみ指定
[[metrics]]
name = "ClarityCoherence"
weight = 0.5 # ❌
[[metrics]]
name = "Coverage"
# weight省略 ❌
Error: Weights must sum to 1.0
解決方法:
Error: Unknown metric name
解決方法:
ClarityCoherence, Coverage, LLMPlain, Relevance解決方法:
judgment.tomlのtemperatureを0.0に設定(決定論的)seedを固定値に設定references/TOML-SCHEMA.mdreferences/METRICS.mdskills/mixseek-orchestrator-config/tools
MixSeekワークスペースを初期化し、設定ファイル用ディレクトリ構造を作成します。「ワークスペースを初期化」「mixseekのセットアップ」「設定ディレクトリを作成」「新しいプロジェクトを始める」といった依頼で使用してください。
development
MixSeekのチーム設定ファイル(team.toml)を生成します。「チームを作成」「エージェント設定を生成」「Web検索チームを作って」「分析チームを設定」といった依頼で使用してください。Leader AgentとMember Agentの構成を定義します。
development
MixSeekのプロンプトビルダー設定ファイル(prompt_builder.toml)を生成します。「プロンプトを設定」「プロンプトビルダーを作成」「ラウンド別プロンプト」といった依頼で使用してください。
data-ai
MixSeekのオーケストレーター設定ファイル(orchestrator.toml)を生成します。「オーケストレーターを設定」「チーム競合設定」「複数チームで競わせる」「マルチチーム実行設定」といった依頼で使用してください。複数チームを並列実行して最良の結果を選択する設定を定義します。