.agents/skills/goal-research-loop/SKILL.md
Use this skill when the user explicitly wants a goal-directed research loop that keeps proposing, testing, logging, and refining ideas toward a stated objective across repeated iterations or autonomous runs. Do not use it for one-shot summaries or when no evaluation signal can be defined.
npx skillsauth add oozoofrog/codex-skills-project goal-research-loopInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
특정 목적이 주어졌을 때 반복 실험·검증·기록을 통해 계속 개선하는 연구 루프를 설계하고 운영합니다.
ralph-loopgpt-researchmode와 execution substrate를 같은 축으로 취급하지 않습니다. mode는 design / guided-loop / autonomous-loop, execution substrate는 agent-first / script-first입니다.scripts/goal-research-loop.sh 또는 scripts/codex_goal_research_loop.py를 우선 사용합니다.~/.codex/skills/goal-research-loop/scripts/... 경로를 우선 안내합니다.autonomous-loop는 사용자 opt-in, bounded surface, 명확한 stop rule이 모두 있을 때만 사용합니다.design → agent-first, autonomous-loop → script-first, guided-loop → contract 완성도와 반복 실행 필요성에 따라 선택입니다.refine 대신 pivot, rescope, escalate를 우선 검토합니다.autonomous-loop에서는 baseline / best-known state / active hypothesis / next candidates를 담은 state snapshot을 유지합니다.design — 루프 계약과 평가식을 설계만 한다guided-loop — 각 라운드 결과를 공유하며 연구를 진행한다autonomous-loop — 중간 확인 없이 정해진 stop condition까지 계속 진행한다references/fit-and-mode-routing.md를 먼저 봅니다.references/fit-and-mode-routing.mdreferences/agent-vs-script-routing.mdreferences/loop-contract.mdreferences/decision-layers-and-status-mapping.mdreferences/iteration-heuristics.mdreferences/proxy-metric-patterns.mdreferences/result-ledger-template.mdreferences/state-snapshot-and-handoff.mdreferences/worked-example-skill-improvement.mdreferences/codex-cli-runner.mdscripts/codex_goal_research_loop.pyscripts/goal-research-loop.shtemplates/program.mdtemplates/contract.mdtemplates/state_snapshot.mdtemplates/ledger.tsvschemas/round-result.schema.jsonfit-and-mode-routing.md와 agent-vs-script-routing.md로 이 스킬이 맞는지, mode, execution substrate를 먼저 고릅니다.loop-contract.md 템플릿으로 계약을 쓰고 baseline을 확보합니다.decision-layers-and-status-mapping.md로 gate / experiment status / control action 층위를 먼저 맞춥니다.proxy-metric-patterns.md로 rubric을 먼저 고릅니다.state-snapshot-and-handoff.md 템플릿으로 best-known state와 다음 후보를 먼저 잡습니다.worked-example-skill-improvement.md로 contract → ledger → snapshot 연결 예시를 한번 봅니다.result-ledger-template.md 형식으로 기록합니다.karpathy/autoresearch의 program.md + results.tsv + keep/discard loop 패턴을
goal-research-loop 규칙에 맞게 옮긴 host-managed runner가 포함되어 있습니다.
~/.codex/skills/goal-research-loop/scripts/goal-research-loop.sh init /path/to/workspace "한 문장 objective"
~/.codex/skills/goal-research-loop/scripts/goal-research-loop.sh run /path/to/workspace --max-rounds 3 --search --full-auto
python3 ~/.codex/skills/goal-research-loop/scripts/codex_goal_research_loop.py \
init \
--workspace /path/to/workspace \
--objective "한 문장 objective"
python3 ~/.codex/skills/goal-research-loop/scripts/codex_goal_research_loop.py \
reconcile \
--workspace /path/to/workspace
~/.codex/skills/goal-research-loop/scripts/goal-research-loop.sh \
resume \
/path/to/workspace \
--max-rounds 3 \
--search \
--full-auto
python3 ~/.codex/skills/goal-research-loop/scripts/codex_goal_research_loop.py \
run \
--workspace /path/to/workspace \
--max-rounds 3 \
--search \
--full-auto
세부 동작은 references/codex-cli-runner.md를 참고하세요.
이 스킬은 mode와 별도로 execution substrate를 고릅니다.
기본값:
design → agent-firstguided-loop → 둘 다 가능. contract 완성도와 반복 실행 필요성으로 고릅니다.autonomous-loop → script-first아래면 agent-first로 시작합니다.
아래면 script-first로 운영합니다.
program / contract / snapshot / ledger를 유지해야 할 때권장 우선순위:
design 또는 bounded guided-loopgoal-research-loop.sh initgoal-research-loop.sh statusgoal-research-loop.sh run --max-rounds Ncodex_goal_research_loop.py run --loop-forever반대로 아래는 수동 설계만 먼저 해도 됩니다.
design부터 해야 할 때mode: design / guided-loop / autonomous-loopexecution substrate: agent-first / script-firstdesign + agent-first 또는 guided-loop + agent-first에서 시작하고, contract가 실행 가능해진 뒤 script-first로 넘길지 판단합니다.loop-contract.md 템플릿으로 hard gates, primary metric, tie-breaker, budget, stop condition, execution substrate를 명시합니다.goal-research-loop.sh init으로 템플릿 파일을 먼저 생성하는 편을 우선 검토합니다.goal-research-loop.sh run으로 round artifacts를 남기며 진행하는 편을 우선합니다.refine 대신 pivot, rescope, escalate를 우선 검토합니다.result-ledger-template.md 형식으로 남깁니다.pass/fail, experiment status는 keep/discard/crash, control action은 pass/refine/pivot/rescope/escalate/stop으로 분리합니다.장기 루프일수록 “무엇을 했는가”보다 다음 세션이 바로 이어받을 수 있는 상태 표현이 더 중요합니다.
../../../docs/review-harness.mdpass면 best state 요약 후 종료, refine이면 같은 계약으로 다음 가설 실행, pivot이면 접근 전략 변경, rescope면 계약 재작성, escalate면 사람 또는 별도 evaluator로 넘기고 block 이유를 남긴다, stop이면 남은 리스크와 다음 후보만 남기고 종료한다agent-first | script-first) 와 그 이유tools
Codex 플러그인/스킬 저장소를 감사하고 개선합니다. `.codex-plugin/plugin.json`, `.agents/plugins/marketplace.json`, `.agents/skills`, `.codex/agents`, legacy Claude 산출물을 점검할 때 사용합니다.
tools
macOS 앱/CLI 릴리스 작업을 자동화하거나 가이드합니다. 버전 범프, Release 빌드, DMG/ZIP, GitHub Release, Homebrew 배포가 필요할 때 사용합니다.
development
Karpathy의 LLM Wiki 아이디어를 바탕으로 raw source와 LLM-maintained wiki를 분리한 지속형 지식 베이스를 설계·부트스트랩합니다. markdown/git 기반의 범용 구조, `AGENTS.md` 운영 규칙, ingest/query/lint 워크플로우, Obsidian 같은 선택적 어댑터 분리가 필요할 때 사용합니다.
tools
별도 Codex CLI 실행을 위임합니다. 사용자가 명시적으로 다른 Codex 인스턴스 실행, 세컨드 오피니언, 격리된 full-auto 실행을 원할 때만 사용합니다.