Adoption

Agent Skills are supported by leading AI development tools.

VS Code Gemini CLI GitHub Goose Amp Cursor Claude Code Letta OpenCode Claude OpenAI Codex Factory VS Code Gemini CLI GitHub Goose Amp Cursor Claude Code Letta OpenCode Claude OpenAI Codex Factory

lidge-jun/context-compression

Name: context-compression
Author: lidge-jun

context-compression/SKILL.md

npx skillsauth add lidge-jun/cli-jaw-skills context-compression

Clean

TrivyContainer and dependency vulnerability scanner

Clean

SemgrepStatic code analysis for vulnerabilities

Clean

mcp-scan (Snyk)Model Context Protocol security validation

Skipped

Snyk (dep)Open source security scanning

Skipped

Socket.devSupply chain security analysis

Skipped

VirusTotalMulti-engine malware detection

Skipped

CrowdStrikeAdvanced threat intelligence

Skipped

OSV-ScannerOpen Source Vulnerability database check

Skipped

OWASP Dep-Check

Context Compression Strategies

When agent sessions generate millions of tokens of conversation history, compression becomes mandatory. Optimize for tokens per task (total tokens to complete a task, including re-fetching costs), not tokens per request.

When to Activate

Agent sessions exceeding context window limits
Codebases exceeding context windows (5M+ token systems)
Designing conversation summarization strategies
Debugging cases where agents "forget" modified files

Three Approaches

Anchored Iterative Summarization: Maintain structured, persistent summaries with explicit sections for session intent, file modifications, decisions, and next steps. On compression, summarize only the newly-truncated span and merge with existing summary. Structure forces preservation by dedicating sections to specific information types.
Opaque Compression: Produce compressed representations optimized for reconstruction fidelity. Achieves highest compression ratios (99%+) but sacrifices interpretability.
Regenerative Full Summary: Generate detailed structured summaries on each compression. Readable output but may lose details across repeated cycles due to full regeneration rather than incremental merging.

Key insight: structure forces preservation. Dedicated sections act as checklists the summarizer must populate.

The Artifact Trail Problem

Artifact trail integrity is the weakest dimension across all compression methods (2.2–2.5/5.0). Coding agents need to track:

Which files were created or modified and what changed
Which files were read but not changed
Function names, variable names, error messages

This likely requires specialized handling beyond general summarization: a separate artifact index or explicit file-state tracking.

Structured Summary Template

## Session Intent
[What the user is trying to accomplish]

## Files Modified
- auth.controller.ts: Fixed JWT token generation
- config/redis.ts: Updated connection pooling

## Decisions Made
- Using Redis connection pool instead of per-request connections

## Current State
- 14 tests passing, 2 failing

## Next Steps
1. Fix remaining test failures
2. Run full test suite

Compression Trigger Strategies

| Strategy | Trigger Point | Trade-off | |----------|---------------|-----------| | Fixed threshold | 70–80% context utilization | Simple but may compress too early | | Sliding window | Keep last N turns + summary | Predictable context size | | Importance-based | Compress low-relevance sections first | Complex but preserves signal | | Task-boundary | Compress at logical task completions | Clean summaries but unpredictable timing |

Sliding window with structured summaries provides the best balance for most coding agent use cases.

Probe-Based Evaluation

Traditional metrics (ROUGE, embedding similarity) fail to capture functional quality. Use probe questions after compression:

| Probe Type | What It Tests | Example | |------------|---------------|---------| | Recall | Factual retention | "What was the original error message?" | | Artifact | File tracking | "Which files have we modified?" | | Continuation | Task planning | "What should we do next?" | | Decision | Reasoning chain | "What did we decide about the Redis issue?" |

Six Evaluation Dimensions

Accuracy: Technical details correct? File paths, function names, error codes
Context Awareness: Response reflects current conversation state?
Artifact Trail: Agent knows which files were read or modified?
Completeness: Response addresses all parts of the question?
Continuity: Work can continue without re-fetching information?
Instruction Following: Response respects stated constraints?

Three-Phase Compression Workflow

For large codebases or agent systems exceeding context windows:

Research Phase: Produce a research document from architecture diagrams, docs, and key interfaces. Output: single structured analysis.
Planning Phase: Convert research into implementation spec with function signatures, type definitions, and data flow. A 5M token codebase compresses to ~2,000 words.
Implementation Phase: Execute against the spec rather than raw codebase exploration.

Implementing Anchored Iterative Summarization

Define explicit summary sections matching your agent's needs
On first compression, summarize truncated history into sections
On subsequent compressions, summarize only new truncated content
Merge into existing sections rather than regenerating
Track which information came from which compression cycle

When to Use Each Approach

| Approach | Best when | |----------|-----------| | Anchored iterative | Long sessions (100+ messages), file tracking matters, need verifiability | | Opaque | Maximum token savings needed, short sessions, low re-fetching costs | | Regenerative | Summary interpretability critical, clear phase boundaries |

Compression Ratios

| Method | Compression | Quality (5.0) | Notes | |--------|-------------|---------------|-------| | Anchored Iterative | 98.6% | 3.70 | Best quality | | Regenerative | 98.7% | 3.44 | Good quality | | Opaque | 99.3% | 3.35 | Best compression, quality loss |

The 0.7% additional tokens retained by structured summarization buys 0.35 quality points — worthwhile when re-fetching costs matter.

Guidelines

Optimize for tokens-per-task, not tokens-per-request
Use structured summaries with explicit file tracking sections
Trigger compression at 70–80% context utilization
Use incremental merging rather than full regeneration
Test compression quality with probe-based evaluation
Track artifact trail separately when file tracking is critical

References

Evaluation Framework Reference — probe types and scoring rubrics
Related skills: context-degradation, context-optimization, evaluation, memory-systems
Factory Research: Evaluating Context Compression for AI Agents (December 2025)
Netflix Engineering: "The Infinite Software Crisis" — three-phase workflow (AI Summit 2025)

lidge-jun/context-compression

context-compression/SKILL.md

This skill should be used when the user asks to "compress context", "summarize conversation history", "implement compaction", "reduce token usage", or mentions context compression, structured summarization, tokens-per-task optimization, or long-running agent sessions exceeding context limits.

3 stars

data-ai

Updated Apr 18, 2026

$ install --global

skillsauth

npx skillsauth add lidge-jun/cli-jaw-skills context-compression

Install this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.

Security Scan Results

3 of 9 scanners reported clean

Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.

Scanners Passed

Scanners in report

Clean

TrivyContainer and dependency vulnerability scanner

95%

Clean

SemgrepStatic code analysis for vulnerabilities

95%

Clean

mcp-scan (Snyk)Model Context Protocol security validation

95%

Skipped

Snyk (dep)Open source security scanning

50%

Skipped

Socket.devSupply chain security analysis

50%

Skipped

VirusTotalMulti-engine malware detection

50%

Skipped

CrowdStrikeAdvanced threat intelligence

50%

Skipped

OSV-ScannerOpen Source Vulnerability database check

50%

Skipped

OWASP Dep-Check

50%

Last scanned: Apr 24, 2026, 9:04 PM1.9s1 file scanned

SKILL.md

name:: context-compression
description:: This skill should be used when the user asks to "compress context", "summarize conversation history", "implement compaction", "reduce token usage", or mentions context compression, structured summarization, tokens-per-task optimization, or long-running agent sessions exceeding context limits.

Context Compression Strategies

When to Activate

Agent sessions exceeding context window limits
Codebases exceeding context windows (5M+ token systems)
Designing conversation summarization strategies
Debugging cases where agents "forget" modified files

Three Approaches

Anchored Iterative Summarization: Maintain structured, persistent summaries with explicit sections for session intent, file modifications, decisions, and next steps. On compression, summarize only the newly-truncated span and merge with existing summary. Structure forces preservation by dedicating sections to specific information types.
Opaque Compression: Produce compressed representations optimized for reconstruction fidelity. Achieves highest compression ratios (99%+) but sacrifices interpretability.
Regenerative Full Summary: Generate detailed structured summaries on each compression. Readable output but may lose details across repeated cycles due to full regeneration rather than incremental merging.

Key insight: structure forces preservation. Dedicated sections act as checklists the summarizer must populate.

The Artifact Trail Problem

Artifact trail integrity is the weakest dimension across all compression methods (2.2–2.5/5.0). Coding agents need to track:

Which files were created or modified and what changed
Which files were read but not changed
Function names, variable names, error messages

This likely requires specialized handling beyond general summarization: a separate artifact index or explicit file-state tracking.

Structured Summary Template

## Session Intent
[What the user is trying to accomplish]

## Files Modified
- auth.controller.ts: Fixed JWT token generation
- config/redis.ts: Updated connection pooling

## Decisions Made
- Using Redis connection pool instead of per-request connections

## Current State
- 14 tests passing, 2 failing

## Next Steps
1. Fix remaining test failures
2. Run full test suite

Compression Trigger Strategies

Sliding window with structured summaries provides the best balance for most coding agent use cases.

Probe-Based Evaluation

Traditional metrics (ROUGE, embedding similarity) fail to capture functional quality. Use probe questions after compression:

Six Evaluation Dimensions

Accuracy: Technical details correct? File paths, function names, error codes
Context Awareness: Response reflects current conversation state?
Artifact Trail: Agent knows which files were read or modified?
Completeness: Response addresses all parts of the question?
Continuity: Work can continue without re-fetching information?
Instruction Following: Response respects stated constraints?

Three-Phase Compression Workflow

For large codebases or agent systems exceeding context windows:

Research Phase: Produce a research document from architecture diagrams, docs, and key interfaces. Output: single structured analysis.
Planning Phase: Convert research into implementation spec with function signatures, type definitions, and data flow. A 5M token codebase compresses to ~2,000 words.
Implementation Phase: Execute against the spec rather than raw codebase exploration.

Implementing Anchored Iterative Summarization

Define explicit summary sections matching your agent's needs
On first compression, summarize truncated history into sections
On subsequent compressions, summarize only new truncated content
Merge into existing sections rather than regenerating
Track which information came from which compression cycle

When to Use Each Approach

Compression Ratios

The 0.7% additional tokens retained by structured summarization buys 0.35 quality points — worthwhile when re-fetching costs matter.

Guidelines

Optimize for tokens-per-task, not tokens-per-request
Use structured summaries with explicit file tracking sections
Trigger compression at 70–80% context utilization
Use incremental merging rather than full regeneration
Test compression quality with probe-based evaluation
Track artifact trail separately when file tracking is critical

References

Evaluation Framework Reference — probe types and scoring rubrics
Related skills: context-degradation, context-optimization, evaluation, memory-systems
Factory Research: Evaluating Context Compression for AI Agents (December 2025)
Netflix Engineering: "The Infinite Software Crisis" — three-phase workflow (AI Summit 2025)

Related Skills

lidge-jun/codex-imagegen

tools

VerifiedTrustedCommunity

Use only on the Codex CLI for native image generation or image editing without an API key. Save final PNG files under ~/.cli-jaw/uploads, report web-ready absolute-path markdown, and send to Telegram or Discord only when explicitly requested.

5SKILL.mdUpdated Jul 10, 2026

lidge-jun/codex-imagegen

lidge-jun/repo-map

tools

VerifiedTrustedCommunity

Ranked repository structure map via `cli-jaw map`. Use for codebase overview, structure map, symbol overview, unfamiliar codebase exploration, architecture orientation. Triggers: repo map, structure map, codebase overview, 와꾸, project structure, unfamiliar code.

5SKILL.mdUpdated Jul 7, 2026

lidge-jun/design

tools

VerifiedTrustedCommunity

cli-jaw Design workspace: create, preview, run, and export design pages from the right sidebar. Covers panel UX, direct-write workflow, artifact lifecycle, wireframe generation, design system, and Open Design adapter.

5SKILL.mdUpdated Jul 5, 2026

lidge-jun/dev-devops

development

VerifiedTrustedCommunity

MUST USE for infrastructure and delivery work — container builds, deploy pipelines, Kubernetes, Infrastructure as Code, SRE foundations, edge/serverless, ML infrastructure. Triggers: Dockerfile, K8s manifests, CI/CD pipeline, Terraform/IaC, release/deploy, devops/infra/deploy or release_cd task_tags.

5SKILL.mdUpdated Jun 19, 2026

Download

For Claude Desktop. Download once, then upload the file in the app — no terminal needed.

Need help? View full Cowork setup guide →

Install manually

Choose your platform

# Clone the repo
git clone https://github.com/lidge-jun/cli-jaw-skills.git

# Copy into Claude Code skills folder (global)
cp -r cli-jaw-skills/context-compression ~/.claude/skills/

Claude Code Skills — official skills path docs.

Repository

lidge-jun/cli-jaw-skills

3 stars

Compatible with

Claude Code

OpenAI Codex CLI

ChatGPT