Adoption

Agent Skills are supported by leading AI development tools.

VS Code Gemini CLI GitHub Goose Amp Cursor Claude Code Letta OpenCode Claude OpenAI Codex Factory VS Code Gemini CLI GitHub Goose Amp Cursor Claude Code Letta OpenCode Claude OpenAI Codex Factory

curiositech/dbt-analytics-engineer

Name: dbt-analytics-engineer
Author: curiositech

skills/dbt-analytics-engineer/SKILL.md

npx skillsauth add curiositech/windags-skills dbt-analytics-engineer

Clean

TrivyContainer and dependency vulnerability scanner

Clean

SemgrepStatic code analysis for vulnerabilities

Clean

mcp-scan (Snyk)Model Context Protocol security validation

Skipped

Snyk (dep)Open source security scanning

Skipped

Socket.devSupply chain security analysis

Skipped

VirusTotalMulti-engine malware detection

Skipped

CrowdStrikeAdvanced threat intelligence

Skipped

OSV-ScannerOpen Source Vulnerability database check

Skipped

OWASP Dep-Check

dbt Analytics Engineer

Build, test, and document data transformations using dbt Core/Cloud with modern analytics engineering practices.

Decision Points

Materialization Selection Strategy

Model Size & Query Pattern → Materialization Choice

├── < 1M rows, rarely queried
│   └── VIEW (ephemeral if only intermediate)
├── 1M-10M rows, daily queries
│   └── TABLE (full refresh nightly)
├── > 10M rows, frequent queries
│   ├── Append-only data → INCREMENTAL (append strategy)
│   ├── Updates/deletes → INCREMENTAL (merge strategy)
│   └── Complex joins/aggregations → TABLE with incremental source prep
└── Dev/staging environment
    └── Always VIEW (cost optimization)

Model Layer Assignment

Data Characteristics → Layer Placement

├── Raw source mapping (1:1)
│   └── staging/ (stg_ prefix, light cleaning only)
├── Business logic, joins, calculations
│   └── intermediate/ (int_ prefix, reusable components)
├── Final consumption ready
│   ├── Analytics/BI → marts/ (fct_, dim_ prefixes)
│   └── ML features → features/ (fea_ prefix)
└── One-off analysis
    └── analysis/ (not materialized)

Testing Strategy Selection

Model Criticality & Data Patterns → Test Coverage

├── Core business metrics (revenue, customers)
│   └── COMPREHENSIVE: unique, not_null, relationships, custom business rules
├── Supporting dimensions
│   └── STANDARD: unique, not_null, accepted_values
├── Intermediate models
│   └── MINIMAL: not_null on join keys, row count > 0
└── Development models
    └── BASIC: not_null on primary key only

Failure Modes

1. Circular Reference Death Spiral

Detection Rule: dbt compile fails with "Cycle detected" error Symptoms: Model A refs Model B, which refs Model C, which refs Model A Fix: Break cycle by moving shared logic to new intermediate model that both reference

2. Incremental Model State Corruption

Detection Rule: dbt run succeeds but row counts decrease unexpectedly on incremental models Symptoms: Late-arriving data missed, duplicates created, or filter logic excludes existing records Fix: dbt run --full-refresh to rebuild, then fix filter conditions and unique_key configuration

3. Test Suite Performance Collapse

Detection Rule: dbt test takes >30min or times out on warehouse Symptoms: Tests query entire fact tables without limits, complex join tests on unindexed columns Fix: Add limit: 100000 to expensive tests, use dbt test --select config.severity:error for CI

4. Documentation Debt Explosion

Detection Rule: >50% of models/columns lack descriptions in dbt docs generate output Symptoms: New team members can't understand model purpose, business users avoid self-service Fix: Require description in CI checks, template model YAML generation, quarterly doc reviews

5. Macro Spaghetti Anti-Pattern

Detection Rule: Macros calling other macros >3 levels deep, single macro >100 lines Symptoms: Impossible to debug Jinja errors, changes break unexpected downstream models Fix: Flatten macro hierarchies, split complex macros, add macro unit tests with dbt-unit-testing

Worked Examples

Complete Source-to-Mart Workflow

Scenario: E-commerce orders data from Shopify API to revenue analytics

Step 1: Source Configuration

# models/staging/shopify/_sources.yml
sources:
  - name: shopify_raw
    freshness:
      warn_after: {count: 6, period: hour}
    tables:
      - name: orders
        description: "Raw orders from Shopify API"

Step 2: Staging Model (Decision: VIEW for <1M rows)

-- models/staging/shopify/stg_shopify__orders.sql
SELECT
  order_id::varchar as order_id,
  customer_id::varchar as customer_id,
  order_date::date as order_date,
  total_amount::decimal(10,2) as total_amount,
  status::varchar as status,
  _loaded_at::timestamp as _loaded_at
FROM {{ source('shopify_raw', 'orders') }}
WHERE status != 'cancelled'  -- Business rule: exclude cancelled

Step 3: Mart Model (Decision: INCREMENTAL for >10M rows, daily queries)

-- models/marts/finance/fct_revenue.sql
{{
  config(
    materialized='incremental',
    unique_key='order_id',
    incremental_strategy='merge'  -- Handle late updates
  )
}}

SELECT
  order_id,
  customer_id,
  order_date,
  total_amount,
  status,
  _loaded_at
FROM {{ ref('stg_shopify__orders') }}

{% if is_incremental() %}
  -- Only process recent data
  WHERE _loaded_at > (SELECT max(_loaded_at) FROM {{ this }})
{% endif %}

Trade-off Analysis Made:

Staging as VIEW: Cost-efficient, <1M rows, simple transformation
Mart as INCREMENTAL: 50M+ order rows, saves $200/day vs full refresh
Merge strategy: Handles order status updates (shipped→delivered)

What novice misses: Using append strategy for updatable data, forgetting late-arriving data filters

Quality Gates

[ ] All models follow naming convention: stg_, int_, fct_, dim_ prefixes
[ ] Every model has primary key with unique and not_null tests
[ ] Incremental models have unique_key and appropriate strategy (merge/append)
[ ] All {{ ref() }} and {{ source() }} calls resolve without hardcoded table names
[ ] Models >10M rows use incremental materialization with proper filter logic
[ ] Every model and column has description in YAML schema file
[ ] dbt test passes with zero failures on all error-level tests
[ ] dbt docs generate produces complete lineage graph with no broken references
[ ] CI runs dbt build --select state:modified+ and completes in <15 minutes
[ ] Source freshness checks configured with appropriate warn/error thresholds

NOT-FOR Boundaries

Do NOT use this skill for:

Orchestration/Scheduling: DAG dependencies, cron jobs → Use airflow-dag-orchestrator instead
Data Ingestion: API extraction, CDC, streaming → Use streaming-pipeline-architect instead
Warehouse Optimization: Query performance, indexing, partitioning → Use data-warehouse-optimizer instead
Data Catalog Management: Business glossary, data governance → Use data-governance-steward instead
Real-time Analytics: Sub-second latency, event streaming → Use realtime-analytics-architect instead

Delegation Rules:

For warehouse-specific performance issues → data-warehouse-optimizer
For data quality monitoring/alerting beyond dbt tests → data-quality-guardian
For complex dimensional modeling decisions → dimensional-modeler

curiositech/dbt-analytics-engineer

skills/dbt-analytics-engineer/SKILL.md

dbt Core/Cloud data transformations, testing, documentation, and CI/CD. Activate on: dbt, data transformation, analytics engineering, ref, source, staging model, mart, dbt test. NOT for: orchestration/scheduling (use airflow-dag-orchestrator), data warehouse tuning (use data-warehouse-optimizer).

development

Updated Apr 4, 2026

$ install --global

skillsauth

npx skillsauth add curiositech/windags-skills dbt-analytics-engineer

Install this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.

Security Scan Results

3 of 9 scanners reported clean

Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.

Scanners Passed

Scanners in report

Clean

TrivyContainer and dependency vulnerability scanner

95%

Clean

SemgrepStatic code analysis for vulnerabilities

95%

Clean

mcp-scan (Snyk)Model Context Protocol security validation

95%

Skipped

Snyk (dep)Open source security scanning

50%

Skipped

Socket.devSupply chain security analysis

50%

Skipped

VirusTotalMulti-engine malware detection

50%

Skipped

CrowdStrikeAdvanced threat intelligence

50%

Skipped

OSV-ScannerOpen Source Vulnerability database check

50%

Skipped

OWASP Dep-Check

50%

Last scanned: Apr 4, 2026, 2:12 PM76.3s1 file scanned

SKILL.md

license:: Apache-2.0
name:: dbt-analytics-engineer
description:: dbt Core/Cloud data transformations, testing, documentation, and CI/CD. Activate on: dbt, data transformation, analytics engineering, ref, source, staging model, mart, dbt test. NOT for: orchestration/scheduling (use airflow-dag-orchestrator), data warehouse tuning (use data-warehouse-optimizer).
allowed-tools:: Read,Write,Edit,Bash(npm:*,npx:*,dbt:*,python:*)
category:: Data & Analytics
- skill:: dimensional-modeler
reason:: dbt marts implement dimensional models

dbt Analytics Engineer

Build, test, and document data transformations using dbt Core/Cloud with modern analytics engineering practices.

Decision Points

Materialization Selection Strategy

Model Size & Query Pattern → Materialization Choice

├── < 1M rows, rarely queried
│   └── VIEW (ephemeral if only intermediate)
├── 1M-10M rows, daily queries
│   └── TABLE (full refresh nightly)
├── > 10M rows, frequent queries
│   ├── Append-only data → INCREMENTAL (append strategy)
│   ├── Updates/deletes → INCREMENTAL (merge strategy)
│   └── Complex joins/aggregations → TABLE with incremental source prep
└── Dev/staging environment
    └── Always VIEW (cost optimization)

Model Layer Assignment

Data Characteristics → Layer Placement

├── Raw source mapping (1:1)
│   └── staging/ (stg_ prefix, light cleaning only)
├── Business logic, joins, calculations
│   └── intermediate/ (int_ prefix, reusable components)
├── Final consumption ready
│   ├── Analytics/BI → marts/ (fct_, dim_ prefixes)
│   └── ML features → features/ (fea_ prefix)
└── One-off analysis
    └── analysis/ (not materialized)

Testing Strategy Selection

Model Criticality & Data Patterns → Test Coverage

├── Core business metrics (revenue, customers)
│   └── COMPREHENSIVE: unique, not_null, relationships, custom business rules
├── Supporting dimensions
│   └── STANDARD: unique, not_null, accepted_values
├── Intermediate models
│   └── MINIMAL: not_null on join keys, row count > 0
└── Development models
    └── BASIC: not_null on primary key only

Failure Modes

1. Circular Reference Death Spiral

2. Incremental Model State Corruption

3. Test Suite Performance Collapse

4. Documentation Debt Explosion

5. Macro Spaghetti Anti-Pattern

Worked Examples

Complete Source-to-Mart Workflow

Scenario: E-commerce orders data from Shopify API to revenue analytics

Step 1: Source Configuration

# models/staging/shopify/_sources.yml
sources:
  - name: shopify_raw
    freshness:
      warn_after: {count: 6, period: hour}
    tables:
      - name: orders
        description: "Raw orders from Shopify API"

Step 2: Staging Model (Decision: VIEW for <1M rows)

-- models/staging/shopify/stg_shopify__orders.sql
SELECT
  order_id::varchar as order_id,
  customer_id::varchar as customer_id,
  order_date::date as order_date,
  total_amount::decimal(10,2) as total_amount,
  status::varchar as status,
  _loaded_at::timestamp as _loaded_at
FROM {{ source('shopify_raw', 'orders') }}
WHERE status != 'cancelled'  -- Business rule: exclude cancelled

Step 3: Mart Model (Decision: INCREMENTAL for >10M rows, daily queries)

-- models/marts/finance/fct_revenue.sql
{{
  config(
    materialized='incremental',
    unique_key='order_id',
    incremental_strategy='merge'  -- Handle late updates
  )
}}

SELECT
  order_id,
  customer_id,
  order_date,
  total_amount,
  status,
  _loaded_at
FROM {{ ref('stg_shopify__orders') }}

{% if is_incremental() %}
  -- Only process recent data
  WHERE _loaded_at > (SELECT max(_loaded_at) FROM {{ this }})
{% endif %}

Trade-off Analysis Made:

Staging as VIEW: Cost-efficient, <1M rows, simple transformation
Mart as INCREMENTAL: 50M+ order rows, saves $200/day vs full refresh
Merge strategy: Handles order status updates (shipped→delivered)

What novice misses: Using append strategy for updatable data, forgetting late-arriving data filters

Quality Gates

[ ] All models follow naming convention: stg_, int_, fct_, dim_ prefixes
[ ] Every model has primary key with unique and not_null tests
[ ] Incremental models have unique_key and appropriate strategy (merge/append)
[ ] All {{ ref() }} and {{ source() }} calls resolve without hardcoded table names
[ ] Models >10M rows use incremental materialization with proper filter logic
[ ] Every model and column has description in YAML schema file
[ ] dbt test passes with zero failures on all error-level tests
[ ] dbt docs generate produces complete lineage graph with no broken references
[ ] CI runs dbt build --select state:modified+ and completes in <15 minutes
[ ] Source freshness checks configured with appropriate warn/error thresholds

NOT-FOR Boundaries

Do NOT use this skill for:

Orchestration/Scheduling: DAG dependencies, cron jobs → Use airflow-dag-orchestrator instead
Data Ingestion: API extraction, CDC, streaming → Use streaming-pipeline-architect instead
Warehouse Optimization: Query performance, indexing, partitioning → Use data-warehouse-optimizer instead
Data Catalog Management: Business glossary, data governance → Use data-governance-steward instead
Real-time Analytics: Sub-second latency, event streaming → Use realtime-analytics-architect instead

Delegation Rules:

For warehouse-specific performance issues → data-warehouse-optimizer
For data quality monitoring/alerting beyond dbt tests → data-quality-guardian
For complex dimensional modeling decisions → dimensional-modeler

Related Skills

curiositech/revisiting-interview-data-analysing-turn

data-ai

VerifiedTrustedCommunity

license: Apache-2.0 NOT for unrelated tasks outside this domain.

8SKILL.mdUpdated Jul 19, 2026

curiositech/revisiting-interview-data-analysing-turn

curiositech/redis-patterns-expert

development

VerifiedTrustedCommunity

Use when designing caching strategies (cache-aside, write-through, write-behind), implementing distributed locks, building rate limiters, leaderboards, real-time streams (XADD/consumer groups), pub/sub, or tuning eviction policies. Triggers: thundering-herd on cache miss, dogpile on key expiry, Redlock vs SET-NX-PX choice, sliding-window rate limiter, hot-key on a single cluster slot, big-key blowup, MULTI/EXEC across slots, KEYS in production. NOT for Redis Cluster operations/admin (different domain), embedded KV (SQLite, leveldb), in-process LRU caches, or Memcached.

8SKILL.mdUpdated Jul 19, 2026

curiositech/redis-patterns-expert

curiositech/react-server-components-boundary

tools

VerifiedTrustedCommunity

Drawing the `'use client'` boundary correctly in React Server Components apps (Next.js App Router, RSC frameworks) — leaf-pushing, slot composition, serialization rules, and environment poisoning prevention. Grounded in react.dev and Next.js 16 docs.

8SKILL.mdUpdated Jul 19, 2026

curiositech/react-server-components-boundary

curiositech/rate-limiting-strategy

development

VerifiedTrustedCommunity

Use when designing rate limiting for an API, choosing between token bucket / sliding window / leaky bucket / fixed window, implementing it in Redis, deciding edge (Cloudflare/Upstash) vs origin enforcement, sizing per-user vs per-IP vs per-endpoint quotas, returning the right 429 response with Retry-After, or fixing the boundary-burst bug in fixed-window limiters. Triggers: 429 too many requests, INCR + EXPIRE, ZADD + ZREMRANGEBYSCORE + ZCARD, X-RateLimit-Remaining header, Cloudflare WAF rate limiting rules, Upstash @upstash/ratelimit, leaky bucket shaping vs policing, distributed rate limiter consistency. NOT for DDoS mitigation specifically (different scale), CAPTCHA / bot management, full WAF design, or per-user quota billing.

8SKILL.mdUpdated Jul 19, 2026

curiositech/rate-limiting-strategy

Download

For Claude Desktop. Download once, then upload the file in the app — no terminal needed.

Need help? View full Cowork setup guide →

Install manually

Choose your platform

# Clone the repo
git clone https://github.com/curiositech/windags-skills.git

# Copy into Claude Code skills folder (global)
cp -r windags-skills/skills/dbt-analytics-engineer ~/.claude/skills/

Claude Code Skills — official skills path docs.

Repository

curiositech/windags-skills

Compatible with

Claude Code

OpenAI Codex CLI

ChatGPT