.claude/skills/rag-pipeline/SKILL.md
Patrones de implementación del pipeline RAG de RegWatch AI usando Azure OpenAI y Azure AI Search. Usar cuando se trabaje en: ingestion de documentos regulatorios, generación de embeddings, hybrid search, cache Redis de embeddings o queries, sistema prompt del LLM, o cualquier parte del RAGEngine y DocumentIndexer.
npx skillsauth add centralcordoba/RAGAgentThornton rag-pipelineInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
1. Verificar Redis cache (key: rag:hash(question+filters), TTL 1h)
2. Si cache miss → HybridSearch en Azure AI Search
3. Llamar Azure OpenAI
4. Si confidence < 0.5 → retornar "insufficient data"
5. Cachear resultado en Redis
SYSTEM: Eres un analista de compliance regulatorio especializado.
Reglas:
- Solo responde usando los documentos provistos como contexto.
- Cita fuentes usando [doc_id] inline en tu respuesta.
- Si la información no está disponible, responde exactamente: 'insufficient data'.
- Nunca inventes regulaciones, fechas, o montos de multa.
Formato de respuesta requerido (SIEMPRE este formato exacto):
Answer: <tu respuesta con [doc_id] citations inline>
Sources: [lista de doc_ids usados]
Confidence: <0.0 a 1.0>
Reasoning: <pasos de razonamiento step by step>
Impacted obligations: <lista de obligaciones afectadas>
const completion = await openAIClient.getChatCompletions(deployment, messages, {
maxTokens: 1500, // FIJO — control de costos
temperature: 0.2, // FIJO — respuestas conservadoras y consistentes
});
const searchOptions: SearchOptions = {
vectorSearchOptions: {
queries: [{
kind: 'vector',
vector: embedding,
fields: ['contentVector'],
kNearestNeighborsCount: 5,
}],
},
semanticSearchOptions: { configurationName: 'regulatory-semantic' },
queryType: 'semantic',
top: 5,
// Híbrido: el SDK combina vector + keyword internamente
// vectorWeight: 0.7, keywordWeight: 0.3 se configura en el índice
};
| Tipo | Key pattern | TTL |
|------|-------------|-----|
| Embeddings | emb:sha256(text) | 24h |
| RAG results | rag:sha256(question+filtersJSON) | 1h |
| Regulations | reg:${id} | 6h |
// SIEMPRE verificar antes de llamar a Azure OpenAI
const cacheKey = `emb:${sha256(text)}`;
const cached = await redis.get(cacheKey);
if (cached) return JSON.parse(cached);
const embedding = await generateEmbedding(text);
await redis.setex(cacheKey, 86400, JSON.stringify(embedding)); // 24h
return embedding;
interface RAGResponse {
answer: string; // con [doc_id] citations
sources: string[]; // lista de doc_ids usados
confidence: number; // 0.0 a 1.0
reasoning: string; // pasos de razonamiento
impactedObligations: string[]; // obligaciones afectadas
cached: boolean; // si vino de cache
latencyMs: number; // duración total
}
Campos requeridos del índice regulatory-changes:
id (key), title, content, summarycountry, jurisdiction, area (fiscal|labor|corporate|securities)impactLevel (HIGH|MEDIUM|LOW), effectiveDate, sourceUrlcontentVector (1536 dims — text-embedding-3-large)testing
Patrones de implementación para los connectors de ingestion regulatoria de RegWatch AI. Usar cuando se trabaje en: BaseIngestionJob, connectors específicos (SEC EDGAR, EUR-Lex, BOE España, DOF México, DOU Brasil, Infoleg Argentina, CMF Chile), detección de cambios semánticos, clasificación de impacto, o el scheduler de Azure Functions.
testing
Patrones de Neo4j y Cypher para el knowledge graph de ComplianceGraph en RegWatch AI. Usar cuando se trabaje en: schema de nodos y relaciones, queries Cypher de obligaciones, onboarding engine que genera ComplianceMap, actualización del grafo cuando llegan nuevos cambios regulatorios, o el ComplianceAgent de LangChain.
development
Patrones de deploy de RegWatch AI en Azure. Usar cuando se trabaje en: Bicep templates, Azure Container Apps (api, web, ingestion-scheduler), CI/CD con GitHub Actions, Dockerfiles multi-stage, configuración de Key Vault references, Application Insights custom metrics, o cualquier infraestructura de Azure del proyecto.
development
Patrones del sistema de alertas de RegWatch AI. Usar cuando se trabaje en: AlertEngine, AlertFormatter, NotificationService, flujo HITL (Human-in-the-Loop) para alertas HIGH, canales de notificación (email Azure Communication Services, Teams Adaptive Cards, SSE in-app), deduplicación, escalamiento o rate limiting de alertas.