🌡️ O que é rodar a frio
Rodar a frio é o ato de abrir uma sessão completamente limpa do Claude Code e digitar um prompt que descreve o problema sem dar nenhuma pista sobre qual skill deve ser acionada. É o teste mais honesto que existe — e também o mais negligenciado. A maioria das pessoas testa suas skills de forma viciada, incluindo o nome da skill no prompt ou formulando a pergunta de um jeito que torna óbvio qual ferramenta usar. Isso não testa nada. O teste frio replica exatamente o que vai acontecer quando você usar a skill no fluxo real de trabalho, sem pensar nela explicitamente.
🧊 Conceito Principal: O Teste Frio
O teste frio tem três regras inegociáveis:
- •Sessão nova: sem histórico de conversa anterior que possa influenciar o contexto
- •Prompt neutro: descreve o problema, não a solução ou a ferramenta
- •Observação honesta: registrar o resultado sem racionalizá-lo após o fato
💡 Dica Prática
Antes de testar qualquer skill nova, escreva o prompt de teste em um arquivo separado enquanto ainda está construindo a skill. Isso garante que o prompt seja genuinamente neutro — escrito antes de você ter a skill em mente de forma tão concreta.
🔍 Por que prompts vagos revelam a verdade
Quando você diz "use a skill de copywriting para escrever um post", qualquer skill com esse nome dispara. Isso não é um teste — é um atalho. O usuário real vai dizer "escreve um post sobre meu produto" e o modelo precisa inferir que a skill de copywriting é a ferramenta certa com base apenas nos metadados da skill. A qualidade do gatilho é diretamente proporcional à capacidade da skill de ser encontrada por prompts vagos. Se ela só dispara quando você menciona o nome explicitamente, ela não tem um gatilho — tem uma invocação manual.
🎯 A Hierarquia do Gatilho
- •Gatilho fraco: só dispara quando o nome da skill é mencionado
- •Gatilho médio: dispara quando o contexto é muito específico e explícito
- •Gatilho forte: dispara a partir de menção do problema que a skill resolve
✓ Prompts que revelam gatilho forte
- ✓"Preciso escrever algo para o Instagram"
- ✓"Me ajuda com esse texto de vendas"
- ✓"Quero criar um post sobre meu produto"
✗ Prompts que apenas confirmam o óbvio
- ✗"Use a skill de copywriting para..."
- ✗"Acione a ferramenta de posts do Instagram"
- ✗"/copywriting escreva um post"
📋 Como fazer o teste
O processo é simples mas exige disciplina. O erro mais comum é fazer o teste na mesma sessão onde você criou ou editou a skill — nesse contexto, o modelo tem toda a conversa anterior como referência e o teste é completamente inválido. Cada teste frio é uma nova sessão, ponto. O segundo erro é formular o prompt de teste depois de já ter a skill pronta e "aquecer" a mente inconscientemente com o vocabulário da skill. Escreva o prompt antes ou imediatamente após criar a skill, enquanto você ainda pensa no problema, não na solução.
Feche a sessão atual
Encerre completamente a sessão do Claude Code onde você criou ou editou a skill. Sem atalhos — a sessão precisa ser zerada.
Abra uma sessão limpa
Inicie uma nova sessão sem histórico. Se o Claude Code tiver persistência de memória, certifique-se de que o contexto da sessão anterior não está presente.
Digite o prompt neutro
Use o prompt que você preparou antecipadamente. Descreve o problema sem nomear a skill ou dar pistas sobre a ferramenta esperada.
Observe e registre
Veja qual skill (se alguma) foi acionada. Anote o resultado antes de analisar — o primeiro instinto é mais honesto que a racionalização posterior.
📊 Interpretando o resultado
O resultado do teste frio tem exatamente três possibilidades, cada uma com um diagnóstico e uma ação correspondente. Não existe "mais ou menos funcionou" — ou a skill correta disparou, ou não disparou, ou a skill errada disparou. Cada resultado é informação limpa sobre o que precisa ser ajustado. A tentação é racionalizar o resultado quando ele não é o esperado ("ah, mas se eu tivesse dito diferente..."). Resista a isso. O resultado do teste frio é o único feedback honesto que você tem sobre o desempenho real da skill.
📊 Os Três Resultados Possíveis
✅ Skill correta disparou
O gatilho está bem calibrado. A descrição contém as palavras-chave certas na posição certa. Continue usando a skill e monitore ao longo do tempo.
⚠️ Nenhuma skill disparou
A descrição não contém vocabulário suficiente para o modelo inferir o uso. Revise a primeira frase da descrição e inclua palavras do domínio do problema.
❌ Skill errada disparou
Há conflito de vocabulário entre skills similares. Diferencia as descrições das skills conflitantes e torna cada uma mais específica ao seu domínio exclusivo.
🔧 O que fazer quando a skill errada dispara
Quando a skill errada dispara, o problema está quase sempre na sobreposição de vocabulário entre duas skills da sua biblioteca. O modelo não tem critérios suficientes para diferenciar e aciona a que apareceu primeiro ou a que tem descrição mais longa. A solução não é remover palavras genéricas — é adicionar especificidade exclusiva. Cada skill precisa ter pelo menos um marcador semântico que não existe em nenhuma outra skill da sua biblioteca. Encontrar esse marcador é o exercício central do diagnóstico de conflito.
✓ O que FAZER para resolver o conflito
- ✓Liste todas as skills com domínio similar
- ✓Identifique o vocabulário compartilhado
- ✓Adicione um marcador exclusivo a cada skill
- ✓Refaça o teste frio após cada ajuste
✗ O que NÃO fazer
- ✗Apagar a skill errada sem diagnóstico
- ✗Adicionar mais palavras genéricas à descrição
- ✗Aceitar o conflito e usar invocação manual
- ✗Renomear a skill sem revisar a descrição
💡 Dica Prática
Mantenha um mapa de domínios das suas skills — uma tabela simples com o nome de cada skill e as 3-5 palavras-chave exclusivas dela. Quando surgir um conflito, a tabela revela imediatamente qual é a sobreposição problemática.
✅ Checklist do teste frio
Um checklist transforma o teste subjetivo em protocolo objetivo. Sem ele, você vai "testar" de formas diferentes cada vez e não terá como comparar resultados entre sessões diferentes ou entre skills diferentes. O checklist é o que transforma o teste frio de uma prática ad hoc em um protocolo de qualidade reproduzível. Aplique ele toda vez que criar uma nova skill e toda vez que revisar uma skill existente. Cinco pontos, cada um não negociável.
✅ Os 5 Pontos do Checklist
Confirmou que não há histórico de conversa anterior sobre a skill ou o domínio dela?
O prompt não menciona o nome da skill, não usa verbos de invocação e descreve apenas o problema?
A skill esperada (e não outra) foi acionada pelo modelo sem instruções explícitas?
O output gerado tem a estrutura e o conteúdo que a skill deveria produzir?
Nenhuma outra skill foi mencionada ou considerada pelo modelo antes de acionar a correta?
🧊 Resumo do Módulo
Próximo Módulo:
2.2 — 📏 Orçamento de Descrição: o limite invisível de caracteres que o Claude Code usa ao ler suas skills