🔎 Lendo sinais de qualidade
Install count, fonte, description, escopo e manutenção — os sinais que separam uma skill madura de um repo abandonado. Mais um checklist prático.
A contagem de instalações que o skills.sh mostra ao lado de cada skill. É o sinal de popularidade mais visível — find-skills tem 1.802.925, frontend-design 488.299.
Installs altos correlacionam com qualidade, mas não são prova. Há viés de quem chegou cedo e efeito de marca. Saber ler isso evita instalar lixo popular.
lei de potência · viés do early-mover · efeito de marca · 0,3% têm 100k+
O repositório owner/repo que hospeda a skill. vercel-labs, anthropics e microsoft carregam reputação institucional; um repo aleatório de 3 estrelas, não.
A fonte é o segundo melhor sinal depois da description. Fontes oficiais mantêm a skill viva, seguem a spec e respondem a issues.
vendor-backed · anthropics/skills · vercel-labs · microsoft/azure-skills · repo aleatório
O campo description do frontmatter. Uma boa diz O QUE a skill faz E QUANDO usá-la. É o gatilho que o agente lê para decidir disparar.
Description clara revela que o autor entendeu o problema. Description vaga = skill que dispara errado ou nunca dispara. É o melhor preditor de qualidade.
gatilho de ativação · O QUE + QUANDO · trigger preciso · subdisparo
O quanto a skill tenta abraçar. Uma skill atômica resolve um problema bem; uma "tudo-sobre-X" tenta resolver dez e não resolve nenhum direito.
Skills focadas absorvem melhor no contexto, disparam com precisão e compõem com outras. Tamanho enxuto (corpo <500 linhas) é sinal de disciplina.
atomicidade · uma responsabilidade · composição · <500 linhas
Frequência de commits, issues respondidas e releases. Como skills instalam por symlink, npx skills update puxa as melhorias da fonte automaticamente.
Uma skill viva acompanha mudanças de framework e da própria spec. Uma abandonada envelhece e passa a dar instruções erradas para o agente.
último commit · issues abertas · npx skills update · symlink vs cópia
Um roteiro de 7 perguntas que junta todos os sinais — installs, fonte, description, escopo, manutenção, licença e fit — numa decisão de 2 minutos.
Transforma intuição em processo repetível. Você para de instalar por hype e passa a instalar por evidência.
avaliação em 2 min · evidência > hype · fit com o seu stack · ler o SKILL.md
🏆 Vitrine: as melhores por grupo
Seis grupos do catálogo, suas skills de referência e o porquê elas são boas — usando installs e fontes reais do skills.sh.
Skills de UI, React, CSS e design. As referências: frontend-design (488k, anthropics), vercel-react-best-practices (443k) e web-design-guidelines (358k).
É o grupo mais maduro para quem programa front. Fontes oficiais + installs altíssimos = baixo risco de instalar.
frontend-design · vercel-react-best-practices · web-design-guidelines
O maior grupo por volume. Referências: agent-browser (332k, vercel-labs), skill-creator (246k, anthropics) e vercel-composition-patterns (195k).
É o coração do ecossistema. skill-creator é a própria ferramenta canônica para criar skills — meta e essencial.
agent-browser · skill-creator · vercel-composition-patterns
Skills de SQL, Postgres e modelagem. Referências: supabase-postgres-best-practices (203k, supabase), supabase (99k) e neon-postgres (38k).
Aqui a fonte é vendor-backed (supabase, neondatabase): a empresa que faz o banco escreve as boas práticas. Confiança máxima.
supabase-postgres-best-practices · supabase · neon-postgres
A suíte microsoft/azure-skills: foundry, ai, deploy, diagnostics e prepare — todas entre ~358k e 360k installs.
Poucas skills, mas installs gigantes (8,3M). Mostra como uma suíte coesa de um vendor domina um nicho de infraestrutura.
microsoft-foundry · azure-ai · azure-deploy · azure-diagnostics · azure-prepare
Skills de teste e qualidade. Referências: test-driven-development (107k, obra/superpowers) e playwright-best-practices (45k).
Skills de processo (como TDD) mostram que skills não são só sobre stack — também codificam disciplina de engenharia.
test-driven-development · playwright-best-practices · skill de processo
Skills de negócio: marketing-psychology (84k, coreyhaines31), lark-slides (139k, larksuite) e stripe-best-practices (stripe/ai).
Prova que o ecossistema vai muito além de devs. Há grupos inteiros (Marketing 2,3M, Office, Finance) para trabalho não-técnico.
marketing-psychology · lark-slides · stripe-best-practices
⭐ As Melhores por Sinal de Qualidade
Para cada sinal de qualidade, a skill real que é seu retrato perfeito — description, escopo atômico, fonte forte e descoberta clara, com as descriptions reais do catálogo.
frontend-design (488k, anthropics) diz o quê, quando e dá exemplos: "Use this skill when the user asks to build web components, pages...". supabase (99k) é "pushy" com "Triggers:...".
A description é o gatilho de roteamento. Ver o modelo perfeito te dá o padrão a copiar quando escrever a sua.
o quê + quando + exemplos · "pushy" · Triggers: · combate ao subdisparo
vercel-react-best-practices (443k) e test-driven-development (107k, obra/superpowers): uma responsabilidade só, feita muito bem.
Escopo atômico dispara com precisão e compõe com outras skills. É o sinal que separa skill madura de "tudo-sobre-X".
uma responsabilidade · teste da frase sem "e" · composição · skill de processo
A suíte microsoft/azure-skills (~358k cada) e vercel-labs: vendor oficial, suíte coesa, manutenção viva via symlink.
Vendor-backed é o teto de confiança — quem faz o produto conhece os edge cases que ninguém documenta.
vendor-backed · suíte coesa · npx skills update · manutenção viva
find-skills (1.802.925, vercel-labs), a mais instalada do catálogo: nome e propósito instantaneamente óbvios.
Se o nome precisa de explicação, a descoberta falhou. Nome+description autoexplicativos viram a porta de entrada.
nome autoexplicativo · porta de entrada · top 100 = 43,7% · 0,3% têm 100k+
skill-creator (246k, anthropics) combina description clara + escopo focado + fonte oficial + descoberta óbvia.
Acertar vários sinais não soma — multiplica. É por isso que essas skills lideram o catálogo.
efeito composto · meta-skill · reforço mútuo dos sinais
O quadro de referência: cada sinal de qualidade com sua skill-modelo, fonte e installs reais.
Vira gabarito: ao avaliar ou criar uma skill, compare com o campeão do sinal que mais importa para você.
gabarito · campeão por sinal · copie o padrão, não invente
🛠️ Como Criar uma Skill que Parece (e É) de Alta Qualidade
A parte prática: description que dispara certo, escopo atômico, checklist de polimento, antes/depois de uma skill fraca virando forte e um template de description pronto.
Escrever a description em três partes: o resultado que entrega, o quando (gatilhos concretos) e ser "pushy" contra o subdisparo.
É o gatilho de roteamento que fica sempre no contexto. Errar aqui = skill que dispara errado ou nunca dispara.
resultado, não atividade · "Use when..." · "Triggers:" · regra dos 100 palavras
Manter a skill em uma única responsabilidade, como vercel-react-best-practices e a suíte azure-skills. Quebrar o que for grande.
Skill atômica absorve no contexto, dispara com precisão, é testável e compõe. "Tudo-sobre-X" falha em tudo.
teste da frase única · <500 linhas · sem "e"/"também" · composição
Um roteiro de 7 itens — description, escopo, <500 linhas, explicar o porquê, test prompts, scripts, nome óbvio — antes de publicar.
Separa uma skill que parece de qualidade de uma que é. Inspirado no fluxo canônico do skill-creator.
checklist de 7 · polir = remover · imperativo · bundled resources
Mesma intenção ("ajudar com SQL"), duas execuções lado a lado: a "sql-helper and more" que ninguém instala vs. o padrão postgres-best-practices.
Mostra que o salto de qualidade vem de roteamento e foco, não do conteúdo técnico.
code box ✗/✓ · "and more" = escopo infinito · roteamento e foco
Um molde de frontmatter que junta os padrões de frontend-design e supabase, com exemplo preenchido para uma skill de migrations.
Tira o "página em branco". Você preenche os colchetes e calibra os triggers contra near-misses.
template · verbo de resultado · exemplos + Triggers · calibrar near-misses
Capturar intent → draft → 2-3 test prompts vs baseline → generalizar e enxugar → otimizar description → empacotar.
Criar uma skill boa é iterativo, não um chute. O loop garante que ela realmente ajuda antes de publicar.
com-skill vs baseline · should-trigger/should-not · iterar · empacotar
🚀 Dicas Avançadas: Sinais que Só os Experts Veem
Os sinais finos: precisão de triggering, economia de contexto, ler transcripts, pass-rate de evals e assertions discriminantes, variância e por que uma skill popular ainda pode ser ruim.
A skill dispara nos casos certos (should-trigger) e silencia nos parecidos-mas-errados (near-misses). Falso positivo é pior que não disparar.
É o sinal invisível: skill que aciona errado injeta contexto irrelevante e degrada a resposta.
should-trigger · should-NOT-trigger · falso positivo/negativo · precisão vs cobertura
Os 3 níveis do progressive disclosure: description sempre no contexto, corpo ao disparar, bundled sob demanda. Skill cara em tokens rouba espaço.
30 descriptions inchadas gastam milhares de tokens antes de qualquer tarefa. Description densa-e-curta é orçamento.
3 níveis · custo das sempre-ativas · empurrar detalhe para o nível 3
Reler sessões reais procurando repetição, não-disparo (skill que devia ter acionado) e disparo errado (near-miss).
Transcript é o melhor eval grátis. Cada padrão encontrado é um ajuste concreto de skill ou de description.
repetição → script · não-disparo → trigger fraco · disparo errado → near-miss
Uma assertion discriminante falha sem a skill e passa com ela. O número que vale é o delta entre com-skill e baseline.
Pass-rate 100% que não distingue baseline de com-skill é falso conforto — não mede a contribuição da skill.
assertion discriminante · delta vs baseline · sempre rodar o baseline
O modelo é estocástico: a mesma skill passa numa rodada e falha na outra. Rode o eval várias vezes e olhe média ± desvio.
90% flaky é pior que 80% estável. Estabilidade é qualidade; uma rodada só engana.
estocástico · média ± σ · imperativo reduz variância · explicar o porquê
Lei de potência: top 100 = 43,7% dos installs, só 0,3% (131 skills) passam de 100k. Há viés de early-mover e marca.
Skill popular pode estar abandonada, ser de outro stack ou inchada. Install é onde se começa a investigar, não onde termina.
viés de early-mover · fit com o stack · manutenção · evidência > hype
Mapa da trilha
Installs mentem; a description não. Aprenda a separar hype de evidência.
Seis grupos, as skills de referência e o porquê — com números reais.
Cada sinal tem uma campeã. find-skills, frontend-design, azure: imite os modelos.
Description que dispara, escopo atômico e o template pronto. Da fraca à forte.
Triggering preciso, custo de contexto, evals honestos. Popular não é prova.