análisedados

A letra mais comum no Termo: análise de 1.519 palavras do arquivo

A letra A apareceu em 15,93% de todas as posições das 1.519 palavras do Termo. Q apareceu em 0,24%. A distribuição é desequilibrada — e isso muda como você deveria escolher a primeira tentativa.

Equipe Termojogo 7 min de leitura

A pergunta parece simples: entre todas as palavras que já foram resposta do Termo, qual é a letra que aparece mais vezes? Como mantemos um arquivo com todas as palavras publicadas desde o lançamento do jogo, decidimos contar letra por letra. O resultado é útil na prática — ele diz, de forma objetiva, onde você deveria gastar suas primeiras tentativas.

O conjunto: 1.519 palavras de cinco letras, todas do dicionário em português brasileiro usado pelo jogo. No total, são 7.595 posições de letra.

O ranking completo

Contando quantas vezes cada letra aparece (em qualquer posição) entre essas 7.595 casas, a distribuição ficou assim:

# Letra Ocorrências % do total
1A1.21015,93%
2O94012,38%
3R7519,89%
4E5817,65%
5S5016,60%
6I4535,96%
7T3885,11%
8L3394,46%
9C3364,42%
10U2923,84%

A letra A não só venceu — ela é quase 30% mais frequente do que a segunda colocada. Entre as cinco primeiras, só uma é consoante (R) e ainda assim abaixo dos 10%. A, O, E, I e U somam juntas 45,8% de todas as posições no arquivo. As vogais, na prática, são metade do jogo.

As letras que quase nunca aparecem

Na outra ponta, há cinco letras que — juntas — ocupam menos de 3% das posições. Ver uma dessas em cinza após o seu palpite é quase redundante; elas raramente estão na resposta.

LetraOcorrências% do total
H730,96%
Z510,67%
J410,54%
X370,49%
Q180,24%

A letra Q apareceu exatamente 18 vezes em 1.519 palavras. É praticamente uma curiosidade: se sua abertura tem Q, você está gastando uma casa para confirmar algo que só tem 1 em 422 chances de ajudar. Mesmo caso para X, J e Z. Isso não quer dizer que você deve ignorar essas letras quando elas aparecem (uma vez que a resposta pede Q, você precisa saber que ele está lá), mas não faz sentido incluí-las em palavras exploratórias.

Vogais versus consoantes

Se o objetivo da abertura é extrair informação, a pergunta óbvia é: vogais rendem mais que consoantes? No arquivo, a divisão é esta:

  • Vogais (A, E, I, O, U): 3.476 ocorrências — 45,8% das posições.
  • Consoantes: 4.119 ocorrências — 54,2% das posições.

A distribuição é quase meio a meio, mas o ponto importante é outro: só existem cinco vogais. Isso significa que cada vogal testada, em média, rende mais informação por letra do que cada consoante. Quando você coloca A, O, E, I e U num único palpite, você está cobrindo quase metade de todas as possíveis posições do jogo. Quando você coloca cinco consoantes, você cobre 54% das posições — mas distribuído entre 21 letras diferentes, que é uma área muito maior.

Essa é a razão matemática pela qual aberturas como AUREO são recomendadas: ela contém quatro das cinco vogais (A, U, E, O) em uma só palavra. Num único palpite, você resolve quase toda a questão vocal da resposta.

Observação: a frequência que medimos é por posição, não por palavra. Se uma palavra tem dois O (como OSSO), contamos dois O. Isso é intencional — é exatamente esse o número que importa para a estratégia de abertura, já que cada casa da resposta é avaliada separadamente.

Como isso muda a sua primeira tentativa

Transportando para a mesa do jogo, o ranking vira uma pequena hierarquia de decisões.

1. Se sua abertura não tem A, repense.

A letra A aparece em 15,93% das posições. Em termos práticos, quase 4 em cada 5 palavras do arquivo contêm pelo menos um A. Uma abertura sem A está voluntariamente abrindo mão da letra mais provável de estar na resposta — e isso só se justifica se você já testou o A em rodadas anteriores (no modo infinito, por exemplo).

2. Priorize A, O, R, E, S.

Essas cinco letras sozinhas correspondem a 52,45% de todas as posições do arquivo. Uma palavra inicial que tenha todas as cinco — ou pelo menos quatro delas — vai, em média, fechar mais de duas casas em verde/amarelo já na primeira tentativa. Exemplos de palavras válidas: AREOS (raro), SAROA (inválida em muitos dicionários). Palavras mais seguras que cobrem quatro dessas cinco: OUTRO, HORAS, PORTA, SABOR.

3. Deixe H, Z, J, X, Q para o final.

Essas cinco letras aparecem em menos de 3% das posições cada uma. Incluí-las numa abertura é quase sempre desperdício. A exceção lógica é depois de duas ou três tentativas em que nada mais ilumina — aí, sim, testar uma letra rara pode ser uma forma de descartar possibilidades restritas.

Uma palavra sobre limitações

A análise acima tem três limitações que convém deixar explícitas, antes que alguém nos pergunte.

Primeiro, o ranking é por ocorrência total, não por posição no slot. A letra A é comum na primeira casa da palavra? E na quinta? O número agregado esconde essa nuance. Para quem está fechando uma palavra nas últimas tentativas, saber que a última posição costuma ser S/R/O/A é mais útil do que saber que A é a mais comum no geral. Em um próximo post vamos detalhar a frequência por posição.

Segundo, a distribuição reflete o dicionário específico do Termo brasileiro, não o português escrito em geral. Palavras de cinco letras são um subconjunto muito particular: verbos curtos, substantivos concretos, advérbios. Palavras mais longas (que não entram no jogo) têm padrões diferentes.

Terceiro, frequência não é tudo. Duas palavras podem ter a mesma letra e ainda assim serem muito diferentes — uma pode ter estrutura silábica comum (consoante-vogal-consoante-vogal-consoante, como TERMO) e outra pode ter padrão raro (vogal-vogal-vogal-consoante-vogal, como OUVIR). Um bom palpite de abertura respeita os dois eixos: letras frequentes e estrutura frequente.

O que fazer com esses números

Se você chegou até aqui e está pronto para jogar, a receita curta é: priorize A, depois O e R. Encaixe pelo menos três dessas cinco (A, O, R, E, S) na sua primeira tentativa. Evite começar com H, Z, J, X ou Q até ter alguma informação sobre as outras 21 letras. Palavras como AUREO, HORAS, PORTA ou TERMO já fazem a maior parte do trabalho nesse sentido.

Esses dados vão ficar mais ricos com o tempo. O arquivo cresce um dia por dia — e, quando a amostra dobrar, vamos reexecutar o ranking para ver se alguma letra mudou de posição. Por enquanto, o A continua reinando com folga.

Se você ficou curioso sobre qual palavra de cinco letras — não só qual letra — é a mais eficiente como abertura, publicamos também um ranking de 20 aberturas populares testadas contra as 1.519 respostas do arquivo. Vale ler em qual é a melhor palavra para começar no Termo.