Nossa Metodologia
Você tem o direito de saber exatamente de onde vêm os números e definições que vê no DicionarioWize. Esta página expõe, em português claro, nossas fontes, nosso processamento e os limites dos nossos dados. Nada fica escondido atrás da fórmula «dados proprietários».
Fonte primária de frequência
Nossa base de vocabulário português é construída a partir de listas de frequência derivadas de corpora lusófonos públicos e de referências lexicográficas estabelecidas. Para cada palavra, extraímos a forma canônica, a classe gramatical (substantivo, verbo, adjetivo, advérbio, etc.), a transcrição fonética quando disponível, e a frequência de uso no corpus de referência.
Referências lexicográficas utilizadas
Para definições, etimologias e exemplos, apoiamo-nos nas grandes referências do português. Estas são também as fontes que recomendamos consultar para qualquer verificação:
- Wikcionário — dicionário colaborativo multilíngue com etimologias detalhadas, sob licença CC BY-SA.
- Dicionário Priberam da Língua Portuguesa — referência de prestígio em Portugal para o uso contemporâneo, com definições claras e registo cuidadoso do português europeu.
- Michaelis — dicionário brasileiro de referência, útil para o português do Brasil e suas particularidades lexicais.
- Infopédia (Porto Editora) — referência portuguesa para etimologia, registos e nuances de uso no português europeu.
- Corpus do Português (Mark Davies) — grande corpus linguístico de referência para estudos de frequência e uso em português brasileiro e europeu.
Classificação por nível (A1 a C2)
Cada palavra recebe um nível de aprendizado baseado numa combinação de sua frequência nos corpora e de sua presença em listas de vocabulário amplamente utilizadas, notadamente:
- o Quadro Europeu Comum de Referência para as Línguas (QECR) A1 a C2, que estrutura o ensino de português como língua estrangeira,
- os referenciais do CELPE-Bras (Certificado de Proficiência em Língua Portuguesa para Estrangeiros), o exame oficial do governo brasileiro gerido pelo Inep,
- as listas oficiais do CAPLE (Centro de Avaliação de Português Língua Estrangeira), da Universidade de Lisboa, que administra os exames CIPLE (A2), DEPLE (B1), DIPLE (B2), DAPLE (C1) e DUPLE (C2).
Palavras comuns na conversa do dia a dia recebem o nível «básico» (A1-A2); as que aparecem principalmente na imprensa e em comunicação profissional, o nível «intermediário» (B1-B2); as da imprensa de referência e da literatura contemporânea, o nível «avançado» (C1); e as próprias do registo acadêmico ou jurídico, o nível «acadêmico» (C2). O mapeamento é determinístico e inteiramente reproduzível a partir dos dados.
Português brasileiro e português europeu
Este é um ponto que merece transparência. O português tem duas variantes principais (brasileira e europeia) e várias variantes menores (angolana, moçambicana, caboverdiana, etc.) que diferem ligeiramente em vocabulário, grafia e uso. Nossa base inclina-se para o uso geral compartilhado, mas não distingue sempre entre as variantes. Quando a diferença for importante, consulte o Michaelis para o português brasileiro ou a Infopédia/Priberam para o português europeu.
Processo de construção e atualização
- Ingestão— as listas de frequência de origem são importadas numa base de dados SQLite local.
- Limpeza— conteúdos não portugueses, artefatos de codificação e campos vazios são removidos.
- Derivação— os níveis, percentis de frequência, relações sinônimo/antônimo e índices por letra e por comprimento são calculados de maneira determinística a partir dos registros limpos.
- Ligação cruzada— as traduções de um subconjunto de palavras são unidas aos nossos dicionários irmãos (VocabWize para inglês, VocabLibre para francês, WortWize para alemão, KalimaWize para árabe, KotobaPeek para japonês) a fim de construir ligações diretas entre idiomas.
- Publicação— a base é empacotada com o site no momento da geração, de modo que cada página é produzida a partir do mesmo instantâneo verificado.
Frequência de atualização
Os dados lexicográficos portugueses evoluem lentamente; o léxico não muda de hora em hora. Atualizamos nosso conjunto de dados numa cadência mensal, ou imediatamente quando uma fonte publica uma correção significativa. Cada página mostra uma etiqueta «última atualização» legível para que você sempre saiba a procedência do que está consultando.
Verificação cruzada
Não pedimos que você acredite em nossa palavra. Para qualquer entrada que lhe suscite dúvidas, encorajamos a comparar com estas referências públicas autorizadas:
- Priberam — referência para o português europeu contemporâneo.
- Michaelis — referência para o português brasileiro contemporâneo.
- Infopédia — autoridade portuguesa sobre etimologia e registos.
- Wikcionário — dicionário colaborativo com etimologias detalhadas.
Limites que você deve conhecer
- Variações regionais. Nossas definições se inclinam para o uso geral contemporâneo compartilhado entre o português brasileiro e europeu, mas nem sempre distinguem entre variantes. Para nuance regional específica, consulte um dicionário da variante.
- Neologismos. Palavras muito recentes (criadas nos últimos 12 meses) podem estar ausentes ou com dados esparsos. São as entradas mais propensas a serem atualizadas no próximo ciclo.
- Nomes próprios e jargão. O vocabulário técnico, médico ou jurídico especializado está representado, mas não constitui nossa prioridade. Para trabalho especializado, utilize uma referência de domínio.
- A frequência é global. Uma palavra pode ser rara num registo (digamos, português jurídico) e comum noutro (conversa diária). Nossos percentis descrevem o uso geral, não o uso por registo.
Correções e feedback
Se encontrar uma definição incorreta, um sentido ausente, ou um nível que não corresponda à sua experiência, queremos saber. Entre em contato conosco com a palavra e o que mudaria. Seguimos cada pedido de correção.
Esta página foi revisada pela última vez em março de 2026. Mudanças substanciais na maneira como construímos o conjunto de dados serão refletidas aqui antes de chegarem às páginas de produção.