Comprehensive Portuguese linguistic corpus with lexicon, verbs, conjugations, and ICF scores.
Contains 145,744 lexical entries, 4,023 verbs, 195,751 conjugations, and 419,486 ICF-scored words.
Corpus linguístico abrangente com léxico, verbos, conjugações e pontuações ICF.
Contém 145.744 entradas lexicais, 4.023 verbos, 195.751 conjugações e 419.486 palavras com pontuação ICF.
- lexico - Léxico completo de palavras portuguesas de múltiplas fontes dicionárias (145.744 entradas)
- icf - Pontuações de Frequência Inversa de Corpus para palavras portuguesas (419.486 entradas)
- conjugações - Todas as conjugações verbais (195.751 formas)
- listas/verbos - Lista de verbos portugueses (4.023 verbos)
- listas/ - Listas especializadas: continentes, paises, estados-br, municipios-br, negativas
ICF é uma medida de raridade/importância da palavra calculada como o inverso da frequência com que uma palavra aparece em múltiplos corpora portugueses. Pontuações ICF mais baixas indicam palavras mais comuns (ex: "de" = 3,02), enquanto pontuações mais altas indicam termos mais raros e especializados. Isso substitui a abordagem anterior de TF (Term Frequency) e fornece melhor ponderação para análise de conteúdo e aplicações de processamento de linguagem.