Skip to content

fserb/pt-br

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

21 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Dictionary collection in Portuguese (pt-BR)

Comprehensive Portuguese linguistic corpus with lexicon, verbs, conjugations, and ICF scores.
Contains 145,744 lexical entries, 4,023 verbs, 195,751 conjugations, and 419,486 ICF-scored words.

Coleção de dicionários em Português (pt-BR)

Corpus linguístico abrangente com léxico, verbos, conjugações e pontuações ICF.
Contém 145.744 entradas lexicais, 4.023 verbos, 195.751 conjugações e 419.486 palavras com pontuação ICF.

Arquivos de Dados

  • lexico - Léxico completo de palavras portuguesas de múltiplas fontes dicionárias (145.744 entradas)
  • icf - Pontuações de Frequência Inversa de Corpus para palavras portuguesas (419.486 entradas)
  • conjugações - Todas as conjugações verbais (195.751 formas)
  • listas/verbos - Lista de verbos portugueses (4.023 verbos)
  • listas/ - Listas especializadas: continentes, paises, estados-br, municipios-br, negativas

ICF (Inverse Corpus Frequency)

ICF é uma medida de raridade/importância da palavra calculada como o inverso da frequência com que uma palavra aparece em múltiplos corpora portugueses. Pontuações ICF mais baixas indicam palavras mais comuns (ex: "de" = 3,02), enquanto pontuações mais altas indicam termos mais raros e especializados. Isso substitui a abordagem anterior de TF (Term Frequency) e fornece melhor ponderação para análise de conteúdo e aplicações de processamento de linguagem.

About

Lista de palavras em Português

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •