Measure of Lexical Richness

Voor toelichting zie readme.md.

MLR van deze tekst is {{transform_printFloat(mlr,2)}}. Indicatie woordvoorraad op basis van MLR-25 is {{transform_printInt(mlr_25)}} woorden.

Lijstverdeling tokens
Lijst Aantal Percentage Cumulatief
{{list.title}} {{transform_printInt(list.totalTokens) || ""}} {{transform_printFloat(list.percentageOfTotalTokens,2)}} {{transform_printFloat(list.cumulativePercentageOfTotalTokens,2)}}
Lijstverdeling lemma's
Lijst Aantal Percentage Cumulatief
{{list.title}} {{transform_printInt(list.totalLemmas) || ""}} {{transform_printFloat(list.percentageOfTotalLemmas,2)}} {{transform_printFloat(list.cumulativePercentageOfTotalLemmas,2)}}
{{list.title}}
Lemma Frequentie
{{list.lemma}} {{transform_printInt(list.frequency)}}

Bij een kennis van het aantal woorden in de eerste kolom van deze tabel is de geschatte lemmadekking voor deze tekst weergegeven in de tweede kolom. De staafdiagram in de tweede kolom geeft daarnaast een visuele indicatie van de verhouding tussen bekende en onbekende lemma's. Voor een goed tekstbegrip moet meer dan 87% van de lemma's bekend zijn.

Woordenschat Lemmadekking
{{transform_printInt(listSizes[index])}} {{transform_printFloat(list.cumulativePercentageOfTotalLemmas,2)}}

Dit project wordt onderhouden op Github door Lukas Vermeer en Anne Vermeer.


De geladen MLR dataset bevat {{transform_printInt(source_tokenCount)}} tokens en {{transform_printInt(source_lemmaCount)}} lemmas.

  • {{ item.type }} {{ item.description }}

Interne representatie van alle tokens in de geladen MLR dataset.

{{JSON.stringify(mlr_data.tokens, undefined, 4)}}

Interne representatie van alle lemmas in de geladen MLR dataset.

{{JSON.stringify(mlr_data.lemmas, undefined, 4)}}

Interne representatie van de ingevoerde tekst.

{{JSON.stringify(text, undefined, 4)}}

Interne representatie de statistieken op basis van de ingevoerde tekst.

{{JSON.stringify(statistics, undefined, 4)}}