readabilityes

🇪🇸 Introducción (Español)

readabilityes ofrece herramientas para tokenizar, segmentar y medir la legibilidad de textos en español. Incluye:

Segmentación de oraciones respetando abreviaturas (p. ej., Sr., Dra.), iniciales (J. R. R.), elipsis y decimales.
Tokenización de palabras con control de minúsculas, tildes, puntuación, guiones, números y símbolos/emoji.
Conteos básicos: palabras, oraciones, sílabas (aprox. ES).
Métricas promedio por palabra (sílabas/letras/caracteres).
Índices de legibilidad usados en español:
- Szigriszt–Pazos (szigriszt_pazos()).
- INFLESZ (inflesz(), devuelve puntaje + categoría).
- Gutiérrez de Polini (gutierrez_de_polini()).

Instalación

Versión de desarrollo desde GitHub:

# install.packages("devtools")
devtools::install_github("JFormoso/readabilityes")

Ejemplo rápido

txt <- c(
  "Hola. ¿Cómo estás? ¡Todo bien!",
  "La legibilidad facilita la comprensión del texto por parte de las personas lectoras."
)

# Oraciones y palabras
segment_sentences(txt)
#> [[1]]
#> [1] "Hola."        "¿Cómo estás?" "¡Todo bien!" 
#> 
#> [[2]]
#> [1] "La legibilidad facilita la comprensión del texto por parte de las personas lectoras."
count_sentences(txt, drop_empty = TRUE)
#> [1] 3 1
tokenize_words(txt)
#> [[1]]
#> [1] "hola"  "cómo"  "estás" "todo"  "bien" 
#> 
#> [[2]]
#>  [1] "la"          "legibilidad" "facilita"    "la"          "comprensión"
#>  [6] "del"         "texto"       "por"         "parte"       "de"         
#> [11] "las"         "personas"    "lectoras"

# Sílabas y promedios
count_syllables(txt)
#> [1]  9 28
avg_syllables_per_word(txt)
#> [1] 1.800000 2.153846

# Índices de legibilidad
szigriszt_pazos(txt)
#> [1] 93.02833 59.65038
inflesz(txt)                 
#>      score  category
#> 1 93.02833 Muy fácil
#> 2 59.65038    Normal
gutierrez_de_polini(txt)
#> [1] 77.15667 69.75769

🇬🇧 Introduction (English)

readabilityes provides tools to tokenize, segment, and assess readability for Spanish-language texts. It includes:

Sentence segmentation that respects abbreviations (e.g., Sr., Dra.), initials (J. R. R.), ellipses, and decimals.
Word tokenization with controls for lowercasing, accents, punctuation, hyphens, numbers, and symbols/emoji.
Basic counts: words, sentences, syllables (approx. ES).
Per-word averages (syllables/letters/characters).
Readability indices commonly used in Spanish:
- Szigriszt–Pazos (szigriszt_pazos()).
- INFLESZ (inflesz(), returns score + category).
- Gutiérrez de Polini (gutierrez_de_polini()).

Installation

Install the development version from GitHub:

# install.packages("devtools")
devtools::install_github("JFormoso/readabilityes")

Quick example

txt <- c(
  "Hola. ¿Cómo estás? ¡Todo bien!",
  "La legibilidad facilita la comprensión del texto por parte de las personas lectoras."
)

# Sentences and words
segment_sentences(txt)
#> [[1]]
#> [1] "Hola."        "¿Cómo estás?" "¡Todo bien!" 
#> 
#> [[2]]
#> [1] "La legibilidad facilita la comprensión del texto por parte de las personas lectoras."
count_sentences(txt, drop_empty = TRUE)
#> [1] 3 1
tokenize_words(txt)
#> [[1]]
#> [1] "hola"  "cómo"  "estás" "todo"  "bien" 
#> 
#> [[2]]
#>  [1] "la"          "legibilidad" "facilita"    "la"          "comprensión"
#>  [6] "del"         "texto"       "por"         "parte"       "de"         
#> [11] "las"         "personas"    "lectoras"

# Syllables and averages
count_syllables(txt)
#> [1]  9 28
avg_syllables_per_word(txt)
#> [1] 1.800000 2.153846

# Readability indices
szigriszt_pazos(txt)
#> [1] 93.02833 59.65038
inflesz(txt)                  
#>      score  category
#> 1 93.02833 Muy fácil
#> 2 59.65038    Normal
gutierrez_de_polini(txt)
#> [1] 77.15667 69.75769

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
.github		.github
R		R
inst		inst
man		man
tests		tests
.Rbuildignore		.Rbuildignore
.gitignore		.gitignore
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
DESCRIPTION		DESCRIPTION
LICENSE		LICENSE
LICENSE.md		LICENSE.md
NAMESPACE		NAMESPACE
NEWS.md		NEWS.md
README.Rmd		README.Rmd
README.md		README.md
_pkgdown.yml		_pkgdown.yml
readabilityes.Rproj		readabilityes.Rproj

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Licenses found

Uh oh!

Repository files navigation

readabilityes

🇪🇸 Introducción (Español)

Instalación

Ejemplo rápido

🇬🇧 Introduction (English)

Installation

Quick example

About

Licenses found

Uh oh!

Releases 3

Packages

Languages

License

Licenses found

JFormoso/readabilityes

Folders and files

Latest commit

History

Repository files navigation

readabilityes

🇪🇸 Introducción (Español)

Instalación

Ejemplo rápido

🇬🇧 Introduction (English)

Installation

Quick example

About

Resources

License

Licenses found

Code of conduct

Contributing

Uh oh!

Stars

Watchers

Forks

Releases 3

Packages 0

Languages

Packages