Introducción al análisis de textos con Quanteda

Autores/as

DOI:

https://doi.org/10.3145/infonomy.25.040

Palabras clave:

Análisis de textos, Quanteda, Humanidades digitales, R, Análisis cuantitativo, Minería de textos, Procesamiento del lenguaje natural, Topic modeling, Visualización de datos, Metodología computacional

Resumen

El análisis cuantitativo de textos se ha consolidado como una metodología clave en el marco del giro computacional de las ciencias sociales y las humanidades. Este artículo presenta una introducción aplicada al uso del paquete Quanteda para el análisis sistemático de corpus textuales en el entorno R. El objetivo es mostrar, mediante un enfoque tutorial, cómo diseñar y ejecutar un flujo básico de análisis de textos cuantitativo. Para ello, se emplea como caso de estudio un conjunto de entradas del diario de Alexéi Navalny, sobre el que se aplican procesos de carga, limpieza, tokenización y eliminación de palabras vacías. Los resultados obtenidos a través del análisis de frecuencias, nubes de palabras y modelado de temas evidencian la capacidad de Quanteda para identificar patrones léxicos y temáticos relevantes. El trabajo demuestra que Quanteda es accesible, reproducible y especialmente adecuado para contextos docentes e investigaciones exploratorias en humanidades digitales.

Biografía del autor/a

Sergio Castro-Cortacero, Universidad de Granada

Nicolás Robinson-García, Universidad de Granada

Citas

Arcila-Calderón, Carlos; Barbosa-Caro, Eduar; Cabezuelo-Lorenzo, Francisco (2016). Técnicas big data: Análisis de textos a gran escala para la investigación científica y periodística. El Profesional de la Información, 25(4), 623-631. https://doi.org/10.3145/epi.2016.jul.12

Arnold, Taylor; Ballier, Nicolas; Lissón, Paula; Tilton, Lauren (2019). Beyond lexical frequencies: Using R for text analysis in the digital humanities. Language Resources and Evaluation, 53(4), 707-733. https://doi.org/10.1007/s10579-019-09456-6

Benoit, Kenneth; Watanabe, Kohei; Wang, Haiyan; Nulty, Paul; Obeng, Adam; Müller, Stefan; Matsuo, Akitaka (2018). Quanteda: An R package for the quantitative analysis of textual data. Journal of Open Source Software, 3(30), 774. https://doi.org/10.21105/joss.00774

Berry, David M. (2011). The computational turn: Thinking about the digital humanities. Culture Machine, 12. https://culturemachine.net/wp-content/uploads/2019/01/10-Computational-Turn-440-893-1-PB.pdf

Gallego-Cuiñas, Ana; Torres-Salinas, Daniel (Eds.). (2024). Humanities and Big Data in Ibero-America: Theory, methodology and practical applications. De Gruyter. https://doi.org/10.1515/9783110753523

Grolemund, G. (2014). Hands-on programming with R: Write your own functions and simulations (Primer). O’Reilly Media.

Navalny, Alexéi (2024). Patriot: A memoir. Alfred A. Knopf.

R Core Team (2021). R: A Language and environment for statistical computing (Version 4.1.2) [Software]. R Foundation for Statistical Computing. https://www.r-project.org

Stone, Philip J. (2020). Thematic text analysis: New agendas for analyzing text content. In C. W. Roberts (Ed.). Text analysis for the social sciences (1st ed., pp. 35-54). Routledge. https://doi.org/10.4324/9781003064060-3

Wickham, H.; Grolemund, G. (2017). R for data science: Import, tidy, transform, visualize, and model data (Primer). O’Reilly Media.

Descargas

Publicado

2026-01-14

Cómo citar

Castro-Cortacero, S., & Robinson-García, N. (2026). Introducción al análisis de textos con Quanteda. Infonomy, 3(6). https://doi.org/10.3145/infonomy.25.040

Descargas

Los datos de descargas todavía no están disponibles.

Dimensions

Número

Sección

Investigación