Introducción al análisis de textos con Quanteda
DOI:
https://doi.org/10.3145/infonomy.25.040Palabras clave:
Análisis de textos, Quanteda, Humanidades digitales, R, Análisis cuantitativo, Minería de textos, Procesamiento del lenguaje natural, Topic modeling, Visualización de datos, Metodología computacionalResumen
El análisis cuantitativo de textos se ha consolidado como una metodología clave en el marco del giro computacional de las ciencias sociales y las humanidades. Este artículo presenta una introducción aplicada al uso del paquete Quanteda para el análisis sistemático de corpus textuales en el entorno R. El objetivo es mostrar, mediante un enfoque tutorial, cómo diseñar y ejecutar un flujo básico de análisis de textos cuantitativo. Para ello, se emplea como caso de estudio un conjunto de entradas del diario de Alexéi Navalny, sobre el que se aplican procesos de carga, limpieza, tokenización y eliminación de palabras vacías. Los resultados obtenidos a través del análisis de frecuencias, nubes de palabras y modelado de temas evidencian la capacidad de Quanteda para identificar patrones léxicos y temáticos relevantes. El trabajo demuestra que Quanteda es accesible, reproducible y especialmente adecuado para contextos docentes e investigaciones exploratorias en humanidades digitales.Citas
Arcila-Calderón, Carlos; Barbosa-Caro, Eduar; Cabezuelo-Lorenzo, Francisco (2016). Técnicas big data: Análisis de textos a gran escala para la investigación científica y periodística. El Profesional de la Información, 25(4), 623-631. https://doi.org/10.3145/epi.2016.jul.12
Arnold, Taylor; Ballier, Nicolas; Lissón, Paula; Tilton, Lauren (2019). Beyond lexical frequencies: Using R for text analysis in the digital humanities. Language Resources and Evaluation, 53(4), 707-733. https://doi.org/10.1007/s10579-019-09456-6
Benoit, Kenneth; Watanabe, Kohei; Wang, Haiyan; Nulty, Paul; Obeng, Adam; Müller, Stefan; Matsuo, Akitaka (2018). Quanteda: An R package for the quantitative analysis of textual data. Journal of Open Source Software, 3(30), 774. https://doi.org/10.21105/joss.00774
Berry, David M. (2011). The computational turn: Thinking about the digital humanities. Culture Machine, 12. https://culturemachine.net/wp-content/uploads/2019/01/10-Computational-Turn-440-893-1-PB.pdf
Gallego-Cuiñas, Ana; Torres-Salinas, Daniel (Eds.). (2024). Humanities and Big Data in Ibero-America: Theory, methodology and practical applications. De Gruyter. https://doi.org/10.1515/9783110753523
Grolemund, G. (2014). Hands-on programming with R: Write your own functions and simulations (Primer). O’Reilly Media.
Navalny, Alexéi (2024). Patriot: A memoir. Alfred A. Knopf.
R Core Team (2021). R: A Language and environment for statistical computing (Version 4.1.2) [Software]. R Foundation for Statistical Computing. https://www.r-project.org
Stone, Philip J. (2020). Thematic text analysis: New agendas for analyzing text content. In C. W. Roberts (Ed.). Text analysis for the social sciences (1st ed., pp. 35-54). Routledge. https://doi.org/10.4324/9781003064060-3
Wickham, H.; Grolemund, G. (2017). R for data science: Import, tidy, transform, visualize, and model data (Primer). O’Reilly Media.
Descargas
Publicado
Cómo citar
Descargas
Dimensions
Número
Sección
Licencia
Derechos de autor 2025 Sergio Castro-Cortacero, Nicolás Robinson-García

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.