PyDataBibPub: a Python script written using ChatGPT 3.5 to automate the downloading of Spanish public libraries data

Authors

DOI:

https://doi.org/10.3145/infonomy.24.042

Keywords:

PyDataBibPub, Data, Statistics, Libraries, Public Libraries, Spain, Python, Script, ChatGPT, Artificial Intelligence, Generative Artificial Intelligence, GAI, Large Language Models, LLMs

Abstract

This paper presents PyDataBibPub, a Python script to automate the downloading of Spanish public libraries data available on the webpage Bibliotecas públicas españolas en cifras. The script was written using ChatGPT 3.5 and the paper includes an exposition of its parts and how it works. PyDataBibPub and its code are available in a project in Codeberg licensed under the GNU Affero General Public License v3.0, so that it can be reused, adapted and improved. For the future, it is proposed the installation of alternatives to ChatGPT 3.5, such as PrivateGPT, which works locally, privately and not depending on commercial companies, with the aim of developing more applications useful for the discipline of Library and Information Science.

Author Biography

Pedro Lázaro-Rodríguez, Universidad Complutense de Madrid

References

Adamson, Victor; Bägerfeldt, Johan (2023). Assessing the effectiveness of ChatGPT in generating Python code [Student thesis]. https://urn.kb.se/resolve?urn=urn:nbn:se:his:diva-22860

Blázquez-Ochando, Manuel (2024a). La IA en tus manos - Primera IA en Documentación. https://mblazquezbis.es/conocimia/wp-content/uploads/conocimIA-2024-04-26-primera-ia-documentacion.pptx

Blázquez-Ochando, Manuel (2024b). Conferencia ConocimIA - La IA en tus manos – 2024/04/26. https://www.youtube.com/watch?v=cb2n_lQ4-XE

ChatGPT Impact (2024). Scholarly Publications ChatGPT – Scientific publications by day. https://www.chatgptimpact.com/scholarly-publications/

Codina, Lluís (2023). “Buscadores alternativos a Google con IA generativa: análisis de You.com, Perplexity AI y Bing Chat”. Infonomy, v. 1, n. 1, e23002. https://doi.org/10.3145/infonomy.23.002

ConocimIA (2024a). ConocimIA: La iniciativa ConocimIA - Seminario de IA en Documentación. https://conocimia.digital/

ConocimIA (2024b). Qué es ConocimIA. https://mblazquezbis.es/conocimia/que-es-conocimia/

Diehl, Patrick; Nader, Noujoud; Brandt, Steve; Kaiser, Hartmut (2024). Evaluating AI-generated code for C++, Fortran, Go, Java, Julia, Matlab, Python, R, and Rust. Arxiv.org. https://doi.org/10.48550/arXiv.2405.13101

Franganillo, Jorge (2023). Los grandes modelos de lenguaje: una oportunidad para la profesión bibliotecaria. Anuario ThinkEPI, v. 17, e17a28. https://doi.org/10.3145/thinkepi.2023.e17a28

González-Alcaide, Gregorio (2024). Inteligencia artificial generativa: Un contexto disruptivo en el acceso a la información. Infonomy, v. 2, n. 1, e24013. https://doi.org/10.3145/infonomy.24.013

Goyanes, Manuel; Lopezosa, Carlos (2024). ChatGPT en Ciencias Sociales: revisión de la bibliografía sobre el uso de inteligencia artificial (IA) de OpenAI en investigación cualitativa y cuantitativa. Anuario ThinkEPI, v. 18, e18e04. https://doi.org/10.3145/thinkepi.2024.e18a04

Lázaro-Rodríguez, Pedro (2022). A vueltas con los datos: ¿inconsistencias en las estadísticas de bibliotecas públicas de España 2019? Recomendaciones para la mejora. OSF Preprints. https://doi.org/10.31219/osf.io/8a9dq

Lázaro-Rodríguez, Pedro (2024). Cambios en el aviso legal del Ministerio de Cultura: implicaciones positivas y más claras para los datos de bibliotecas públicas de España y una propuesta con mayor claridad. Anuario ThinkEPI, v. 18, e18e10. https://doi.org/10.3145/thinkepi.2024.e18a10

Lladós-Clos, Jordi (2024). Analysis of the utility of ChatGPT in the development of a Python application for environmental data processing [Trabajo final de grado]. Universitat Politècnica de Catalunya. http://hdl.handle.net/2117/400670

Lopezosa, Carlos (2023). La inteligencia artificial en los procesos editoriales de las revistas académicas: propuestas prácticas. Infonomy, v. 1, n. 1, e23009. https://doi.org/10.3145/infonomy.23.009

Lopezosa, Carlos (2023). Bing chat: hacia una nueva forma de entender las búsquedas. Anuario ThinkEPI, v. 17, e17a04. https://doi.org/10.3145/thinkepi.2023.e17a04

Lopezosa, Carlos; Codina, Lluís (2023). Probando Bard: así funciona la Inteligencia Artificial Generativa de Google. Anuario ThinkEPI, v. 17, e17a25. https://doi.org/10.3145/thinkepi.2023.e17a25

Martínez-Toro, Iván; Gallego-Vico, Daniel; Orgaz, Pablo (2023). PrivateGPT. https://github.com/imartinez/privateGPT

Ministerio de Cultura (2024a). Bibliotecas públicas españolas en cifras (BPEC). Portada. Ministerio de Cultura. https://www.cultura.gob.es/cultura/areas/bibliotecas/mc/ebp/portada.html

Ministerio de Cultura (2024b). Bibliotecas públicas españolas en cifras (BPEC). Anexos. Ministerio de Cultura. https://www.mcu.es/alziraweb/alziraweb.cmd?command=GetAnexos

Ministerio de Cultura (2024c). Aviso legal - | Ministerio de Cultura. https://www.cultura.gob.es/cultura/areas/bibliotecas/mc/ebp/comunes/aviso-legal.html

Torres-Salinas, Daniel; Arroyo-Machado, Wenceslao (2023). Manual de ChatGPT: aplicaciones en investigación y educación universitaria 2.0 [Computer Software]. InfluScience Ediciones. https://doi.org/10.5281/zenodo.10390816

Torres-Salinas, Daniel; Thelwall, Mike; Arroyo-Machado, Wenceslao (2024). ChatGPT for Bibliometrics: A comprehensive corpus of applications. Zenodo. https://doi.org/10.5281/zenodo.11103551

Wuisang, Marchel-Christhoper; Kurniawan, Marcel; Wira-Santosa, Komang-Andika; Santoso-Gunawan, Alexander-Agung; Saputra, Karen-Etania (2023). An evaluation of the effectiveness of OpenAI’s ChatGPT for automated Python program bug fixing using QuixBugs. En: 2023 International Seminar on Application for Technology of Information and Communication (iSemantic), 295-300. https://doi.org/10.1109/iSemantic59612.2023.10295323

Published

2024-06-21

How to Cite

Lázaro-Rodríguez, P. (2024). PyDataBibPub: a Python script written using ChatGPT 3.5 to automate the downloading of Spanish public libraries data. Infonomy, 2(3). https://doi.org/10.3145/infonomy.24.042