Resumen
El objetivo de esta artículo radica en extraer las temáticas de investigación de los resúmenes y datos bibliográficos de los artículos indexados en la base de datos Scopus y que tienen como objeto de estudio al departamento del Chocó (Colombia). De esta manera, se buscaron las palabras clave Chocó AND Colombia en la base de datos Scopus, se exportaron las referencias bibliográficas a EndNote y se extrajeron los datos de autor(es), título, publicación periódica, volumen, número, año y resumen, se convirtieron en un archivo de texto, se eliminaron referencias y símbolos. La manipulación del archivo en pdf se realizó con la ejecución de preparación del texto, tokenización, lematización y obtención de lista de bigrams que se efectuaron en el entorno de desarrollo integrado (EDI) de RStudio. Así, se encontraron 668 registros bibliográficos de documentos indexados en Scopus. Las palabras con el mayor número de frecuencia de aparición: «species», «Colombia», «Chocó», «forest», «pacific», «tropical», etcétera. Se encontraron 89 841 bigrams, entre los que destacan «new species», «pacific coast», «colombian pacific», entre otros. Las colocaciones de palabras muestran que «gold» combina con «mining», «mercury», «platinum», y así sucesivamente. «Chocó» combina con «Colombia», «biogeographical», «rain», «tropical», y demás. «Biodiversity» combina con «conservation», «tropical», «agricultural», etcétera. «Climate» combina con «change», «variability», «basin», y más. Se concluye que las palabras más frecuentes evidencian que hay una preocupación por el estudio de la minería, la biodiversidad, el cambio climático, el bosque tropical, el océano pacífico, entre otros.
Citas
Al-Betar, M. A., Abasi, A. K., Al‑Naymat, G., Arshad K. y Makhadmeh S. N. 2023. Optimization of scientific publications clustering with ensemble approach for topic extraction. Scientometrics, (128): 2819–2877. https://doi-org.biblioteca-colmex.idm.oclc.org/10.1007/s11192-023-04674-w.
Alkan, B. B., Karakuş L. y Direkci B. 2023. Knowledge discovery from the texts of Nobel Prize winners in literature: sentiment analysis and Latent Dirichlet Allocation. Scientometrics, (128): 5311–5334 (2023). https://doi-org.biblioteca-colmex.idm.oclc.org/10.1007/s11192-023-04783-6.
Benoit, K. y Nulty P. 2016. quanteda: Quantitative Analysis of Textual Data. Consultado 2 de agosto, 2023. https://CRAN.R-project.org/package=quanteda
Callon, M., Courtial J. P. y Laville F. 1991. Co-word analysis as a tool for describing the network of interactions between basic and technological research: the case of polymer chemistry. Scientometrics, 22: 155-205.
Csardi, G. y Nepusz, T. 2006. The igraph software package for complex network research. InterJournal Complex Systems, 1695. Consultado 2 de Agosto, 2023. https://igraph.org.
Contreras B., M. 2016. Minería de texto en la clasificación de material bibliográfico. Biblios, (64): 33-43. Consultado 4 de junio, 2023. https://www.redalyc.org/journal/161/16148511003/html
Contreras B., M. 2014. Minería de texto: una visión actual. Biblioteca Universitaria, 17 (2):129-138.
Corpas P., G. 2001. En torno al concepto de colocación. EUSKERA, 46: 89-108.
Eíto B., R. y Senso, J. A. 2004. Minería textual. El Profesional de la Información, 13 (1): 11-27.
Firth, F. R. 1957. Modes of Meaning. Papers in Linguistics,1934-1951. London: Oxford University Press, p. 190-215.
Feinerer, I., K. Hornik. 2023. tm: Text Mining Package. R package version 0.711. Consultado 2 de agosto, 2023. https://CRAN.R-project.org/package=tm
Gobernación del Chocó. 2023. Información general. Quibdó: Gobernación. Consultado 2 de agosto, 2023. https://www.choco.gov.co/departamento/informacion-general.
Lionel, H. y Wickham H. 2018. Purrr: Functional Programming Tools. Consultado 2 de agosto, 2023. https://CRAN.R-project.org/package=purrr.
Hornik, K. 2022. Package nlp. Consultado 2 de agosto, 2023. https://cran.r-roject.org/web/packages/NLP/NLP.pdf
Hotho, A., A. Nürnberger y G. Paaß. 2055. A brief survey of text mining. Journal for Language Technolog y and Computational Linguistics, 20 (1): 19-62.
Hosseini, S., H. Baziyad, R. Norouzi, S. Jabbedari Khiabani, G. Gidófalvi, A. Albadvi, A. Alimohammadi y S. Seyedabrishami. 2021. Mapping the intellectual structure of GIS-T field (2008–2019): a dynamic co-word analysis. Scientometrics, (126): 2667-2688.
Mendoza V., J. B. 2016. Introducción a la minería de textos con R. RPubs. Consultado 2 de Agosto, 2023. https://rpubs.com/jboscomendoza/mineria-de-textos-con-r.
Ma, Yongchao, Ying Teng, Zhongzhun Deng, Li Liu y Yi Zhang Deng. 2023. Does writing style affect gender differences in the research performance of articles? An empirical study of BERT-based textual sentiment analysis. Scientometrics, (128): 2105–2143. https://doi-org.biblioteca-colmex.idm.oclc.org/10.1007/s11192-023-04666-w.
Mariñelarena-Dondena, L., M. L. Errecalde y A. Castro S. 2017. Extracción de conocimiento con técnicas de minería de textos aplicadas a la psicología. Revista Argentina de Ciencias del Comportamiento, 9 (2): 65-76.
Montes-y-Gómez, M. 2001. Minería de texto: un nuevo reto computacional. México: Instituto Politécnico Nacional. https://ccc.inaoep.mx/~mmontesg/publicaciones/2001/MineriaTexto-md01.pdf
Muhr, D., K. Benoit y K. Watanabe. 2023. stopwords: the R package. Consultado 2 de agosto, 2023. https://cran.r-project.org/web/packages/stopwords/readme/README.html
Müller, K. y H. Wickham. 2023. tibble: Simple Data Frames. Consultado 2 de agosto, 2023. https://tibble.tidyverse.org/.
Musabirov, I. y D. Bulygin. 2020. Prototyping text mining and network analysis tools to support netnographic student projects. International Journal of Emerging Technologies in Learning (iJET), 15 (10): 223-232.
Ooms, J. 2023. Package pdftools. Consultado 2 de agosto, 2023. https://cran.r-project.org/web/packages/pdftools/pdftools.pdf.
Pedersen, T. 2022. ggraph: An Implementation of Grammar of Graphics for Graphs and Networks. Consultado 2 de Agosto, 2023. https://github.com/thomasp85/ggraph
Python. 2023. El tutorial de Python. Consultado 18 de octubre, 2023. https://docs.python.org/es/3/tutorial/
Rahimian, M., J. L. Warner, S. K. Jain, R. B. Davis, J. A. Zerillo y R. M. Joyce. 2019. Significant and distinctive n-grams in oncology notes: a text-mining method to analyze the effect of OpenNotes on clinical documentation. JCO Clinical Cancer Informatics, (3): 1-9.
Roychowdhury, K., R. Bahanja y S. Biswas. 2022. Mapping the research landscape of Covid-19 from social sciences perspective: a bibliometric analysis. Scientometrics, 127 (8): 4547-4568.
Russell, M. A. 2013. Mining the social web: data mining Facebook, Twitter, LinkedIn, Google+, GitHub, and more. O’Reilly Media, Inc.
Shen, Si, Jiangfeng Liu, Litao Lin, Ying Huang, Lin Zhang, Chang Liu, Yutong Feng y Dongbo Wang. 2023. SsciBERT: a pre-trained language model for social science texts. Scientometrics, (128): 1241–1263. https://doi-org.biblioteca-colmex.idm.oclc.org/10.1007/s11192-022-04602-4.
Silge, J. 2023. Package tidytext. Consultado 2 de agosto, 2023. https://cran.r-project.org/web/packages/tidytext/tidytext.pdf.
The R Foundation. 2023. What is R? Consultado 18 de octubre, 2023. https://www.r-project.org/about.html
Trask, A., D. Gilmore y M. Russell. 2015. Modeling order in neural word embeddings at scale. Proceedings of the 32nd International Conference on Machine Learning, 2266-2275. Lille, France: MLResearchPres.
Udanor, C. y Ch. C. Anyanwu. 2019. Combating the challenges of social media hate speech in a polarized society: a Twitter ego lexalytics approach. Data Technologies and Applications, 53 (4): 501-552.
Urbizagastegui-Alvarado, R. 2021. La bibliometría brasileña: minería de textos. Revista ACB: Biblioteconomía em Santa Catarina, 26 (1): 8-18.
Urbizagastegui-Alvarado, R. 2022. La minería de textos como subsidio para la organización de la información: un estudio exploratorio. Revista Conhecimento em Ação, 7 (2): 5-26.
Ye, Y. E. y J. C. Na. 2018. To get cited or get tweeted: a study of psychological academic articles. Online Information Review, 42 (7): 1065-1081.
Yin, X., H. Wang, P. Yin, H. Zhu y Z. Zhang. 2020. A co-occurrence-based approach of automatic keyword expansion using mass diffusion. Scientometrics, (124): 1885-1905.
Wickham, H., R. François, L. Henry, K. Müller y D. Vaughan. 2023. dplyr: a grammar of data manipulation. Consultado 2 de Agosto, 2023. https://github.com/tidyverse/dplyr.
Wickham, H., J. Hester y J. Bryan. 2023. readr: Read Rectangular Text Data. Consultado 2 de agosto, 2023. https://cran.r-project.org/web/packages/readr/index.html.
Wickham, H. 2022. Stringr: Simple, Consistent Wrappers for Common String Operations. Consultado 2 de agosto, 2023. https://cran.r-project.org/web/packages/stringr/index.html.
Wickham, H y D. Seidel. 2022. scales: Scale Functions for Visualization. Consultado 2 de Agosto, 2023. https://scales.r-lib.org. https://github.com/r-lib/scales.
Wickham, H. 2009. ggplot2: Elegant Graphics for Data Analysis. New York: Springer-Verlag. https://link-springer-com.biblioteca-colmex.idm.oclc.org/book/10.1007/978-0-387-98141-3.
Wickham, Hadley y Francois Romain. 2016. dplyr: A Grammar of Data Manipulation. Consultado 2 de Agosto, 2023. https://CRAN.R-project.org/package=dplyr.
Zhang,Tingting, Baozhen Lee, Qinghua Zhu, Xi Han y Ke Chen. 2023. Document keyword extraction based on semantic hierarchical graph model. Scientometrics, (128): 2623–2647. https://doi-org.biblioteca-colmex.idm.oclc.org/10.1007/s11192-023-04677-7
Los autores:
- Deben remitir a Investigación Bibliotecológica: archivonomía, bibliotecología e información la Carta de autorización para la publicación de artículos.
- pueden usar su obra para compartir con la comunidad científica en los ámbitos siguientes:
- Apoyo a la docencia.
- Realizar conferencias.
- Autoarchivo en repositorios académicos.
- Difundir en redes académicas.
- Difundir en blogs y sitios personales del autor.
Ello será posible siempre y cuando se respeten las condiciones de uso de los contenidos de la revista, según la licencia Creative Commons:Atribución – No comercial – Sin Derivar 4.0.
Política de autoarchivo
En el caso de la publicación de la obra como autoarchivo, los autores deben cumplir con los aspectos siguientes:
a) Reconocer el derecho de autor a la RIB.
b) Establecer un enlace con la versión original de la contribución a la página de la revista donde se encuentre el artículo.
c) Difundir la versión definitiva publicada en la revista.
Licencia de los contenidos
La revista Investigación Bibliotecológica: archivonomía, bibliotecología e información permite el acceso y uso de sus contenidos según la licencia Creative Commons: Atribución – No comercial – Sin Derivar 4.0.

Ello implica que los contenidos sólo pueden ser leídos y compartidos siempre que se reconozca y se cite la autoría de la obra. No se puede usar la obra para fines comerciales ni modificarla.
Deslinde de responsabilidades
La RIB no se hace responsable en caso de que el autor haya incurrido en fraude o plagio científico, tampoco de los criterios reflejados por los autores. De igual forma, no es responsable por los servicios ofrecidos por terceros a partir de los enlaces electrónicos disponibles en los artículos de los autores.
En apoyo a ello, la RIB pone a disposición las responsabilidades que el autor debe cumplir en el proceso de publicación en la revista Investigación Bibliotecológica: archivonomía, bibliotecología e información en el enlace siguiente: Responsabilidades del autor.
En caso de migrar los contenidos del sitio oficial de la RIB, con implicaciones de cambio de IP o dominio, el director o editor de la revista informará a los autores sobre ello.

