DOI: http://dx.doi.org/10.22201/iibi.24488321xe.2021.88.58389

Descubrimiento de conocimientos mediante técnicas de minería de textos aplicadas a documentos textuales de la investigación policial brasileña

Marcio Ponciano da Silva, Angel Freddy Godoy Viera

Resumen


El objetivo de este estudio es analizar cómo las técnicas de minería de textos aplicadas a documentos textuales de la investigación policial brasileña pueden promover el descubrimiento de conocimiento. La investigación recopiló documentos de la investigación policial y los sometió al proceso de minería de textos. El estudio utilizó las técnicas de plegado de casos, tokenización, palabras vacías personalizadas, bolsa de palabras y TF-IDF para extraer los resultados en ngramas. Los resultados se presentaron con nubes de palabras. En la investigación, se utilizaron k-medias para agrupar los conjuntos de trigramas, identificando en cada grupo los términos más representativos de los grupos. El uso de técnicas de minería de textos en estos documentos tenía como objetivo extraer conocimientos no triviales. Las técnicas de minería de texto, o descubrimiento de conocimiento en una base de datos textual, tienen el propósito de descubrir patrones inobservables cuando se analizan mediante manipulación humana de grandes volúmenes de documentos. Los resultados encontrados favorecieron el descubrimiento de conocimientos en la identificación de entidades y conexiones, así como categorías temáticas de la investigación.


Palabras clave


Investigación Policial; Descubrimiento del Conocimiento; Extracción de Textos



DOI: http://dx.doi.org/10.22201/iibi.24488321xe.2021.88.58389
Herramientas del artículo
Envíe este artículo por correo electrónico (Inicie sesión)
Enviar un correo electrónico al autor/a (Inicie sesión)
Acerca de los autores/as

Marcio Ponciano da Silva orcid
Brasil

Angel Freddy Godoy Viera orcid
Brasil

FacebookTwitterInstagram

Investigación Bibliotecológica: archivonomía, bibliotecología e información, Vol. 36, No. 90, Enero-Marzo 2022, es una publicación trimestral editada por la Universidad Nacional Autónoma de México, Ciudad Universitaria, Delegación Coyoacán, Ciudad de México, C.P. 04510, a través del Instituto de Investigaciones Bibliotecológicas y de la Información, Circuito Escolar s/n, Torre II de Humanidades, Piso 12, Ciudad Universitaria, Col. Copilco, Del. Coyoacán, Ciudad de México, C.P. 04510, Tel. 56230349 y 56230337, http://rev-ib.unam.mx/ib, correos electrónicos: revista@iibi.unam.mx, drevista@iibi.unam.mx. Editor responsable: Dr. Egbert John Sánchez Vanderkast, Reserva de Derechos al uso Exclusivo No. 04-2017-061519123100-102, ISSN: 2448-8321, ambos otorgados por el Instituto Nacional del Derecho de Autor. Responsable de la última actualización de este número, Dra. María de Jesús Madera Jaramillo, Instituto de Investigaciones Bibliotecológicas y de la Información, Circuito Escolar s/n, Torre II de Humanidades, Piso 12, Ciudad Universitaria, Col. Copilco, Alcadía Coyoacán, Ciudad de México, C.P. 04510, Tel. 56230337, fecha de la última modificación, diciembre 2021.

Las opiniones expresadas por los autores no necesariamente reflejan la postura del editor de la publicación. Se autoriza la reproducción total o parcial de los textos aquí publicados siempre y cuando se cite la fuente completa y la dirección electrónica de la publicación.


Licencia de Creative Commons


Investigación Bibliotecológica: archivonomía, bibliotecología e información por Universidad Nacional Autónoma de México se distribuye bajo una Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.
Creado a partir de la obra en http://rev-ib.unam.mx/ib.