Algoritmo para el análisis temático de documentos digitales
PDF
HTML

Palabras clave

Asignación Latente de Dirichlet
Algoritmos
Análisis Temático
Documentos Digitales

Cómo citar

Polo Bautista, L. R., & Martínez Acevedo, K. V. (2021). Algoritmo para el análisis temático de documentos digitales. Investigación Bibliotecológica: Archivonomía, bibliotecología E información, 35(89), 13–31. https://doi.org/10.22201/iibi.24488321xe.2021.89.58419
Métricas de PLUMX

Resumen

El objetivo del artículo es presentar un algoritmo para asignar áreas temáticas a documentos digitales que sirva como herramienta de apoyo al análisis temático dentro de la organización de la información, con el fin de ser implementado en el desarrollo de vocabularios controlados. La metodología utilizada consistió en aplicar el Reconocimiento Óptico de Caracteres (ROC) y la Asignación Latente de Dirichlet (ALD) como las principales herramientas para el desarrollo de un algoritmo basado en el lenguaje de programación Python, que permite la lectura de archivos con extensión PDF para la obtención de los principales temas del corpus textual. Los resultados de la aplicación del algoritmo demuestran su utilidad en el área de la indización como un sistema para identificar y extraer temas relevantes de un documento específico en formato electrónico, permitiendo la automatización de procesos por parte del profesional de la información. De esta forma, se concluye su uso como desarrollo de puntos de acceso alternativos en función del contenido de los textos.

https://doi.org/10.22201/iibi.24488321xe.2021.89.58419
PDF
HTML

Los autores:

  • Deben remitir a Investigación Bibliotecológica: archivonomía, bibliotecología e información la Carta de autorización para la publicación de artículos. 
  • pueden usar su obra para compartir con la comunidad científica en los ámbitos siguientes:
    • Apoyo a la docencia.
    • Realizar conferencias.
    • Autoarchivo en repositorios académicos.
    • Difundir en redes académicas.
    • Difundir en blogs y sitios personales del autor.

Ello será posible siempre y cuando se respeten las condiciones de uso de los contenidos de la revista, según la licencia Creative Commons:Atribución – No comercial – Sin Derivar 4.0.

Política de autoarchivo

En el caso de la publicación de la obra como autoarchivo, los autores deben cumplir con los aspectos siguientes:

a) Reconocer el derecho de autor a la RIB.

b) Establecer un enlace con la versión original de la contribución a la página de la revista donde se encuentre el artículo.

c) Difundir la versión definitiva publicada en la revista.

Licencia de los contenidos

La revista Investigación Bibliotecológica: archivonomía, bibliotecología e información permite el acceso y uso de sus contenidos según la licencia Creative Commons: Atribución – No comercial – Sin Derivar 4.0.

Licencia de Creative Commons

Ello implica que los contenidos sólo pueden ser leídos y compartidos siempre que se reconozca y se cite la autoría de la obra. No se puede usar la obra para fines comerciales ni modificarla.

Deslinde de responsabilidades

La RIB no se hace responsable en caso de que el autor haya incurrido en fraude o plagio científico, tampoco de los criterios reflejados por los autores. De igual forma, no es responsable por los servicios ofrecidos por terceros a partir de los enlaces electrónicos disponibles en los artículos de los autores.

En apoyo a ello, la RIB pone a disposición las responsabilidades que el autor debe cumplir en el proceso de publicación en la revista Investigación Bibliotecológica: archivonomía, bibliotecología e información en el enlace siguiente: Responsabilidades del autor.

En caso de migrar los contenidos del sitio oficial de la RIB, con implicaciones de cambio de IP o dominio, el director o editor de la revista informará a los autores sobre ello.

Descargas

Los datos de descargas todavía no están disponibles.