Subir material

Suba sus trabajos a SEDICI, para mejorar notoriamente su visibilidad e impacto

 

Mostrar el registro sencillo del ítem

dc.date.accessioned 2019-02-12T12:41:09Z
dc.date.available 2019-02-12T12:41:09Z
dc.date.issued 2018
dc.identifier.uri http://sedici.unlp.edu.ar/handle/10915/72173
dc.description.abstract En este trabajo se muestran resultados preliminares obtenidos al aplicar la técnica de clustering basado en k-means y un modelado de tópicos usando Latent Dirichlet Allocation (LDA) sobre un corpus de registros de la base de datos Scopus utilizando paquetes del lenguaje R. El objetivo general es detectar aquellas áreas que permitan estimar el esfuerzo que realizan los recursos humanos de investigación de determinado lugar geográfico para abordar los problemas que son propios de ese territorio y sus habitantes. Por ello, el corpus responde a una estrategia de búsqueda que comprende la producción del gran área Ciencias Sociales & Humanas en el periodo 2010-2015, restringida a aquellos trabajos que tuvieran algún autor con afiliación argentina, además de contener Argentina (o alguna de sus variaciones explicitadas en la estrategia de búsqueda) en los campos título, resumen y palabras clave. Para el procesamiento se utilizaron los paquetes bibliometrix (2017), que sirve para realizar análisis bibliométricos y de co-citación; el paquete topicsmodels (2017) que permite implementar LDA y CTM (Correlated Topics Models); el paquete tidytext (2017) que permite aplicar algunas técnicas de procesamiento del lenguaje natural dentro de las cuales se encuentra la detección de n-gramas. En este trabajo, se procedió a sacar bigramas y se los interpretó de manera cualitativa, detectando 7 áreas (ver referencia de colores en figura 1). Se generaron los clusters mediante la técnica de K-medias y se procedió a realizar un análisis de los clusters obtenidos a la luz de las categorías que se derivaron de los bigramas. Luego se realizó lo mismo aplicando modelado de tópicos con LDA. es
dc.format.extent 27-28 es
dc.language es es
dc.subject cienciometría es
dc.subject Clustering es
dc.subject modelado de tópicos es
dc.subject Latent Drichlet Allocation (LDA) en
dc.title Uso de R en bibliometría: exploración de técnicas para la detección de temas locales de investigación es
dc.type Objeto de conferencia es
sedici.identifier.uri http://47jaiio.sadio.org.ar/sites/default/files/LatinR_16.pdf es
sedici.identifier.issn 2618-3196 es
sedici.creator.person González, Claudia M. es
sedici.creator.person Varela, Sebastián es
sedici.creator.person Miguel, Sandra es
sedici.subject.materias Ciencias Informáticas es
sedici.description.fulltext true es
mods.originInfo.place Sociedad Argentina de Informática e Investigación Operativa es
sedici.subtype Resumen es
sedici.rights.license Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0)
sedici.rights.uri http://creativecommons.org/licenses/by-sa/3.0/
sedici.date.exposure 2018-09
sedici.relation.event Conferencia Latinoamericana sobre Uso de R en Investigación + Desarrollo (LatinR 2018) - JAIIO 47 (CABA, 2018) es
sedici.description.peerReview peer-review es


Descargar archivos

Este ítem aparece en la(s) siguiente(s) colección(ones)

Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0) Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0)