Upload resources

Upload your works to SEDICI to increase its visibility and improve its impact

 

Show simple item record

dc.date.accessioned 2019-02-28T17:35:50Z
dc.date.available 2019-02-28T17:35:50Z
dc.date.issued 2018
dc.identifier.uri http://sedici.unlp.edu.ar/handle/10915/72761
dc.description.abstract La minería de textos está compuesta por técnicas que permiten descubrir patrones en un conjunto grande de documentos. El primer paso de este análisis consiste en el procesamiento de los textos originales a fin de convertirlos en una matriz de términos de documentos, previa creación y limpieza del corpus; este paso puede ser desarrollado empleando el paquete tm. La siguiente etapa consiste en aplicar una técnica en particular: en esta investigación se presenta y aplica el modelamiento de temas, más conocido como Topic Modeling, el cual permite identificar los asuntos de los cuales trata un documento y se construye en base a dos principios: cada documento está estructurado según una mixtura de temas y cada tema es explicado mediante una mixtura de palabras. Para ello, emplea el modelo bayesiano de Alocación Latente de Dirichlet cuyos parámetros no pueden ser estimados analíticamente sino mediante el algoritmo EM con inferencia variacional o algoritmos MCMC, siendo posible fijar el número de temas de antemano u optimizar dicha cantidad; para esta tarea se hace uso de los paquetes topicmodels y LDAvis. es
dc.language es es
dc.subject Política es
dc.subject minería de texto es
dc.subject Perú es
dc.subject modelamiento de temas es
dc.subject redes sociales es
dc.subject corpus es
dc.title Topic modeling en datos de Twitter: una aplicación en el contexto político peruano es
dc.type Objeto de conferencia es
sedici.identifier.uri http://47jaiio.sadio.org.ar/sites/default/files/LatinR_46.pdf es
sedici.identifier.issn 2618-3196 es
sedici.creator.person Gamboa Unsihuay, Jesús Eduardo es
sedici.subject.materias Ciencias Informáticas es
sedici.description.fulltext true es
mods.originInfo.place Sociedad Argentina de Informática e Investigación Operativa es
sedici.subtype Objeto de conferencia es
sedici.rights.license Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0)
sedici.rights.uri http://creativecommons.org/licenses/by-sa/3.0/
sedici.date.exposure 2018-09
sedici.relation.event Conferencia Latinoamericana sobre Uso de R en Investigación + Desarrollo (LatinR 2018) - JAIIO 47 (CABA, 2018) es
sedici.description.peerReview peer-review es
sedici.description.resumen true es


Download Files

This item appears in the following Collection(s)

Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0) Except where otherwise noted, this item's license is described as Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0)