Upload resources

Upload your works to SEDICI to increase its visibility and improve its impact

 

Show simple item record

dc.date.accessioned 2021-10-18T12:26:12Z
dc.date.available 2021-10-18T12:26:12Z
dc.date.issued 2021
dc.identifier.uri http://sedici.unlp.edu.ar/handle/10915/126780
dc.description.abstract El presente trabajo tiene como objetivo desarrollar un estudio comparativo entre Apache Flink y Apache Spark, partiendo de la medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse. Para ello, la presente investigación se sustenta en el paradigma cuantitativo de tipo comparativo. Las técnicas de investigación son el análisis de documento y análisis de contenido. Los resultados develan que de tratarse de un proyecto que requiere de amplio volumen de procesamiento de datos, la opción es emplear Apache Spark, dada la facilidad para codificar y realizar numerosas tareas; adicionalmente se pudo develar que este framework dispone de abundante información y profesionales con competencias y experiencia para trabajar en este sistema. Por su parte Apache Flink se distingue por ser un framework diseñado para procesamiento de streaming, no cuenta con mucha información de fácil acceso y existe un número reducido de especialistas con dominio y experiencia en este campo; siendo dos desventajas para su selección. Además, es importante señalar que ambos framework son eficientes en la ejecución de tareas, aunque en cuanto a versatilidad se distingue Apache Spark, por cuanto que permite emplear su potencial en diversos lenguajes de programación. Asimismo, es de destacar que a través de la experimentación los mejores tiempos obtenidos para ambas herramientas se logran al modificar el storage y cuando se lo trabaja en un formato columnar. es
dc.language es es
dc.subject Apache Spark es
dc.subject Big Data es
dc.subject Apache Flink es
dc.title Estudio comparativo entre Apache Flink y Apache Spark es
dc.type Tesis es
sedici.title.subtitle Medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse es
sedici.creator.person Jaime, Rubén Alejandro es
sedici.subject.materias Ciencias Informáticas es
sedici.description.fulltext true es
mods.originInfo.place Facultad de Informática es
sedici.subtype Trabajo de especializacion es
sedici.rights.license Creative Commons Attribution 4.0 International (CC BY 4.0)
sedici.rights.uri http://creativecommons.org/licenses/by/4.0/
sedici.contributor.director Hasperué, Waldo es
sedici.contributor.juror Sanz, Victoria María es
sedici.contributor.juror Rio, Nicolás del es
sedici.contributor.juror Rucci, Enzo es
thesis.degree.name Especialista en Inteligencia de Datos orientada a Big Data es
thesis.degree.grantor Universidad Nacional de La Plata es
sedici.date.exposure 2021-10-05
sedici.acta 122 es


Download Files

This item appears in the following Collection(s)

Creative Commons Attribution 4.0 International (CC BY 4.0) Except where otherwise noted, this item's license is described as Creative Commons Attribution 4.0 International (CC BY 4.0)