Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché

Printista, Alicia Marcela; Errecalde, Marcelo Luis; Montoya, Cecilia Inés

Buscar material

Busque entre los 161357 recursos disponibles en el repositorio

Subir material

Suba sus trabajos a SEDICI, para mejorar notoriamente su visibilidad e impacto

Red de Universidades con Carreras en Informática (RedUNCI)
→
Eventos
→
CACIC
→
CACIC 2000

Mostrar el registro sencillo del ítem

dc.date.accessioned	2012-10-31T18:24:03Z
dc.date.available	2012-10-31T18:24:03Z
dc.date.issued	2000-10
dc.identifier.uri	http://sedici.unlp.edu.ar/handle/10915/23363
dc.description.abstract	Q-Learning es un método de Aprendizaje por Refuerzo que permite resolver problemas de decisión secuencial en los cuales la utilidad de una acción depende de una secuencia de decisiones y donde además existe incertidumbre en cuanto a las dinámicas del ambiente en que está situado el agente. Este marco general de trabajo ha permitido aplicar Q-Learning y otros métodos de Aprendizaje por Refuerzo a una amplia gama de problemas del mundo real de considerable complejidad, como por ejemplo navegación de robots, manufacturación industrial, juegos, control de ascensores, etc. A pesar de las características interesantes de Q-Learning, uno de sus principales problemas es que es un método lento, ya que el agente requiere un tiempo considerable de entrenamiento para aprender una política aceptable. A los fines de solucionar, o al menos atenuar este problema, este trabajo propone un modelo de implementación paralela de Q-Learning manteniendo una representación tabular, y utilizando un esquema de comunicación basada en caché. Este modelo es aplicado en un problema particular, reportándose los resultados obtenidos con distintas configuraciones de procesadores y analizándose las ventajas y limitaciones actuales del enfoque	es
dc.language	es	es
dc.subject	Parallel programming	es
dc.subject	comunicación basada en caché	es
dc.subject	aprendizaje por refuerzo	es
dc.subject	programación dinámica asincrónica	es
dc.title	Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché	es
dc.type	Objeto de conferencia	es
sedici.creator.person	Printista, Alicia Marcela	es
sedici.creator.person	Errecalde, Marcelo Luis	es
sedici.creator.person	Montoya, Cecilia Inés	es
sedici.description.note	I Workshop de Procesamiento Distribuido y Paralelo (WPDP)	es
sedici.subject.materias	Ciencias Informáticas	es
sedici.description.fulltext	true	es
mods.originInfo.place	Red de Universidades con Carreras en Informática (RedUNCI)	es
sedici.subtype	Objeto de conferencia	es
sedici.rights.license	Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)
sedici.rights.uri	http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
sedici.date.exposure	2000-10
sedici.relation.event	VI Congreso Argentino de Ciencias de la Computación	es
sedici.description.peerReview	peer-review	es

Descargar archivos

Documento completo
Descargar archivo (119.3Kb) - PDF

Este ítem aparece en la(s) siguiente(s) colección(ones)

CACIC → CACIC 2000

Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)

Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)

Iniciar sesión