Busque entre los 161357 recursos disponibles en el repositorio
Mostrar el registro sencillo del ítem
dc.date.accessioned | 2012-10-31T18:24:03Z | |
dc.date.available | 2012-10-31T18:24:03Z | |
dc.date.issued | 2000-10 | |
dc.identifier.uri | http://sedici.unlp.edu.ar/handle/10915/23363 | |
dc.description.abstract | Q-Learning es un método de Aprendizaje por Refuerzo que permite resolver problemas de decisión secuencial en los cuales la utilidad de una acción depende de una secuencia de decisiones y donde además existe incertidumbre en cuanto a las dinámicas del ambiente en que está situado el agente. Este marco general de trabajo ha permitido aplicar Q-Learning y otros métodos de Aprendizaje por Refuerzo a una amplia gama de problemas del mundo real de considerable complejidad, como por ejemplo navegación de robots, manufacturación industrial, juegos, control de ascensores, etc. A pesar de las características interesantes de Q-Learning, uno de sus principales problemas es que es un método lento, ya que el agente requiere un tiempo considerable de entrenamiento para aprender una política aceptable. A los fines de solucionar, o al menos atenuar este problema, este trabajo propone un modelo de implementación paralela de Q-Learning manteniendo una representación tabular, y utilizando un esquema de comunicación basada en caché. Este modelo es aplicado en un problema particular, reportándose los resultados obtenidos con distintas configuraciones de procesadores y analizándose las ventajas y limitaciones actuales del enfoque | es |
dc.language | es | es |
dc.subject | Parallel programming | es |
dc.subject | comunicación basada en caché | es |
dc.subject | aprendizaje por refuerzo | es |
dc.subject | programación dinámica asincrónica | es |
dc.title | Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché | es |
dc.type | Objeto de conferencia | es |
sedici.creator.person | Printista, Alicia Marcela | es |
sedici.creator.person | Errecalde, Marcelo Luis | es |
sedici.creator.person | Montoya, Cecilia Inés | es |
sedici.description.note | I Workshop de Procesamiento Distribuido y Paralelo (WPDP) | es |
sedici.subject.materias | Ciencias Informáticas | es |
sedici.description.fulltext | true | es |
mods.originInfo.place | Red de Universidades con Carreras en Informática (RedUNCI) | es |
sedici.subtype | Objeto de conferencia | es |
sedici.rights.license | Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5) | |
sedici.rights.uri | http://creativecommons.org/licenses/by-nc-sa/2.5/ar/ | |
sedici.date.exposure | 2000-10 | |
sedici.relation.event | VI Congreso Argentino de Ciencias de la Computación | es |
sedici.description.peerReview | peer-review | es |