Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché

Printista, Alicia Marcela; Errecalde, Marcelo Luis; Montoya, Cecilia Inés

Buscar material

Busque entre los 156185 recursos disponibles en el repositorio

Subir material

Suba sus trabajos a SEDICI, para mejorar notoriamente su visibilidad e impacto

Red de Universidades con Carreras en Informática (RedUNCI)
→
Eventos
→
CACIC
→
CACIC 2000

Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché

Autores: Printista, Alicia Marcela | Errecalde, Marcelo Luis | Montoya, Cecilia Inés

2000

Tipo de documento: Objeto de conferencia

Resumen

Q-Learning es un método de Aprendizaje por Refuerzo que permite resolver problemas de decisión secuencial en los cuales la utilidad de una acción depende de una secuencia de decisiones y donde además existe incertidumbre en cuanto a las dinámicas del ambiente en que está situado el agente. Este marco general de trabajo ha permitido aplicar Q-Learning y otros métodos de Aprendizaje por Refuerzo a una amplia gama de problemas del mundo real de considerable complejidad, como por ejemplo navegación de robots, manufacturación industrial, juegos, control de ascensores, etc. A pesar de las características interesantes de Q-Learning, uno de sus principales problemas es que es un método lento, ya que el agente requiere un tiempo considerable de entrenamiento para aprender una política aceptable. A los fines de solucionar, o al menos atenuar este problema, este trabajo propone un modelo de implementación paralela de Q-Learning manteniendo una representación tabular, y utilizando un esquema de comunicación basada en caché. Este modelo es aplicado en un problema particular, reportándose los resultados obtenidos con distintas configuraciones de procesadores y analizándose las ventajas y limitaciones actuales del enfoque

Notas

I Workshop de Procesamiento Distribuido y Paralelo (WPDP)

Información general

Fecha de exposición: octubre 2000

Fecha de publicación: octubre 2000

Idioma del documento: Español

Evento: VI Congreso Argentino de Ciencias de la Computación

Institución de origen: Red de Universidades con Carreras en Informática (RedUNCI)

Palabras claves: Parallel programming ; comunicación basada en caché ; aprendizaje por refuerzo ; programación dinámica asincrónica

Materias: Ciencias Informáticas

Descargar archivos

Documento completo
Descargar archivo (119.3Kb) - PDF

BASE

GoogleScholar

Creado el: 31 de octubre de 2012

Disponible en SEDICI desde: 31 de octubre de 2012

Por favor, utilice uno de estos identificadores(URI) para citar o enlazar este ítem:

http://sedici.unlp.edu.ar/handle/10915/23363

Mostrar el registro completo del ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

CACIC → CACIC 2000

Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)

Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)

Iniciar sesión