Subir material

Suba sus trabajos a SEDICI, para mejorar notoriamente su visibilidad e impacto

 

Mostrar el registro sencillo del ítem

dc.date.accessioned 2012-11-01T13:27:27Z
dc.date.available 2012-11-01T13:27:27Z
dc.date.issued 2001-10
dc.identifier.uri http://sedici.unlp.edu.ar/handle/10915/23419
dc.description.abstract El aprendizaje de tareas en robots móviles, mediante aprendizaje por refuerzo, involucra la construcción de una política que permita al agente decidir qué acción tomar en cada situación censada. Construir esta política en problemas reales implica el manejo de grandes espacios de situaciones y acciones. Por lo tanto, es necesario recurrir a técnicas de clustering para tratar con estos espacios de una forma computacionalmente manejable. Si el agente no es capaz de clasificar adecuadamente las situaciones censadas, asignando a cada clase la acción correcta, el aprendizaje será perjudicado por el clusterting-aliasing, o por un clustering excesivamente refinado, con el cual desperdiciará recursos y perderá capacidad para generalizar. El grado de clusterización debe depender no sólo de la complejidad del ambiente, sino también la complejidad de la tarea a aprender. En el mismo ambiente, una tarea sencilla para ser aprendida con éxito, debería requerir menos distinciones de situaciones que una más compleja. Encontrar la cantidad justa de clusters que se necesita no es una tarea trivial [10]. En este trabajo se propone una métrica para medir el grado de cluster-aliasing, y un nuevo algoritmo para aproximar la cantidad justa de clusters disminuyendo el grado de cluster-aliasing. Presentaremos resultados experimentales en robots móviles Khepera que respaldan la performance del algoritmo propuesto. es
dc.language es es
dc.subject Neural nets es
dc.subject Reinforcement learning en
dc.subject robot learning en
dc.subject Robotics es
dc.subject neural networks en
dc.subject Learning es
dc.subject ARTIFICIAL INTELLIGENCE es
dc.subject cluster-alisasing en
dc.title Un método para tratar con el problema de Cluster-Aliasing en robots que aprenden es
dc.type Objeto de conferencia es
sedici.creator.person Matuk Herrera, Rosana es
sedici.creator.person Santos, Juan Miguel es
sedici.description.note Eje: Sistemas inteligentes es
sedici.subject.materias Ciencias Informáticas es
sedici.description.fulltext true es
mods.originInfo.place Red de Universidades con Carreras en Informática (RedUNCI) es
sedici.subtype Objeto de conferencia es
sedici.rights.license Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)
sedici.rights.uri http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
sedici.date.exposure 2001-10
sedici.relation.event VII Congreso Argentino de Ciencias de la Computación es
sedici.description.peerReview peer-review es


Descargar archivos

Este ítem aparece en la(s) siguiente(s) colección(ones)

Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5) Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)