Um modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos

Côrtes, Deise; Alvares, Luis Otávio Campos

Buscar material

Busque entre los 168426 recursos disponibles en el repositorio

Subir material

Suba sus trabajos a SEDICI, para mejorar notoriamente su visibilidad e impacto

Red de Universidades con Carreras en Informática (RedUNCI)
→
Eventos
→
CACIC
→
CACIC 2005

Mostrar el registro sencillo del ítem

dc.date.accessioned	2012-10-25T13:38:39Z
dc.date.available	2012-10-25T13:38:39Z
dc.date.issued	2005-10
dc.identifier.uri	http://sedici.unlp.edu.ar/handle/10915/22934
dc.description.abstract	Em ambientes dinâmicos e complexos, a política ótima de coordenação não pode ser derivada analiticamente, mas deve ser aprendida através da interação direta com o ambiente. Geralmente, utiliza-se aprendizado por reforço para prover coordenação em tais ambientes. Atualmente, neuroevolução é um dos métodos de aprendizado por reforço mais proeminentes. Neste trabalho, é proposto um modelo de coordenação baseado em neuro-evolução. Foi desenvolvida uma extensão do método neuro-evolutivo conhecido como Enforced Subpopulations (ESP). Na extensão desenvolvida, a rede neural que define o comportamento de cada agente é totalmente conectada. Adicionalmente, é permitido que o algoritmo encontre, em tempo de treinamento, a quantidade de neurônios que deve estar presente na camada oculta da rede neural de cada agente. Esta alteração além de oferecer flexibilidade na definição da topologia da rede de cada agente e diminuir o tempo necessário para treinamento, permite também a constituição de grupos de agentes heterogêneos. Os experimentos realizados mostraram que os agentes treinados com o modelo proposto possuem capacidade de se adaptar a alterações no ambiente em tempo de execução. O modelo foi aplicado no domínio das tarefas de perseguição-evasão.	pt
dc.language	pt	es
dc.subject	Multiagent systems	es
dc.subject	Algorithms	es
dc.subject	Neural nets	es
dc.title	Um modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos	pt
dc.type	Objeto de conferencia	es
sedici.creator.person	Côrtes, Deise	es
sedici.creator.person	Alvares, Luis Otávio Campos	es
sedici.description.note	Eje: VI Workshop de Agentes y Sistemas Inteligentes (WASI)	es
sedici.subject.materias	Ciencias Informáticas	es
sedici.description.fulltext	true	es
mods.originInfo.place	Red de Universidades con Carreras en Informática (RedUNCI)	es
sedici.subtype	Objeto de conferencia	es
sedici.rights.license	Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)
sedici.rights.uri	http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
sedici.date.exposure	2005-10
sedici.relation.event	XI Congreso Argentino de Ciencias de la Computación	es
sedici.description.peerReview	peer-review	es

Descargar archivos

Documento completo
Descargar archivo (252.8Kb) - PDF

Este ítem aparece en la(s) siguiente(s) colección(ones)

CACIC → CACIC 2005

Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)

Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)

Iniciar sesión