En lás últimas décadas la disciplina Information Retrieval ha avanzado considerablemente. Esto se debe gran parte a que las organizaciones actuales hacen cada vez más esfuerzos para reutilizar el conocimiento, definiendo estrategias para tener catalogadas y reutilizar soluciones ya probadas.
Por el otro lado la evolución de la Web trajo consigo distintas herramientas de trabajo colaborativo. Dentro de dichas herramientas, los foros de discusión son ampliamente utilizados para plantear problemas, expresar sugerencias, así como para intercambiar conocimientos y experiencias. Dentro de un foro de discusión, un usuario de la comunidad puede realizar una pregunta, y el resto de los miembros de dicha comunidad pueden responder proponiendo soluciones al problema planteado. De esta manera, mediante el uso de esta herramienta, se genera un volumen de información bastante importante, que puede ser utilizado como fuente de conocimiento para un sistema de recuperación de información.
El objetivo fundamental de nuestro proyecto es definir una herramienta que, a partir de información existente en hilos de discusión de foros técnicos, la clasifique y establezca un orden entre soluciones posibles para problemas recurrentes del área de programación.