En la actual era postgenómica, el estudio de las interacciones existentes entre proteínas resulta una pieza clave en la compresión de los complejos mecanismos moleculares presentes en los procesos biológicos. Es sabido que la información acerca de interacciones proteínaproteína mejora el entendimiento sobre ciertas enfermedades, así como también puede ofrecer nuevas perspectivas para el desarrollo de tratamientos específicos. Sin embargo, gran parte del conocimiento sobre estas interacciones muchas veces permanece oculto en la inmensa cantidad de artículos científicos, reportes técnicos y demás trabajos científicos que día a día son publicados. Asimismo, el número creciente de revistas especializadas en Biología Computacional, más su naturaleza interdisciplinaria que hace viable la publicación de resultados en foros muy diversos (tales como medicina, biología, física o informática), tornan aún más difícil esta tarea de extracción y curación de nuevo conocimiento biológico. Para tomar una dimensión de este problema, basta con mencionar que tan solo la base de datos MEDLINE, fuertemente empleada en Biología Computacional, contiene alrededor de 19 millones de citas. Por otra parte, las publicaciones científicas son una de las principales fuentes que los curadores de bases de datos utilizan para sus anotaciones manuales, por lo que gran parte de la información funcional contenida en las bases de datos biológicas ha sido extraída directa o indirectamente de estas publicaciones.