21 de Julio de 2015

  • Autor: D. Juan Antonio Nepomuceno Chamorro.
  • Titulo: “Biclustering sobre datos de expresión génica basado en búsqueda dispersa”.
  • Directores: Dr. Dña Alicia Troncoso Lora (Universidad Pablo de Olavide) y Dr. D. Jesús Aguilar Ruiz (Universidad Pablo de Olavide).
  • Sinopsis: Los datos de expresión génica, y su particular naturaleza e importancia, motivan no sólo el desarrollo de nuevas técnicas sino la formulación de nuevos problemas como el problema del biclustering. El biclustering es una técnica de aprendizaje no supervisado que agrupa tanto genes como condiciones. Este doble agrupamiento lo diferencia del clustering tradicional sobre este tipo de datos ya que éste sólo agrupa o bien genes o condiciones.

    La presente tesis presenta un nuevo algoritmo de biclustering que permite el estudio de distintos criterios de búsqueda. Dicho algoritmo utilize esquema de búsqueda dispersa, o scatter search, que independiza el mecanismo de búsqueda del criterio empleado.

    Se han estudiado tres criterios de búsqueda diferentes que motivan las tres principales aportaciones de la tesis. En primer lugar se estudia la correlación lineal entre los genes, que se integra como parte de la función objetivo empleada por el algoritmo de biclustering. La correlación lineal permite encontrar biclusters con patrones de desplazamiento y escalado, lo que mejora propuestas anteriores. En segundo lugar, y motivado por el significado biológico de los patrones de activación-inhibición entre genes, se modifica la correlación lineal de manera que se contemplen estos patrones. Por último, se ha tenido en cuenta la información disponible sobre genes en repositorios públicos, como la ontología de genes GO, y se incorpora dicha información como parte del criterio de búsqueda. Se añade un término extra que refleja, por cada bicluster que se evalúe, la calidad de ese grupo de genes según su información almacenada en GO. Se estudian dos posibilidades para dicho término de integración de información biológica, se comparan entre sí y se comprueba que los resultados son mejores cuando se usa información biológica en el algoritmo de biclustering.

  • Teseo:  https://www.educacion.gob.es/teseo/mostrarRef.do?ref=1161591
  • Repositorio USE:  http://www.doctorado.us.es/tesis-doctoral/repositorio-tesis/tesis-2015/details/2/4930
  • LinkedIn: https://www.linkedin.com/in/juan-antonio-nepomuceno-chamorro-74716b19