6.4 Aplicaciones en biotecnología

Estudio del fitness landscape de virus HIV

fishy

Fig. 36 Fitness landscape del HIV-1

  • Codificación de los datos: los vectores del mapa (neuronas) codifican secuencias de nucleótidos de los virus (HIV-1).

  • Mediante entrenamiento a partir de un conjunto de secuencias de las que se conoce su fitness (recovery), el SOM relaciona secuencias virales de DNA por similaridad

El conocimiento del fitness de estas secuencias permite crear un mapa tridimensional: un fitness landscape experimental.

Sobre este fitness landscape se pueden visualizar los caminos evolutivos producidos por mutaciones sucesivas.

Visualización, filtrado y clustering de datos ómicos multidimensionales

Las ciencias ómicas revelan una cantidad masiva de información por las high-throughput technologies, en particular multi-layer (omics) data.

  • omics-data: puntos en el espacio vectorial \(\mathbb{R}^N\).

Cuánto más similar es la actividad de diferentes genes, más cercanos (geométricamente) están los puntos que los representan: nubes de datos.

Estos datos sirven para el estudio de:

  • estudio global de constituyentes moleculares

  • estudio de mecanismos biológicos: comportamientos emergentes en sistemas biológicos

    • Systems biology: modelizar sistemas biológicos in silico