6.4 Aplicaciones en biotecnología¶
Estudio del fitness landscape de virus HIV¶
Codificación de los datos: los vectores del mapa (neuronas) codifican secuencias de nucleótidos de los virus (HIV-1).
Mediante entrenamiento a partir de un conjunto de secuencias de las que se conoce su fitness (
recovery
), el SOM relaciona secuencias virales de DNA por similaridad
El conocimiento del fitness de estas secuencias permite crear un mapa tridimensional: un fitness landscape experimental.
Sobre este fitness landscape se pueden visualizar los caminos evolutivos producidos por mutaciones sucesivas.
Visualización, filtrado y clustering de datos ómicos multidimensionales¶
[Zhang and Fang, 2012] (y referencias dentro)
Las ciencias ómicas revelan una cantidad masiva de información por las high-throughput technologies, en particular multi-layer (omics) data.
omics-data: puntos en el espacio vectorial \(\mathbb{R}^N\).
Cuánto más similar es la actividad de diferentes genes, más cercanos (geométricamente) están los puntos que los representan: nubes de datos.
Estos datos sirven para el estudio de:
estudio global de constituyentes moleculares
estudio de mecanismos biológicos: comportamientos emergentes en sistemas biológicos
Systems biology: modelizar sistemas biológicos in silico