# 6.2 Mapas autoorganizativos

+ [Mapas de Kohonen (1980s)](https://en.wikipedia.org/wiki/Self-organizing_map)

+ Ejemplo paradigmático de algoritmo de aprendizaje __no supervisado__ bio-inspirado capaz de agrupar datos


## Propiedades

Los mapas autoorganizativos:

* Son un algoritmo de aprendizaje [__no supervisado__](https://en.wikipedia.org/wiki/Unsupervised_learning)

* Tienen aplicación tanto en el campo del _clustering_ como en la clasificación
    * También se puede aplicar como una herramienta de clasificación con aprendizaje supervisado

* Producen una representación en usualmente dos dimensiones de los _inputs_
    * Datos multidimensionales son representados en _mapas_ bi-dimensionales de nodos

:::{figure-md} markdown-fig.6.02.0
<img src="./images/som_esquema.png" alt="fishy" class="bg-primary mb-1" width="600px">

Ejemplo de _mapa_- SOM
:::

+ El tiempo de computación aumenta __linealmente__ con el tamaño de los datos.
    * Tienen una complejidad _lineal_ por lo que son adecuados para problemas de _Big Data_

## Red Neuronal del SOM

* El SOM es una red neuronal formada por un [__grid__](https://en.wikipedia.org/wiki/Lattice_graph) (usualmente bidimensional) de nodos/neuronas 

* Mediante entrenamiento la red es capaz de __aprender__ a relacionar topográficamente los vectores de entrada con los vectores de la red (neuronas).
    * Los SOM son mapas que relacionan una señal de entrada con neuronas de una red de acuerdo con su proximidad topográfica
    * _Impulsos similares son procesados por neuronas cercanas_


### Nodos / Neuronas

* Cada nodo tiene una posición fija en el gráfico/_grid_
* Cada nodo tiene asociado un vector _prototípico_ de igual dimensión a la de los _inputs_ (datos de entrada). 
    * Por ejemplo, si usamos datos que contengan los campos/atributos "edad", "sexo", "altura", "peso", cada nodo del grid tendrá asociados unos valores para cada uno de los atributos
    * Cada neurona de la red (bidimensional) representa un vector de dimensión $n>>2$
* (Una vez entrenado el SOM) cada nodo tiene asociado un subconjunto (puede ser vacío) de instancias de los datos de entrada
    * Cada instancia de los datos de entrada está _linkeada_ a un nodo del mapa SOM
    * Son disjuntos 2 a 2
    * Un nodo puede _representar_ varias instancias de los datos de entrada


## Propiedades topológicas

* La característica clave de un SOM es que las propiedades topológicas de los datos de entrada se preservan en en el mapa
    * _Inputs_ cercanos (la similaridad se define en función de los atributos, e.g., edad, sexo,...) estarán representadas por _nodos_ (neuronas) cercanas en el grid SOM.

* Es un algoritmo de _clustering_ que considera una estructura topológica (de vecindad) sobre los _clusters_
    * Los datos que están próximos pertenecerán al mismo _clúster_ (al igual que otros algoritmos de clustering), o a _clusters_ __vecinos__

* Son una herramienta adecuada para la visualización de datos __multidimensionales__ ya que los _clústeres_ pueden ser representados de acuerdo a su topología (_vecindad_)


:::{figure-md} markdown-fig.6.02.1
<img src="./images/SOM_R_1.jpg" alt="fishy" class="bg-primary mb-1" width="600px">

Ejemplo de _mapa_- SOM
:::






## Visualización

* Se utilizan para agrupar y representar conjuntos de datos de dimensiones elevadas en una red
    * habitualmente, bidimensional
    * también se utilizan redes 1D y 3D.

* Una representación típica de un SOM es un [_heatmap_](https://en.wikipedia.org/wiki/Heat_map) que muestral la distribución de un atributo a través del mapa.

:::{figure-md} markdown-fig.6.02.3
<img src="./images/SOM_R_2.jpg" alt="fishy" class="bg-primary mb-1" width="600px">

SOM unidimensional
:::


```{admonition} ¿Qué opinas de este ejemplo?
:class: tip
Coges a todos los asistentes a un concierto. Les dices que comparen sus atributos (edad, género, salario, altura) y que se muevan hasta que están lo más cerca posible a otra gente cuyos atributos sean lo más similar a ellos. Si entonces cada uno muestra una carta al cielo indicando su atributo (edad), el resultado es un SOM _heatmap_.

```


:::{figure-md} markdown-fig.6.02.4
<img src="./images/SOM_R_4_counts.jpg" alt="fishy" class="bg-primary mb-1" width="600px">

SOM unidimensional
:::

* Ayudan a hacer un [análisis exploratorio de los datos](https://en.wikipedia.org/wiki/Exploratory_data_analysis)

* Realizan una [reducción de la dimensionalidad](https://en.wikipedia.org/wiki/Dimensionality_reduction) de los datos

## Bioinspirados

* Son un caso concreto de redes neuronales en el cual es aprendizaje es [competitivo](https://en.wikipedia.org/wiki/Competitive_learning)

* Basados en la interpretación de imágenes del sistema visual de los seres vivos
    * _Plasticidad_ de las conexiones sinápticas del cerebro
    * Las conexiones neuronales se _refuerzan_ o _desaparecen_ en la fase de aprendizaje
    * Las modificaciones de las conexiones se hacen a través de la experiencia (_inputs_ recibidos), sin supervisión
    
    




## Desarrollo histórico

+ Diferentes variantes se han ido desarrollando hasta la fecha que permiten su aplicación a datos no numéricos (e.g. categóricos)

Presentación (1982):

+ {cite}`Kohonen1982a`
+ {cite}`Kohonen1982b`

Originalmente se utilizó para trabajar con valores númericos (versión _on-line_)

Una versión _promedio_ (_batch algorithm_) fue presentada en

+ {cite}`Kohonen1995`

para trabajar con símbolos.

