.. Sagepedia collection template master file, created by sphinx-quickstart on Thu Aug 21 20:15:55 2008. Combinatoria, Probabilidad y Estadística con Sage ============================================================ Breve resumen de las capacidades de Sage :::::::::::::::::::::::::::::::::::::::::::: Combinatoria Sage está *muy avanzado*, gracias sobre todo a **sage-combinat**, matemáticos principalmente *franceses*. Historia: **Mupad-combinat** se va a pique cuando otra compañía compra Mupad. Grafos Muy *completo*, muy *fácil* de usar. Contiene la librería de grafos ``networkx``, específica para python, muy bien integrada, y tiene implementaciones de otros muchos algoritmos. Probabilidad Para enseñar probabilidad y estadística elementales, Sage puede ser *suficiente* para dar clase. Herramientas de **cálculo simbólico** para trabajar con distribuciones de probabilidad, variedad de **gráficas** para representar, python es buen lenguaje para escribir **simulaciones**. Estadística Para una asignatura de estadística, **R** es probablemente mejor opción... R y Sage :::::::: *Sage incluye* **R**, pero la integración *no es buena*. Podemos usar el servidor de Sage para *usar R desde el navegador*: - Puedes seleccionar "r" en el desplegable de *lenguaje* en una hoja de trabajo de Sage (a la derecha del menú "data"), y entonces todos los recuadros de código se interpretarán como código de R. - Puedes comenzar cada bloque de código con ``%r``. :: %r datos <- c(2,1,2,2,3,2,1); summary(datos) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.000 1.500 2.000 1.857 2.000 3.000 . - Pero en una instalación *'normal'*, no podemos ver gráficas en el ordenador. El siguiente error es típico: :: %r hist(datos); Error in png() : X11 is not available ...hay una solución en `ask.sagemath.org `_. - Pero deberías probar el servidor de `RStudio `_, un interfaz para R de software libre. Un primer ejemplo: lanzamientos de monedas :::::::::::::::::::::::::::::::::::::::::: - Lanzamos **10 monedas** *de una en una* sobre la mesa: ¿cuál es la probabilidad de que *nunca* haya más cruces que caras sobre la mesa? *Dos enfoques típicos* de quien tiene un *ordenador*: - Contar los **casos favorables** y dividir ese número por el caso de **casos posibles**. - **Simular** el experimento usando los **números aleatorios** del ordenador una cantidad lo bastante grande de veces, y apelar a la ley de los grandes números. Codificamos: - Cruz: 0. Cara: 1 - Una secuencia de 10 lanzamientos: una lista de 1's y 0's. - Comenzamos por escribir una función que identifica un **caso favorable**, que usaremos en ambos enfoques: :: sage: def es_favorable(ms): ... #ms es una lista de 0's y 1's ... caras = 0 ... for j,m in enumerate(ms): ... if m: ... caras += 1 ... cruces = j+1-caras ... #si en algun momento hay mas cruces que caras, no es favorable ... if caras < cruces: ... return False ... return True sage: print es_favorable([1,0,0,1]) False sage: print es_favorable([1,0,1,0]) True Primer enfoque: tenemos que recorrer todas las listas con 0 y 1 en cada posición. - Anidar 10 bucles no es sensato: :: for k1 in [0,1]: for k2 in [0,1]: for k3 in [0,1]: for k4 in [0,1]: for k5 in [0,1]: ... 'Truco': cuando un entero k recorre los números desde 0 hasta :math:`2^k -1`, sus **bits** recorren todas las posibles combinaciones de 0 y 1 para K variables. Podemos usar, el método ``digits()`` pasando los argumentos ``base=2`` y ``padto=K`` (devuelve siempre listas de longitud K). Este método lo tienen todos los enteros de SAGE (cuidado: usa ``srange``, no ``range``). :: sage: K=4 sage: for k in srange(2^K): ... vars = k.digits(base=2,padto=K) ... print vars [0, 0, 0, 0] [1, 0, 0, 0] [0, 1, 0, 0] [1, 1, 0, 0] [0, 0, 1, 0] [1, 0, 1, 0] [0, 1, 1, 0] [1, 1, 1, 0] [0, 0, 0, 1] [1, 0, 0, 1] [0, 1, 0, 1] [1, 1, 0, 1] [0, 0, 1, 1] [1, 0, 1, 1] [0, 1, 1, 1] [1, 1, 1, 1] y ya podemos aplicar el primer enfoque: :: sage: K = 10 sage: totales = 2^K sage: favorables = 0 sage: for k in srange(totales): ... vars = k.digits(base=2,padto=K) ... if es_favorable(vars): ... favorables += 1 sage: p = favorables/totales sage: print '%s=%.3f'%(p,p) 63/256=0.246 . - Para el segundo enfoque, necesitamos listas con 0's y 1's elegidos aleatoriamente... - ...y el resto es igual. :: sage: K = 10 sage: totales = 1000 sage: favorables = 0 sage: for _ in srange(totales): ... vars = [randint(0,1) for _ in srange(K)] ... if es_favorable(vars): ... favorables += 1 sage: p = favorables/totales sage: print '%s=%.3f'%(p,p) 27/100=0.270 Objetos combinatorios ::::::::::::::::::::: - Muchos objetos combinatorios ya están definidos en Sage. - Tienen una *estructura uniforme*, con métodos comunes y una jerarquía de clases. - Métodos perezosos (no se hace ningún cálculo hasta que es imprescindible) - Podemos trabajar con objetos muy grandes, incluso infinitos. - Un método para *construir* todos los elementos y otro para *contarlos*. Métodos interesantes: - ``cardinality()`` para obtener el número de elementos - ``list()`` para obtener la lista de todos los elementos - ``random_element()`` para obtener un elemento aleatorio - Iteraciones del tipo ``for objeto in Clase`` para recorrer los objetos sin necesidad de cargarlos todos en memoria. Objetos interesantes: - Subsets: ``Subsets(lista)`` recorre los subconjuntos de ``lista`` (puede ser cualquier iterable). Admite un segundo argumento ``Subsets(lista, tamanyo)`` para recorrer únicamente los subconjuntos del tamaño especificado. - Permutaciones: ``Permutations(lista)`` recorre las ordenaciones de ``lista``. - Particiones: ``Partitions(k)`` recorre las formas de sumar ``k`` con enteros positivos. Además admite argumentos extra para limitar más las particiones. - Vectores de enteros: ``IntegerVectors`` recorre las formas de sumar un entero con enteros no negativos. También admite argumentos extra. - ``WeightedIntegerVectors`` recorre las formas de sumar un entero usando los enteros de una lista dada (¿de cuántas formas puedo pagar 33 euros usando billetes de 5 y monedas de 2?) - ``CartesianProduct`` producto cartesiano de dos conjuntos. Nota: recuerda que la ayuda del objeto se obtiene escribiendo una interrogación después de su nombre: ``Partitions?`` Ejemplos ~~~~~~~~~ :: sage: #Una permutacion aleatoria de una lista sage: print Permutations(srange(4)).random_element() [2, 3, 1, 0] :: sage: #Todas las formas de sumar 5 con números positivos sage: print Partitions(5).list() [[5], [4, 1], [3, 2], [3, 1, 1], [2, 2, 1], [2, 1, 1, 1], [1, 1, 1, 1, 1]] :: sage: #Todas las formas de sumar 8 usando monedas de 1, 2 y 5 sage: print WeightedIntegerVectors(8, [1,2,5]).list() [[1, 1, 1], [3, 0, 1], [0, 4, 0], [2, 3, 0], [4, 2, 0], [6, 1, 0], [8, 0, 0]] :: sage: #Por si acaso no te creias que para calcular el cardinal no hace falta sage: #calcular todos los elementos sage: S = Set([1,2,3,4]) sage: S3 = Subsets(Subsets(Subsets(S))) sage: print S3.cardinality()  Ejercicios ~~~~~~~~~~~~ 1) Calcula la probabilidad de que dos enteros elegidos al azar uniformemente entre 1 y N sean primos entre sí. Hazlo de forma exacta y mediante una simulación. 2) Calcula la probabilidad de que una permutación :math:`p` de los enteros del 1 al 10 verifique `p(i)<=i+1`. Hazlo de forma exacta y mediante una simulación. Construcciones recursivas ::::::::::::::::::::::::::: Para enseñar combinatoria, puede ser interesante que los alumnos construyan los objetos en vez de simplemente usarlos. Ejemplo resuelto : particiones de n con k partes fijas ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Formas de *descomponer un número n como suma de exactamente k enteros positivos*. Listamos los números de cada partición **de mayor a menor**, para evitar repeticiones. Observamos que las particiones pertenecen a dos clases: - Las que terminan en 1. - Las que tienen todos sus elementos mayores o iguales a 2. Esta idea nos permite construir las particiones recursivamente: - Generamos las particiones de n\-1 en k\-1 partes iguales, y añadimos un 1 al final para dar cuenta del primer grupo de particiones. - Generamos las particiones de n\-k en k partes iguales, y sumamos 1 a cada elemento para dar cuenta del segundo grupo de particiones. :: sage: def particiones(n, k): ... if k == n: ... return [[1]*n] ... if k == 1: ... return [[n]] ... if not(0 < k < n): ... return [] ... ls1 = [p+[1] for p in particiones(n-1, k-1)] ... ls2 = [[parte+1 for parte in p] for p in particiones(n-k, k)] ... return ls1 + ls2 :: sage: particiones(8,3) [[6, 1, 1], [5, 2, 1], [4, 3, 1], [4, 2, 2], [3, 3, 2]] Si sólo queremos contar el número de particiones de n con k elementos (en adelante :math:`p_k(n)`), las reglas de recursión anteriores se traducen en la siguiente ecuación de recurrencia: .. MATH:: p_k(n)=p_{k-1}(n-1) + p_k(n-k) junto con los "datos de frontera": .. MATH:: p_1(n) = p_n(n)=1 y: .. MATH:: p_k(n)=0 \text{ si } k\leq 0, \text{ ó } k > n, \text{ ó } n \leq 0 :: sage: def n_particiones(n, k): ... if k == n: ... return 1 ... if k == 1: ... return 1 ... if not(0 < k < n): ... return 0 ... n1 = n_particiones(n-1, k-1) ... n2 = n_particiones(n-k, k) ... return n1 + n2 :: sage: n_particiones(8,3) 5 Se tarda menos tiempo en *contar* las posibilidades que en *construirlas* todas. :: sage: time n_particiones(60,10) 62740 Time: CPU 0.92 s, Wall: 0.96 s :: sage: time ls = particiones(60,10) Time: CPU 19.84 s, Wall: 20.16 s Cascadas de llamadas recursivas ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ - Si aumentamos los parámetros, tarda mucho tiempo y consume mucha memoria. - El motivo es que llamamos muchas veces a la función con los mismos parámetros. Lo veremos más claro con un ejemplo más sencillo: :: sage: def fibo(n): ... if n<2: ... return 1 ... return fibo(n-1) + fibo(n-2) . - Una llamada a ``fibo(3)`` hace una llamada a ``fibo(2)`` y otra a ``fibo(1)``. - ``fibo(2)`` hace otra llamada más a ``fibo(1)``, *repitiendo* el trabajo anterior. - El número de llamadas necesario *crece de forma exponencial* (de hecho, crece exactamente como los números de Fibonacci). Solución rápida: - El **decorador** ``@cached_function`` altera una función para que almacene los valores de cada llamada - Evitamos calcular dos veces el valor de la función con los mismos argumentos. - La función debe ser **determinista**: *a iguales argumentos*, *igual resultado*. :: sage: @cached_function sage: def n_particiones_cached(n, k): ... if k == n: ... return 1 ... if k == 1: ... return 1 ... if not(0 < k < n): ... return 0 ... n1 = n_particiones_cached(n-1, k-1) ... n2 = n_particiones_cached(n-k, k) ... return n1 + n2 :: sage: time n_particiones_cached(60,10) 62740 Time: CPU 0.10 s, Wall: 0.12 s Ejercicio (si hay tiempo) ~~~~~~~~~~~~~~~~~~~~~~~~~~ Implementa la siguiente construcción recursiva de las combinaciones de n elementos tomadas de k en k elementos: Si tienes una lista con n elementos y quieres todas las extracciones de k elementos (donde el orden no importa), contruye: - Las listas de **k** elementos extraídas de los **n-1** primeros elementos de la lista original. - Toma las listas de **k-1** elementos extraídas de los **n-1** primeros elementos de la lista original, y añádeles el último elemento de la lista original. Regresión :::::::::: La regresión da mucho juego en clase: - Analizar datos *reales* - Probar conjeturas matemáticas * ¿cuál es el orden de convergencia de esta sucesión? * ¿cuántos primos hay en un intervalo de tal tipo lo bastante grande? * ... Analizamos una serie de datos extraída de un artículo de biología en el que se estudia el *diámetro del ojo* de distintos primates (D) como función de su *peso* (P): :: sage: datos =[[0.3300, 12.544], [4.1850, 17.278], [2.9000, 17.979], [0.2000, 12.938], ... [167.5000, 22.500], [72.3416, 24.521], [9.2500, 17.599], [6.0000, 19.176], ... [51.5000, 19.000], [19.5100, 19.750], [0.1150, 8.070]] sage: puntos = point(datos) sage: var('P a b') sage: D(P)=a*P^b sage: parametros = find_fit(datos, D, solution_dict=True) sage: print 'valores óptimos de los parámetros: ', parametros valores óptimos de los parámetros: {b: 0.10144858518005885, a: 14.368249010039623} :: sage: Dstar = D.subs(parametros) sage: error2 = sum((D0-Dstar(P=P0))^2 for P0,D0 in datos)/len(datos) sage: print 'error cuadratico medio: %f'%error2 error cuadratico medio: 3.195483 :: sage: mindatos = min(x for x,y in datos) sage: maxdatos = max(x for x,y in datos) sage: ajuste = plot(Dstar, (x, mindatos, maxdatos), rgbcolor=(0,1,0)) sage: grafica = puntos + ajuste sage: grafica.show() .. image:: index_media/ajuste_ojo.png :align: center . - Si queremos trabajar con **pocos datos**, lo más sencillo es **copiar y pegar**. - Si tenemos **muchos datos**, podemos **cargar el archivo** usando el menú *Data*/*Upload or create a file*, y luego procesarlo usando las funciones de manejo de cadenas de python. Si los datos están tabulados (por ej, csv), podemos: - usar las funciones de *reemplazar* de un editor de texto para dejarlo con la sintaxis de una lista de números de python (en ocasiones es conveniente usar **expresiones regulares**). - usar las instrucciones de manejo de cadenas de python (``replace``, ``split``), y a menudo ``zip`` para unir listas. Ejercicio ~~~~~~~~~~ - Crea un fichero de texto vacío - Corta y pega los siguientes datos (son datos de la *temperatura de ebullición* del agua a una cierta *presión atmosférica*, en unidades que no necesitamos saber): :: T P 194.5 20.79 194.3 20.79 197.9 22.4 198.4 22.67 199.4 23.15 199.9 23.35 200.9 23.89 201.1 23.99 201.4 24.02 201.3 24.01 203.6 25.14 204.6 26.57 209.5 28.49 208.6 27.76 210.7 29.04 211.9 29.88 212.2 30.06 A continuación: - Carga el fichero en una hoja de Sage vacía usando el menú *'data'* - Lee el fichero usando el comando ``open``: :: contenido = open(DATA + 'nombre_fichero').read() . - Usa las instrucciones de manejo de cadenas de python para conseguir una lista de datos en el formato correcto (lista de tuplas de números). - Ajusta un modelo lineal a esos datos - Predice la temperatura de ebullición a a 27 mm HG de presión. Distribucion discreta con soporte finito :::::::::::::::::::::::::::::::::::::::: Para la clase de probabilidad, podemos hacer algunos ejercicios con distribuciones de probabilidad discretas representando la **función de masa** mediante un **diccionario** en el que *las claves son los puntos del espacio muestral* y *el valor asociado a cada clave* es la *probabilidad* de ese punto. De esta forma, ``f[x]`` es la probabilidad asociada al punto ``x``. :: sage: #Ejemplos: ... sage: #Bernouilli de prob p=1/3 sage: p = 1/3 sage: f_bernouilli = {0:p, 1:1-p} sage: #Binomial con prob p=1/3 y k=10 ensayos independientes sage: k = 10 sage: p = 1/3 sage: f_binomial = dict((j, p^j*(1-p)^(k-j)*binomial(k,j)) for j in range(k+1)) .. end of output Si el espacio muestral está contenido en :math:`\RR`, podemos dibujar la distribución por ejemplo así: :: sage: #dibujar una distribucion discreta con soporte finito sage: def dibuja_f(f, *args, **kargs): ... '''Dibuja una funcion de masa con soporte finito, dada como diccionario ... ... Acepta los argumentos adicionales tipicos de graficas en Sage, ... como color, etc ... ''' ... p = (sum([line2d([(x, 0), (x, f[x])], *args, **kargs) for x in f]) ... + point2d(f.items(), pointsize=30, *args, **kargs)) ... ... #Imponemos rango [0,1] para el eje que muestra las probabilidades ... p.ymin(0) ... p.ymax(1) ... p.axes_labels(['$x$','$p$']) ... return p .. end of output :: sage: show(dibuja_f(f_bernouilli)) sage: show(dibuja_f(f_binomial, color = (1,0,0))) .. image:: index_media/cell_3_sage0.png :align: center .. image:: index_media/cell_3_sage1.png :align: center .. end of output Esperanza y varianza de una variable aleatoria real: .. index:: media y varianza de una distribución :: sage: #media y varianza sage: def media_f(f): ... return sum(x*f[x] for x in f) ... sage: def varianza_f(f): ... m = media_f(f) ... return sum((x-m)^2*f[x] for x in f) .. end of output :: sage: print media_f(f_bernouilli), varianza_f(f_bernouilli) sage: print media_f(f_binomial), varianza_f(f_binomial) 2/3 2/9 10/3 20/9 .. end of output y la función de distribución: :: sage: F_binomial = dict((x, sum(p for y,p in f_binomial.items() if y<=x)) ... for x in f_binomial) sage: print F_binomial {0: 1024/59049, 1: 2048/19683, 2: 5888/19683, 3: 11008/19683, 4: 15488/19683, 5: 18176/19683, 6: 2144/2187, 7: 19616/19683, 8: 19676/19683, 9: 59048/59049, 10: 1} .. end of output **Ejercicio \- debate** : ¿Cómo podemos extraer un número en el soporte de nuestra función de masa respetando las probabilidades requeridas? Es decir, si tenemos: :: f = {0:1/2, 1:1/3, 2:1/6} valores : [0, 1, 2] cum_probs : [1/2, 5/6, 1] queremos una función que devuelva 0 con probabilidad 1/2, 1 con probabilidad 1/3, y 2 con probabilidad 1/6. Distribucion continua ::::::::::::::::::::: Las distribuciones continuas se pueden manejar usando funciones simbólicas e integrales. Por ejemplo, la normal en una variable: .. MATH:: f(x)=\frac{1}{\sqrt{2\, \pi }\,\sigma}e^{-\frac{1}{2}\left(\frac{\mu - x}{\sigma}\right)^2} :: sage: #Distribucion continua sage: #Normal sage: #funcion de densidad sage: var('x') sage: m = 0.7 sage: s = 1.4 sage: f_normal = (1/sqrt(2*pi*s^2))*e^(-(x - m)^2/(2*s^2)) sage: #Un tipico dibujo de la normal, centrado en la media y con 3 sage: #desviaciones tipicas de rango sage: show(plot(f_normal, x, m - 3*s, m + 3*s)) .. image:: index_media/cell_31_sage0.png :align: center .. end of output :: sage: #Probabilidad de que X<1, cuando X~N(0.7, 1.4) sage: prob, error = numerical_integral(f_normal, -oo, 1) sage: print prob 0.584837871172 sage: #Marcamos en el dibujo la prob pedida sage: show(plot(f_normal, x, m - 3*s, m + 3*s) + ... plot(f_normal, x, m - 3*s, 1, fill = True)) .. image:: index_media/cell_94_sage0.png :align: center .. end of output :: sage: #media y varianza sage: def media_c(f): ... return integral(x*f,x,-oo,oo) ... sage: def varianza_c(f): ... m = media_c(f) ... return integral((x-m)^2*f,x,-oo,oo) .. end of output :: sage: media_c(f_normal), varianza_c(f_normal) (0.7, 1.96) .. end of output Podemos usar variables simbólicas como parámetros. :: sage: var('x mu sigma') sage: assume(sigma > 0) #necesario para las integrales simbolicas sage: f_normal = (1/sqrt(2*pi*sigma^2))*e^(-(x - mu)^2/(2*sigma^2)) sage: media_c(f_normal), varianza_c(f_normal) (mu, sigma^2) .. end of output .. index:: extracción aleatoria de una distribución Extracciones aleatorias ~~~~~~~~~~~~~~~~~~~~~~~ - Para hacer extracciones aleatorias de una distribución continua es suficiente con obtener un p-cuantil con p arbitrario. - Para obtener un p-cuantil hay que invertir la función de distribución. - Si no es viable encontrar una solución simbólica, podemos hacerlo de forma numérica con ``find_root``. :: sage: #Extraccion aleatoria sage: m = 0.7 sage: s = 1.4 sage: f_normal = (1/sqrt(2*pi*s^2))*e^(-(x - m)^2/(2*s^2)) sage: #1: extraemos un numero aleatorio entre 0 y 1 sage: t = random() sage: #2: funcion de distribucion sage: var('x1') sage: F_normal = integral(f_normal(x=x1), x1, -oo, x) sage: show(plot(F_normal,x,-3,3) + ... plot(0*x+t, x, -3, 3, color=(1,0,0))) sage: #3: "invertimos" la funcion de distribucion (de forma numerica) sage: print t, find_root(F_normal - t, m-10*s, m+10*s) 0.531001627926 0.808903109475 .. image:: index_media/cell_35_sage0.png :align: center .. end of output :: sage: #Intentar invertir la funcion de forma simbolica no funciona sage: #con una normal (puede funcionar en otros casos) sage: var('p') sage: solve(F_normal==p, x) [erf(5/14*sqrt(2)*x - 1/4*sqrt(2)) == 1/4853*(7777*sqrt(2)*p - 4853*e^(1/8))*e^(-1/8)] .. end of output :: sage: #extraccion aleatoria sage: #el argumento es la funcion de distribucion, no la de densidad sage: def extraccion_aleatoria_c(F): ... t = random() ... return find_root(F - t, -100, 100) .. end of output :: sage: extraccion_aleatoria_c(F_normal) 0.6299529113987602 .. end of output .. index:: histograma Histograma ~~~~~~~~~~ Para comparar una muestra aleatoria (una cantidad finita de puntos) con una distribución continua, tenemos que agrupar los datos extraídos en intervalos: :: sage: from collections import defaultdict sage: T = 400 sage: #Dividimos [-K,K] en N partes iguales sage: K = 3 sage: N = 20 sage: frecuencias = defaultdict(int) sage: for j in range(T): ... a = extraccion_aleatoria_c(F_normal) ... k = floor(a*N/(2*K))*(2*K/N) ... frecuencias[k] += 1/(T*2*K/N) sage: dibuja_f(frecuencias) + plot(f_normal, x, m-3*s, m+3*s, color=(1,0,0)) .. image:: index_media/cell_39_sage0.png :align: center .. end of output Por supuesto, mucha de esta funcionalidad está incluida en Sage :: sage: #extracciones aleatorias de una normal sage: normalvariate(0,1) -1.2476798578721822 .. end of output Ejercicio ::::::::: Para hacer las extracciones aleatorias, hemos tenido que calcular los p-cuantiles tanto de una distribución finita como de una continua. Para distribuciones unidimensionales, la 1-distancia de *Kantorovich* (aka distancia de *Wasserstein*) de dos distribuciones de probabilidad es el promedio de las distancias entre los p-cuantiles correspondientes. El teorema central del límite nos dice que si :math:`X_i` son variables aleatorias independientes e idénticamente distribuidas, entonces la variable aleatoria .. MATH:: S_n:=(X_1+\cdots+X_n)/n converge (para distintas nociones de convergencia), a una normal con la media y la varianza de :math:`X_i`. Si :math:`X_i` siguen una distribución de Bernouilli con probabilidad :math:`p`, entonces :math:`X_1+\cdots+X_n` sigue una distribución binomial. 1) Aprende a escalar una distribución de probabilidad finita, para poder construir la distribución de :math:`S_n`. 2) Calcula de forma aproximada la distancia de Kantorovich entre :math:`S_n` y una normal de media :math:`p` y varianza :math:`p(1-p)`. .. 3) Repite el ejercicio anterior para una distribución finita que no sea la de Bernouilli. Antes tendrás que aprender a calcular convoluciones de distribuciones finitas. Distribución normal bidimensional ::::::::::::::::::::::::::::::::: Las distribuciones en más de una dimensión se manejan de forma similar, pero con más variables simbólicas. Por ejemplo, estudiamos la distribución normal en `k=2` dimensiones: .. MATH:: f_X(x) = \frac{1}{ (2\pi)^{k/2}|\Sigma|^{1/2} } \exp\!\Big( {-\tfrac{1}{2}}(x-\mu)'\Sigma^{-1}(x-\mu) \Big), :: sage: #Normal bidimensional sage: var('x1 x2') sage: m1 = 1 sage: m2 = 0 sage: v1 = 3 sage: v12 = -2 sage: v2 = 4 sage: S = matrix(RDF, [[v1,v12],[v12,v2]]) sage: vs = vector([x1,x2]) sage: ms = vector([m1,m2]) sage: f = (1/(2*pi))*(1/sqrt(det(S)))*exp(-(1/2)*(vs-ms)*(~S)*(vs-ms)) .. end of output :: sage: #plot3d(f,(x1,-3,3),(x2,-3,3)).show() sage: p = contour_plot(f, (x1, m1-3*sqrt(v1), m1+3*sqrt(v1)), (x2, m2-3*sqrt(v2), m2+3*sqrt(v2))) sage: p.show(aspect_ratio=1) .. image:: index_media/cell_44_sage0.png :align: center .. end of output Resolvemos un típico ejercicio de probabilidad condicionada con dos variables normales: X=N(m=0.2,s=0.3) e Y=N(0.5, 0.6) son dos variables aleatorias que siguen una distribución normal, con cov(X,Y)=0.3. Si sabemos que para un individuo (aka elemento del espacio muestral), Y=1.3, ¿cual es la prob de que X sea mayor que 0.10? :: sage: var('x1 x2') sage: m1 = 0.2 sage: m2 = 0.5 sage: v1 = 0.3 sage: v12 = 0.3 sage: v2 = 0.6 sage: S = matrix(RDF, [[v1,v12],[v12,v2]]) sage: vs = vector([x1,x2]) sage: ms = vector([m1,m2]) sage: f(x1,x2) = (1/(2*pi))*(1/sqrt(det(S)))*exp(-(1/2)*(vs-ms)*(~S)*(vs-ms)) .. end of output :: sage: f_marginal_2(x2) = integral(f,x1,-oo,oo) sage: f_condicionada_1_dado_2(x1,x2) = f(x1,x2)/f_marginal_2(x2) .. end of output :: sage: plot(f_marginal_2,x2, -3, 3) .. image:: index_media/cell_49_sage0.png :align: center .. end of output :: sage: (plot(f_condicionada_1_dado_2(x2=1.3),x1, -3, 3) + ... plot(f_condicionada_1_dado_2(x2=1.3),x1, -3, .1, fill=True)) .. image:: index_media/cell_50_sage0.png :align: center .. end of output :: sage: numerical_integral(f_condicionada_1_dado_2(x2=1.3), -oo, 0.1) (0.098352801229473263, 1.0996705400110192e-08) .. end of output Grafos ::::::: Si nos queda tiempo, veremos algo de grafos. Como calculo que no, y en realidad es muy fácil os remito a dos sesiones de trabajo de las notas de *Laboratorio de Matemáticas*: - `Introducción a grafos en Sage `_ : os llevará como mucho 20 minutos. - `Grafos y malabares `_ : incluye un poco de cadenas de Markov. Un ejemplo breve: :: sage: g1 = graphs.CompleteGraph(5) sage: print g1.is_connected() True sage: print g1.is_planar() False sage: print g1.is_eulerian() True sage: print g1.is_tree() False sage: show(g1.plot()) .. image:: index_media/cell_32_sage0.png :align: center Para completar :::::::::::::: - `Notas de laboratorio `_ : bastante básico, pero ves un poco el panorama. En castellano, y con **la licencia de la wikipedia**, puedes cortar, pegar y usar en tu clase. - `Libro de sage en francés `_ : Tiene muy buena combinatoria, y algunos usos avanzados de los grafos (como emparejar personas y tareas). También tiene una licencia creative commons, pero lo tendrías que traducir. - `Ayuda oficial de Sage `_ : ya lo conocías, ¿verdad? - `Ask sage `_ : estupendo para dudas concretas. Palabras finales :::::::::::::::::::::: Muchas gracias por interesaros por Sage, en nombre de vuestros *futuros ex-alumnos*: - Mathematica, Matlab o Maple valen miles de euros - Sage se puede usar gratuitamente desde una página web (sagenb.org) - Tb se puede instalar donde tú quieras con las garantías del **software libre**. - Hay módulos de python para interaccionar con casi cualquier librería científica. - Ahora también hay un `servidor de ipython `_, que puede ser más conveniente si no necesitas todo Sage.