Estadística
Curso 2022/23 (docencia presencial)
La asignatura se impartirá en dos grupos de segundo semestre en formato presencial, en los términos descritos en la guía de aprendizaje. Excepcionalmente, durante el curso 2022/23, se impartirá además en un grupo de primer semestre.
Presentación
Esta asignatura es una introducción a la probabilidad y la estadística. El enfoque es práctico y el énfasis se pone en entender las definiciones y ejemplificar los conceptos.
- Una hora de clase semanal serán en el aula 7 o el centro de cálculo. Los alumnos encontrarán cuadernos de trabajo funcionales escritos en el lenguaje python que les servirán de guía para responder a las preguntas planteadas. No es necesario conocer este lenguaje, ya que los alumnos siempre dispondrán de ejemplos similares, y el material disponible en internet para resolver dudas concretas es abundante.
- Dos horas de clase semanal serán en aula con pizarra y proyector. El profesor presentará la teoría y hará ejercicios relevantes. La asistencia a estas clases no es obligatoria, excepto si ese día se programa la realización de un cuestionario.
Durante todo el curso, tanto durante las clases como fuera de ellas, los alumnos interactuarán con un servidor web alojado en la UPM donde podrán encontrar todo el material del curso: material de referencia, cuadernos de trabajo y pruebas de evaluación:
La evaluación consistirá en:
- Responder a cuestionarios durante algunas de las clases de teoría, que demuestren que se han entendido los conceptos básicos de la asignatura.
- Entregar cuadernos de trabajo durante algunas de las clases de laboratorio, donde los alumnos parten de ejemplos funcionales y deben resolver problemas similares, alcanzando una solución numérica completa. Los cuadernos de trabajo se entregarán por parejas, que podrán cambiar a lo largo del curso.
Para los alumnos que no superen la evaluación por curso o quieran mejorar su calificación, se ofrecerá un examen final.
Temario detallado
- Probabilidad.
- Definiciones básicas y simulaciones con números aleatorios.
- Teorema de la probabilidad total, probabilidad condicionada, independencia de sucesos, teorema de Bayes.
- Variables aleatorias discretas: esperanza y probabilidades; simulación versus cálculo exacto. Distribuciones Uniforme Discreta, Bernoulli, Binomial, Geométrica, Poisson.
- Variables aleatorias continuas: esperanza y probabilidades; simulación versus cálculo exacto. Distribuciones Uniforme, Normal, Exponencial, Gamma.
- Distribuciones de probabilidad multivariable: Uniforme y Normal Multivariable.
- Ley de los Grandes Números y Teorema Central del límite
- Estadística.
- Análisis exploratorio. Representación gráfica de datos.
- Estimación de parámetros por máxima verosimilitud.
- Inferencia bayesiana.
- Regresión lineal. Interpolación vs extrapolación. Interpretación de los coeficientes.
- Regresión lineal múltiple. Selección de modelos. Correlación vs causalidad.
- Regresión no lineal. Sobreajuste. Conjuntos de entrenamiento y validación.
Ejemplos
A continuación mostramos algunos ejemplos estáticos, mientras que en clase podréis ejecutar el código mostrado.
- Simulando experimentos aleatorios
- Distribuciones de probabilidad discretas
- Esperanza, y transformaciones, de distribuciones de probabilidad discretas
- Análisis exploratorio
- Estadísticas de oleaje a largo plazo
Recursos
- Cuadernos de trabajo que aportará el profesor.
- Hoja de referencia rápida con algunos comandos de python que usaremos.
- Hoja de referencia rápida con el resumen de la teoría.
- A Modern Introduction to Probability and Statistics. Understanding Why and How. Dekking Kraaikamp Lopuhaä Meester, Springer 2005.
- Curso MIT 18-05: "Introduction to Probability and Statistics"
- Devinderjit Sivia, John Skilling. Data Analysis - A Bayesian Tutorial-Oxford University Press, USA (2006)
- Apuntes y vídeos de Luis Rincón, profesor de la UNAM.
- Elementos de estadística aplicada. Cálculo de probabilidades y teoría de variable aleatoria. Muruzábal, J.J. Serv. Publicaciones, Colegio de ICCP; Madrid, 2008.
- An Introduction to Statistical Learning (sólo para el último capítulo)