Apuntes personales sobre estadística, machine learning y lenguaje de programación R
Este repositorio contiene apuntes personales sobre estadística, bioestadística, machine learning y lenguaje de programación R. Para ver los documentos en formato web (html) visitar cienciadedatos.net.
Distributional Regression Forest: Random Forest probabilístico
Optimización con enjambre de partículas (Particle Swarm Optimization PSO)
Análisis farmacogenómico de paneles celulares: drug screening e identificación de biomarcadores
Análisis de Componentes Principales (Principal Component Analysis, PCA) y t-SNE
Árboles de predicción: bagging, random forest, boosting y C5.0
Métodos de regresión no lineal: Regresión Polinómica, Regression Splines, Smooth Splines y GAMs
Selección de predictores y mejor modelo: Subset selection, Ridge, Lasso y dimension reduction
Validación de modelos de regresion: Cross-validation, OneLeaveOut, Bootstrap
Comparación entre regresión logística, linear discriminant analisis (LDA) y K-NN
Linear Discriminant Analysis LDA y Quadratic Discriminant Analysis QDA
Ejemplo práctico de regresión lineal simple, múltiple, polinomial e interacción entre predictores
Resampling, Test de permutación, Simulación de Monte Carlo y Bootstrapping
Friedman test: alternativa no paramétrica al ANOVA de datos dependientes
Kruskal-Wallis test: alternativa no paramétrica al ANOVA independente
Inferencia para variables categóricas: proporciones, intervalos de confianza y test de hípótesis
Análisis de normalidad mediante gráficos y contrastes de hipótesis
This work by Joaquín Amat Rodrigo is licensed under a Creative Commons Attribution 4.0 International License.