Este conjunto de Jupyters forma parte de las prácticas de laboratorio de la Universitat de València, Escola Técnica Superior d’Enginyeria del 3ª curso del Grado Ciencia de Datos. Estas prácticas han sido impartidas por el profesor Jordi Muñoz Mari y realizadas por la alumna Elena Marrero Castellano.
Las prácticas de laboratorio permiten asentar los conocimientos estudiados en teoría mediante la implementación de modelos y la resolución práctica de problemas académicos y reales. Se realizan 6 prácticas de laboratorio más una práctica extra a modo de evaluación. Las prácticas de la asignatura y subidas al repositorio de GitHub son:
-
Parte 1 - Preprocesado y selección de características.
-
Parte 2 – Extracción de características.
-
Parte 3 - SVMs en problemas de clasificación.
-
Parte 4 - SVRs en problemas de regresión.
-
Parte 5 - Modelos basados en árbol de decisión para problemas de clasificación y regresión.
-
Parte 6 - Modelos basados en ensembles de árboles.
-
Parte 7 – Proyecto final.
En cada una de las prácticas podemos aprender a implementar los modelos descritos en las clases de teoría. Muchos de los métodos analizados en la asignatura de “Aprendizaje profundo” sólo cobran sentido cuando se desarrollan en un entorno de laboratorio en el que se puede observar su potencialidad, puesto que puede resultar relativamente complicado entender todas sus características de funcionamiento únicamente en base al estudio teórico y a la realización de ejercicios y problemas sencillos.
Todas las prácticas se distribuyen de la misma manera:
-
Para comenzar un prelaboratorio en el que estudiamos conceptos previos para la realización de las prácticas.
-
A continuación, un laboratorio. Con este apartado comprendemos a base de ejemplos los conceptos básicos propuestos por el profesor.
-
Para evaluar los conceptos aprendidos se propone la realización de ejercicios. Estos ejercicios están distribuidos a lo largo de toda la práctica.
-
Finalmente, como complemento de la práctica, se añaden algunos ejercicios extras para completar el aprendizaje.
Cada una de las prácticas/proyectos se encuentran en las carpetas en la parte superior. Dentro de cada una de ellas encontraremos un README.md con la información necesaria, una carpeta llamada 🚧 plantilla 🚧 que recoge los laboratorios sin solución para quien desee realizarlos y por último, unos Jupyter Notebooks con los laboratorios con solución. A continuación se explica detalladamente el contenido de cada una de las partes:
-
Parte 1 - Preprocesado y selección de características.
P1_1: Preprocesado de conjuntos de datos (Normalización y Codificación). P1_2: Selección de características ( Métodos filter y wrapper).
-
Parte 2 – Extracción de características.
P2_1: Análisis de Componentes Principales (PCA). P2_2: Separación de conjuntos: Hold-out, V-fold, Leave-one-out.
-
Parte 3 - SVMs en problemas de clasificación.
P3_1: Ejemplos (OVR – OVO). P3_2: Aprendizaje activo con SVMs .
-
Parte 4 - SVRs en problemas de regresión.
P4_1: SVRs regresión. P4_2: Hackathon, competición entre los alumnos por ver quien obtienen el menor MSE y mejor accuracy de predicción para unos datos dados. P4_3: Solución del Hackathon.
-
Parte 5 - Modelos basados en árbol de decisión para problemas de clasificación y regresión.
P5_1: Trees classification. P5_2: Trees regression.
-
Parte 6 - Modelos basados en ensembles de árboles.
P6_1: DecisionTreeClassifier. P6_2: Decesion Tree Regressor. P6_3: Random Forest.
-
Parte 7 – Proyecto final.
Desarrolla un algoritmo que a partir de unos datos de entrada (X) prediga los valores de salida (Y).
Este repositorio está bajo la Licencia (GNU General Public License v3.0) - mira el archivo LICENSE.md para detalles.