Para este proyecto se utilizó: MySQL 8.0.35. Herramienta de administración gráfica Workbench. Acceso a la línea de comandos (CMD) de Windows.
Este proyecto consiste en la carga y limpieza de datos en MySQL utilizando dos métodos de importación, para pequeños y grandes volumenes de datos. El proceso incluye la importación de archivos CSV, la validación y transformación de datos, y la exportación de las tablas limpias en formato CSV.
Se divide en dos partes: La primera parte consiste en la importación de datos usando la interfaz de Workbench, con el asistente "Table Data Import Wizard", útil para bases de datos con un menor número de registros.
La segunda parte consiste en la importación de datos usando el comando mysqlimport
desde CMD, útul para bases de datos con un mayor número de registros.
-
Verificación de Permisos y Configuraciones
- Verificación de la variable
local_infile
- Otorgar permisos para
mysqlimport
- Verificación de la variable
-
Creación de Tablas
- Creación de tablas para la importación de datos desde archivos CSV.
-
Importación de Datos
- Importación de datos desde la línea de comandos utilizando
mysqlimport
. - Importación de datos usando la interfaz de Workbench, con el asistente "Table Data Import Wizard".
- Importación de datos desde la línea de comandos utilizando
-
Verificación y Validación de Datos
- Verificación de datos importados.
- Revisión de duplicados, valores nulos y formatos incorrectos.
-
Transformación y Formateo de Datos
- Separación de columnas de fecha y hora.
- Cambio de formatos a DATE y TIME.
- Creación de índices para optimización de consultas.
-
Exportación de Datos Limpios
- Exportación de las tablas limpias a archivos CSV.
- Ejecutar el script SQL en MySQL Workbench o desde la terminal para realizar la limpieza y transformación de datos.
- Se recomienda ejecutar el script por partes, siguiendo los pasos dentro del mismo para evitar errores.
- Ejecutar el comando
mysqlimport
para importar los datos, adecuandolo a la ubicación de los archivos CSV que se adjuntan con el proyecto. - Ejecutar el script SQL en MySQL Workbench o desde la terminal para realizar la limpieza y transformación de datos.
- Asegurarse de que los archivos CSV estén correctamente formateados.
- Ajustar los parámetros de conexión y tiempo de espera según sea necesario.
- Todos los pasos, usos de comandos y solución de errores, se encuentran explicados dentro del script.
(https://zenodo.org/records/53894#.X9oeh3Uzaao)
[Diana Herrera]