Processo de Extração-Transformação-Carga (ETL), desenvolvido na plataforma Knime, que realiza a carga dos Dados Públicos CNPJ (Novo Layout: Março/2021) em um banco de dados relacional.
1. Banco de Dados (criação das tabelas)
- Criar o banco de dados, se não existir;
- Criar o esquema cnpj;
- Executar dados_publicos_cnpj_create.ansi.sql para criar as tabelas do esquema cnpj. Obs: Em vez de executar o script dados_publicos_cnpj_create.ansi.sql (SQL padrão ANSI), é possível executar um script "dados_publicos_cnpj_create" específico dos SGBD MySQL, Oracle ou Microsoft SQL Server.
2. Dados Públicos CNPJ (download)
- Baixar arquivos zip referentes aos Dados Públicos CNPJ, disponibilizados pela Receita Federal.
3. Knime (execução do ETL)
- Instalar a plataforma Knime (versão >= 4.4.0), caso não esteja instalado;
- Abrir o workflow ETL_DADOS_PUBLICOS_CNPJ;
- Configurar o componente "DB Connector";
- Definir os valores das variáveis do workflow (Workflow Variables);
- Executar o workflow ETL_DADOS_PUBLICOS_CNPJ.
4. Banco de Dados (criação dos índices)
- Após a conclusão do workflow ETL_DADOS_PUBLICOS_CNPJ, executar dados_publicos_cnpj_index.sql para criar os índices das tabelas do esquema cnpj.