Um Data Warehouse é o local em que todos os dados de uma empresa são armazenados. Ele funciona de maneira similar a um estoque.
Os data warehouses destinam-se exclusivamente a realizar consultas e análises avançadas e geralmente contêm grandes quantidades de dados históricos. Os dados em um data warehouse geralmente são derivados de uma ampla variedade de fontes, como arquivos de log de aplicativos e aplicativos de transações.
Veja mais como funciona um data warehouse em: https://blog.rugnabcontrol.com.br/data-lake-x-data-warehouse-diferencas-e-conceitos/
O correto é ter um servidor que nunca desligue para ter o data warehouse local.
Para construir de um Data Warehouse utilizando o Pentaho Data Integration é necessário:
Antes de qualquer coisa é preciso definir se o banco de dados será: Oracle, Postgres, SQL Server, Mysql…
A definição deve ser feita pensando principalmente nos custos, manutenção e acessibilidade.
É mais uma questão de prós e contras, mas é de extrema importância levar em conta o que será feito depois que o data warehouse estiver pronto.
Após definir o banco de dados, iremos nos conectar com o BD e começar a realizar os inputs dentro do Pentaho.
Agora é necessário trabalhar na parte de transformação, dos dados que estão vindo do BD, para distribuir os dados necessários para cada departamento.
Nesta parte o correto é entender a necessidade do departamento para utilizar os steps de transformação e lookups (se necessário), para entregar o que é essencial para cada departamento ter.
Temos até o momento após a transformação, as tabelas do DW, agora criamos um Banco de Dados e conectamos no Pentaho, com isso fazemos um output para cada tabela.
Dentro do nosso curso completo de Pentaho, além de aprendermos os steps mais importantes da ferramenta, fazemos um DW completo dentro do curso, então se você quiser criar um DW, acesse e se inscreve: https://www.rugnabcontrol.com.br/curso-completo-pentaho-data-integration-etl/