Pentaho: Criando um Data Warehouse

O que é um Data Warehouse?

Um Data Warehouse é o local em que todos os dados de uma empresa são armazenados. Ele funciona de maneira similar a um estoque.

Os data warehouses destinam-se exclusivamente a realizar consultas e análises avançadas e geralmente contêm grandes quantidades de dados históricos. Os dados em um data warehouse geralmente são derivados de uma ampla variedade de fontes, como arquivos de log de aplicativos e aplicativos de transações.

Veja mais como funciona um data warehouse em: https://blog.rugnabcontrol.com.br/data-lake-x-data-warehouse-diferencas-e-conceitos/

Como Construir um Data Warehouse:

O correto é ter um servidor que nunca desligue para ter o data warehouse local.

Para construir de um Data Warehouse utilizando o Pentaho Data Integration é necessário:

1- Definir o banco de dados:

Antes de qualquer coisa é preciso definir se o banco de dados será: Oracle, Postgres, SQL Server, Mysql…

A definição deve ser feita pensando principalmente nos custos, manutenção e acessibilidade. 

É mais uma questão de prós e contras, mas é de extrema importância levar em conta o que será feito depois que o data warehouse estiver pronto.

2- Extração

Após definir o banco de dados, iremos nos conectar com o BD e começar a realizar os inputs dentro do Pentaho.

3- Transformação

Agora é necessário trabalhar na parte de transformação, dos dados que estão vindo do BD, para distribuir os dados necessários para cada departamento.

Nesta parte o correto é entender a necessidade do departamento para utilizar os steps de transformação e lookups (se necessário), para entregar o que é essencial para cada departamento ter.

4- Output

Temos até o momento após a transformação, as tabelas do DW, agora criamos um Banco de Dados e conectamos no Pentaho, com isso fazemos um output para cada tabela.

Exemplos de passo a passo para criação do Data Warehouse:

Dentro do nosso curso completo de Pentaho, além de aprendermos os steps mais importantes da ferramenta, fazemos um DW completo dentro do curso, então se você quiser criar um DW, acesse e se inscreve: https://www.rugnabcontrol.com.br/curso-completo-pentaho-data-integration-etl/

BUSCA

CATEGORIAS DO BLOG

Compartilhe

Share on facebook
Share on google
Share on twitter
Share on linkedin

Últimos Posts

Quer RECEBER MAIS CONTEUDOS COMO ESTE Posts?

Curso Completo Pentaho Data Integration:

Aprenda ETL