A solução do Pentaho Data Integration executa tarefas de ETL (Extraction, Transformation and Load).
Fornece os recursos de Extração (Extraction), Transformação (Transformation) e Carga (Load) que facilita o processo de captura, limpeza e armazenamento de dados usando um formato uniforme e consistente que é acessível e relevante para os usuários finais e tecnologias IoT.
O excel é uma das fontes de dados mais populares do mundo, ter a intenção de realizar um ETL dentro do mesmo é comum, então neste artigo, veremos como realizar o passo a passo para extrair esses dados para o pentaho.
No primeiro passo, vamos selecionar ou cliacar duas vezes no step, que está dentro de “Input”.
Agora vamos apertar e visualizar as opções dentro de “Spread sheet type (engine)” e selecionar o tipo.
Nesta etapa, vamos buscar o local onde o relatório está armazenado, para isso selecionamos navegação -> inserimos a planilha.
Iremos apertar em Add, para selecionar a planilha.
Vamos para Sheets -> Get sheetsnames -> Adicionamos o planilha para leitura -> apertamos em OK.
Visualizar se o no empty rows e header estão selecionados
Apertamos em “Get fields from header row…”, vai aparecer agora as colunas “name” e a formatação das mesmas “type”.
Depois dessa etapa, apertamos em OK e o input está finalizado. (lembre-se sempre de ajustar a formatação das colunas)
Para visualizar os dados, apertamos em “Preview rows” -> OK
Veja também o tutorial de como realizar no nosso canal: