Antes de visualizar o que é Pentaho Data Integration, vamos entender um pouco melhor sobre o que é ETL:
ETL é a sigla utilizada para o termo em inglês Extract, Transform and Load, em tradução literal, Extrair, Transformar e Carregar.
É um processo então de extração, transformação e carga de dados, que se utiliza em empresas que normalmente querem criar um DW (Data Warehouse), automatizar o backend, ou somente consolidar dados que vem de diferentes fontes para criar determinada visualização.
Após visualizarmos e entendermos o que é um processo de ETL e o seu objetivo, podemos entrar no que é Pentaho:
Pentaho é um software de código aberto para inteligência empresarial, desenvolvido em Java.
A solução do Pentaho Data Integration executa tarefas de ETL (Extraction, Transformation and Load).
Fornece os recursos de Extração (Extraction), Transformação (Transformation) e Carga (Load) que facilita o processo de captura, limpeza e armazenamento de dados usando um formato uniforme e consistente que é acessível e relevante para os usuários finais e tecnologias IoT.
Os usos comuns do Pentaho Data Integration incluem: