Introdução
O Pentaho é uma plataforma de software de código aberto projetada par auxiliar organizações na gestão e análise de dados, bem como na criação de solução de Business Inteligence BI. ele oferece uma variedade de ferramentas e recursos para facilitar o processo de coleta, transformação, visualização e análise de dados, visando fornecer insights valiosas para tomadas de decisão.
Driver Azure DataBricks
O primeiro passo é configurar o driver do Azure Databricks. Você pode fazer o download do driver no seguinte link: https://www.databricks.com/spark/jdbc-drivers-download Após o download, descompacte o arquivo. Ele estará no formato .jar. Em seguida, mova o arquivo para a pasta 'lib' do Pentaho, seguindo o padrão de instalação. O caminho padrão para essa pasta é: C:\Pentaho\pdi-ce-9.4.0.0-343\data-integration\lib.
Criando a Conexão
Abra o Pentaho e crie uma nova conexão com o banco de dados: vá em 'File' > 'New' > 'Database Connection'.
Selecione a opção "Generic Database" na lista de opções.
No campo 'Custom Connection URL', insira o caminho JDBC da conexão. Por exemplo: jdbc:databricks://dbc-9999999-9256.cloud.databricks.com:443/default;transportMode=http;ssl=1;AuthMech=3;httpPath=/sql/1.0/warehouses/99999999999999.
No campo 'Custom Driver Class Name', insira: com.databricks.client.jdbc.Driver, após preencha os dados de usuário e senha e na opção de Access, selecione 'Native (JDBC)'.
Essas etapas irão criar a conexão com o banco de dados Azure Databricks no Pentaho.
Figura 01 - Database Connection
Após fazermos as configurações podemos fazer o test e se todas as configurações estiverem certas será apresentando a mensagem,
Figura 02 - Connection Successfully