Existem actualmente algumas soluções open source dedicadas à BI (Business Intelligence), tais como BEE Project, JasperSoft BI Suite, ViewBI, Pentaho BI Suite, OPeni, etc. O nosso propósito era encontrar uma solução open source de BI que conseguisse responder às necessidades patentes no projecto ?Modernização Administrativa?. Após um estudo elaborado e aprofundado, decidimos que a Pentaho seria a solução escolhida.
A solução Pentaho define-se a si mesma como uma plataforma de BI orientada para a solução e centrada em processos. Ou seja, não só apresenta os resultados de uma forma única e dando uma visão geral do estado da empresa, como implementa os próprios processos (workflow) para a resolução de problemas detectados e apresentados.
A disponibilização da informação é feita via Web para que, de uma forma fácil, se consiga distribuir a informação pelos utilizadores, usando obviamente segurança e disponibilidade de conteúdos consoante o utilizador.
O software Pentaho é constituído pelos seguintes projectos open source:
De seguida vamos falar um pouco de cada um destes projectos.
Mondrian
Este projecto é responsável pelo servidor OLAP (Online Analytic Processing) onde podemos construir os cubos que permitem segmentar a informação por eixos de análise, permitindo a análise da informação com base em várias perspectivas. É assim possível a compreensão dessa informação de uma forma intuitiva, uma vez que a solução nos permite decompor os valores nas diferentes perspectivas de análise.
Desta forma, o utilizador pode cruzar a informação com várias dimensões de um modo muito simples, utilizando drag-and-drop, drilling into, drilling across, encadeamento de dimensões, entre outros, bem como encontrar a causa de um problema que lhe sobressaiu num simples relatório
Pentaho Reporting Engine
Neste projecto encontramos uma ferramenta que nos permite elaborar relatórios sobre os dados da empresa (previamente tratados e ?arrumados?) e disponibilizá-los a todos os utilizadores. Os relatórios podem ter como fonte diferentes bases de dados, ficheiros Excel?e são distribuídos via browser, usando segurança onde podemos definir quais os utilizadores que têm acesso aos mesmos e o que podem consultar dentro do próprio relatório.
Kettle
Normalmente, nas empresas os dados estão em várias fontes (bases de dados diferentes, ficheiros Excel, etc.). Para se ter uma visão geral da informação produzida por uma ferramenta de BI, temos obrigatoriamente de cruzar todos os dados dispersos, sendo necessário usar a técnica de ETL (Extract-Tranformation-Load).
Devido à complexidade dos dados, ao facto de termos muitas vezes dados incompletos e incompatíveis?, temos a ferramenta Data Integration para nos ajudar na recolha e tratamento desses dados, bem como na sua harmonização, de forma a termos uma única visão sobre os mesmos, tendo assim uma visão geral sobre a empresa.
Weka
Este projecto é responsável pela área de Data Mining, ou seja, tentar prever o futuro, e até mesmo poder simulá-lo em termos de resultados. Esta é considerada uma das áreas mais atraentes de BI, devido à informação que obtemos e que a ?olho nu? seria impossível identificar. O Data Mining é um processo que usa algoritmos predefinidos, os quais recebem os nossos dados e nos dão informações principalmente de futuro, ou seja, tendências, padrões, etc.
O maior exemplo que se costuma dar sempre que se fala em Data Mining é a descoberta de que aos fins-de-semana os clientes que compravam fraldas também compravam cerveja. Ora bem, estes dois produtos, à partida, nunca teriam qualquer correlação e, no entanto, a verdade é que têm, e a explicação é dada porque os maridos aos fins-de-semana vão aos hipermercados comprar as fraldas que são necessárias e aproveitam para comprar umas cervejas para a semana. Tendo esta informação, o gerente de um hipermercado poderá, por exemplo, colocar as fraldas e as cervejas em pontos estratégicos, para que este tipo de cliente passe por outros produtos que se adeqúem ao seu perfil, no sentido de este os comprar.
Pentaho
Por fim, temos a plataforma de BI que conjuga todas as restantes áreas já abordadas. É uma plataforma feita em Java Standard, sendo uma linguagem de programação de larga utilização, quer em meio académico, quer em meio empresarial, levando à existência de sinergias positivas por parte de uma comunidade crescente. Isto deve-se ao amadurecimento do produto e ao facto de que, quanto maior é a comunidade, maior é o ritmo de crescimento do mesmo, permitindo a evolução da solução.
Como se pode constatar, o difícil para quem desenvolve soluções open source é conseguir juntar os vários módulos/componentes e conseguir que funcionem de uma forma harmoniosa, usando as mais valias de cada um deles.
Como conclusão, gostaríamos de frisar que o mundo das soluções open source irá perdurar, como demonstram os (bons) exemplos ao nível dos sistemas operativos, ERPs, entre outros. No entanto, acabam sempre por ser soluções que dependem de todos e ao mesmo tempo não dependem de ninguém, levando desta forma a que as organizações possam implementar este tipo de arquitecturas para soluções não críticas, pois o tempo de resolução de problemas não está suportado por qualquer contracto. Pelo contrário, na opção por soluções desenvolvidas por fabricantes (Cognos, Oracle, SAP, SAS, etc.), é assegurada a evolução da solução e o suporte da mesma, através de áreas de I&D dedicadas, garantindo ao cliente um interlocutor que o ajude na resolução dos seus problemas.
Irá existir sempre um conjunto de ferramentas BI standard (Cognos, Oracle, SAS, etc.) e ferramentas de BI open source, pelo menos enquanto existirem mercados que se adaptem mais a umas ou a outras
Produzido em 2008