As organizações que almejam alta competitividade no mercado não questionam a importância do Business Intelligence. A grande questão que se colocam é por onde e como começar. Os analistas de mercado têm uma resposta que pode parecer simplista, mas verdadeira: o tamanho do sapato deve ser o do tamanho do pé. Em outros termos, empresas pequenas ou com pouca cultura tecnológica podem começar usando algumas ferramentas de análise mais simples, como o EIS – Executive Information Systems -, que são amigáveis e fornecem informações gerenciais de forma rápida e eficiente. Outra opção são as DSS – Decision Support Systems -, sistemas de apoio à decisão que surgiram a partir dos sistemas transacionais e utilizam modelos para solucionar problemas não estruturados. São ferramentas que podem auxiliar as empresas a se familiarizar com os conceitos e tecnologias relativas ao BI, e evoluir nesse sentido aos poucos.
O fundamental é entender que os dados precisam ser estruturados de forma diferente do que ocorre nos sistemas transacionais. Por isso, os especialistas no assunto ressaltam que um dos principais pilares do BI é o Data Warehouse (DW). Como bem define William (Bill) Inmon, considerado o pai do DW, esse repositório nada mais é do que um banco de dados orientado por assuntos, não volátil (os dados não podem sofrer modificações) e integrado. No DW há apenas a carga dos dados e a consulta. Não há atualizações. Variável com o tempo é outra característica inerente ao DW. Isso significa que sempre será retratada uma situação num determinado ponto do tempo. É como se pegássemos uma foto de uma pessoa com um ano de idade e outra foto, dessa mesma pessoa, aos 10 anos de idade, para então fazer uma comparação e verificar as modificações ocorridas. No DW os assuntos são guardados em determinados pontos no tempo, o que permite uma análise histórica e comparativa dos fatos. Os dados podem ser retirados de múltiplos sistemas de computação utilizados internamente na empresa, ou também podem vir de fontes externas. Em resumo, um DW pode ser definido como um conjunto de técnicas e de bancos de dados integrados, projetados para suportar as funções dos Sistemas de Apoio à Decisão, onde cada unidade de dados está relacionada a um determinado assunto ou fato. Sua meta é fornecer subsídios e informações aos gerentes e diretores, para que assim possam analisar tendências históricas de seus clientes e, com isso, melhorarem os processos e agilizarem as tomadas de ações.
O maior problema do Data Warehouse é a sua grande complexidade. Sua criação requer pessoas altamente especializadas, uma metodologia consistente, computadores, banco de dados, ferramentas de front-end (sistemas transacionais- para captura dos dados), ferramentas para extração e limpeza dos dados, e treinamento dos usuários. É um processo complicado e demorado, que requer altos investimentos e que se não for corretamente planejado e executado, pode trazer prejuízos enormes e se tornar um grande elefante branco dentro da organização.
Uma forma de minimizar os riscos seria começar com o desenvolvimento de Data Marts departamentais e, numa fase posterior, integrá-los transformando-os num Data Warehouse.
Em termos conceituais, pode-se afirmar que um Data Mart é um mini Data Warehouse que fornece suporte à decisão para um pequeno grupo de pessoas – como aos profissionais da área de marketing, ou de vendas, por exemplo. O tempo de desenvolvimento e implementação, assim como os investimentos necessários, também são bem menores, em comparação ao DW. Segundo estimativas, enquanto um Data Mart custa em torno de US$ 100 mil a US$ 1 milhão e leva cerca de 20 dias para ficar pronto, um DW integral começa a partir de US$ 2 milhões e demora no mínimo um ano para estar consolidado. Mas são valores apenas estimados, uma vez que não existe um projeto padrão que serve para todas as empresas indistintamente. O montante aplicado depende de cada caso.
De acordo com alguns especialistas no assunto, as diferenças existentes entre um Data Mart e um Data Warehouse são apenas com relação ao tamanho do projeto e ao escopo da empresa. Portanto, as definições dos problemas e os requisitos dos dados são essencialmente os mesmos para ambos. No entanto, um Data Mart trata das questões departamentais ou locais (de um departamento específico), enquanto um DW envolve as necessidades de toda a companhia de forma que o suporte à decisão atue em todos os níveis da organização.
Ralph Kimball, consultor norte-americano e considerado um dos mais influentes gurus do Business Intelligence, discorda dessa definição e argumenta que os Data Marts não devem ser departamentais, mas sim orientados aos dados ou a fontes de dados. Ele exemplifica o caso de uma instituição bancária que dispõe de uma fonte de dados de contas correntes e poupança. Nesse caso deveria ser criado um Data Mart de Contas, que não será um Data Mart proprietário da área financeira, e nem da área de marketing, mas sim um repositório de dados que terá como público todos os usuários de todos os departamentos que lidam com aquele assunto.
Ralph Kimball é um defensor da teoria de que o DW deve ser dividido para depois ser conquistado, ou seja, que o mais viável para as empresas é desenvolver vários Data Marts para posteriormente integrá-los e, assim, chegar-se ao DW. Na sua avaliação, as empresas devem construir Data Marts orientados por assuntos. Ao final, teriam uma série de pontos de conexão entre eles, que seriam as tabelas Fato e Dimensã o em conformidade. Dessa forma, informações entre os diferentes Data Marts poderiam ser geradas de maneira íntegra e segura. Kimball batizou esse conceito de Data Warehouse Bus Architeture.
Bill Inmon rebate essa teoria e propõe justamente o contrário. Na sua avaliação deve-se construir primeiro um Data Warehouse, modelando-se toda a empresa para se chegar a um único modelo corporativo, partindo-se posteriormente para os Data Marts construídos por assuntos ou departamentais. Inmon defende a idéia de que o ponto de partida seriam os CIF – Corporate Information Factory – uma infra-estrutura ideal para ambientar os dados da empresa. O CIF seria alimentado pelos sistemas transacionais. A construção de um ODS (Operational Data Store – veja a definição no módulo 3) seria facultativa, mas essa iniciativa ajudaria a reduzir a complexidade da construção de um DW, uma vez que todo o esforço de integração entre os sistemas transacionais da empresa seria depositado nele.
Uma vez que todos os dados estivessem integrados no DW, se partiria para os Data Marts que iriam atender aos diversos departamentos da empresa, gerando dados íntegros e corporativos. Inmon condena o processo inverso porque, na sua concepção, a construção de Data Marts atendendo a requisitos departamentais seria delineada a partir de regras específicas de negócios e de procedimentos de Extração, Transformação e Carga (ETL) dos dados oriundos dos sistemas transacionais. A visão corporativa da empresa seria relegada a segundo plano e as necessidades imediatas dos departamentos prevaleceria. Além disso, essa iniciativa poderia gerar outros problemas, como a redundância de dados em diversos sistemas, o consumo exagerado de recursos de produção, e a formação de um verdadeiro caos informacional, na medida em que os dados dispostos nos diferentes Data Marts não poderiam ser integrados.
Qual deles está certo: Inmon ou Kimball? Ambos ou nenhum? Cabe a cada empresa analisar qual das duas abordagens mais se aplica às suas necessidades reais e ao seu bolso. No que ambos os gurus concordam é que uma empresa sem auto-conhecimento e sem ter uma visão corporativa de seu negócio, nunca terá um sistema eficiente para auxiliá-la na tomada de decisão.
Via: http://www.datamining.com.br/portal/modules.php?name=News&file=article&sid=2

















