Construir um projeto de Data Warehouse (DW) √© dispendioso e demora um bom tempo. Tudo depende do tamanho da empresa, do n√ļmero de bases de dados que ir√£o integrar o projeto, interfaces com outros sistemas, quantidade de pessoas na equipe, comprometimento e dedica√ß√£o para implementa√ß√£o, ferramentas utilizadas, etc.

Percebendo isso, os arquitetos, resolveram segmentar a constru√ß√£o do DW, come√ßando por departamentos a cria√ß√£o do mesmo. Ao inv√©s de fazer o caminho tradicional, que √© construir um DW e a partir dele os Data Marts (DM), fizeram o contr√°rio. Come√ßava-se pelos DM¬īs e esses iriam fazer a alimenta√ß√£o no Data Warehouse (DW). As vantagens s√£o muitas. A principal √© o tempo de implementa√ß√£o. H√° alguns casos que um DM para √°rea comercial foi constru√≠do em apenas 3 meses.

Os Data Marts são bancos de dados modelados multidimensionalmente, orientados aos departamentos de uma empresa, por exemplo, a área comercial, financeira, marketing e logística construíram vários Data Marts (DM) cada uma. Ao final de dois anos, eles passaram a alimentar um DW que depois de implementado, passou a fazer o caminho inverso, que é de alimentar os DM. Então com essa fundamentação, podemos definir que os DM podem surgir de duas maneiras.

Top-down: é quando a empresa cria um DW e depois parte para a segmentação, ou seja, divide o DW em áreas menores gerando assim pequenos bancos orientados por assuntos aos departamentos.

Botton-up: é quando a situação é inversa. A empresa por estratégia sua, prefere primeiro criar um banco de dados para somente uma área. Com isso os custos são bem inferiores de um projeto de DW completo. A partir da visualização dos primeiros resultados parte para outra área e assim sucessivamente até resultar em um Data Warehouse.

Ou seja, podemos ir comprandos gavetas a medida que for necess√°rio, no final teremos um fich√°rio. Ou podemos comprar um grande fich√°rio e ir preenchendo as gavetas.

A infra-estrutura de software e hardware √© semelhante, por√©m a arquitetura dos dados pode ser bem diferente. No DW podemos ter o modelo de dados h√≠brido ou pode ser completamente relacional, j√° no DM o modelo √© totalmente dimensional. A complexidade de tratamento das informa√ß√Ķes no DW s√£o maiores, porque temos de olhar toda a estrutura da empresa, j√° no DM fica mais f√°cil, pois estamos olhando apenas uma parte dela. Portanto, cabe a cada empresa avaliar a sua demanda e optar pela melhor solu√ß√£o.

Ralph Kimball √© um defensor da teoria de que o DW deve ser dividido para depois ser conquistado, ou seja, que o mais vi√°vel para as empresas √© desenvolver v√°rios Data Marts para posteriormente integr√°-los e, assim, chegar-se ao DW. Na sua avalia√ß√£o, as empresas devem construir Data Marts orientados por assuntos. Ao final, teriam uma s√©rie de pontos de conex√£o entre eles, que seriam as tabelas Fato e Dimens√£ o em conformidade. Dessa forma, informa√ß√Ķes entre os diferentes Data Marts poderiam ser geradas de maneira √≠ntegra e segura. Kimball batizou esse conceito de Data Warehouse Bus Architeture.

Bill Inmon rebate essa teoria e prop√Ķe justamente o contr√°rio. Na sua avalia√ß√£o deve-se construir primeiro um Data Warehouse, modelando-se toda a empresa para se chegar a um √ļnico modelo corporativo, partindo-se posteriormente para os Data Marts constru√≠dos por assuntos ou departamentais. Inmon defende a id√©ia de que o ponto de partida seriam os CIF ‚Äď Corporate Information Factory ‚Äď uma infra-estrutura ideal para ambientar os dados da empresa. O CIF seria alimentado pelos sistemas transacionais. A constru√ß√£o de um ODS (Operational Data Store) seria facultativa, mas essa iniciativa ajudaria a reduzir a complexidade da constru√ß√£o de um DW, uma vez que todo o esfor√ßo de integra√ß√£o entre os sistemas transacionais da empresa seria depositado nele.

Os principais passos tomados ao longo da construção de um Data Mart são:

* Projetar

* Construir

* Popular

* Acessar

* Gerenciar

Projetar Este √© o primeiro passo no processo de implementa√ß√£o de um Data Mart. Esta etapa abrange desde a requisi√ß√£o do Data Mart, passando pela coleta de informa√ß√Ķes sobre os requisitos at√© o desenvolvimento das estruturas f√≠sica e l√≥gica do Data Mart.

Construir Este passo inclui a criação do banco de dados físico e de todas as estruturas lógicas que permitirão acesso rápido e eficiente aos dados.

Popular Popular o Data Mart engloba extrair os dados das fontes, filtrá-los, modificar toda a informação coletada até a mesma atingir o formato e o nível de detalhe desejados e mover o resultado para o Data Mart em si.

Acessar Esta etapa envolve o uso dos dados armazenados: consultar, analisar, criar relat√≥rios, gr√°ficos e public√°-los. O usu√°rio geralmente utiliza uma interface gr√°fica para consultar o banco de dados e visualizar os resultados das opera√ß√Ķes.

Gerenciar Este passo envolve a manutenção do Data Mart durante todo seu ciclo de vida. Efetua-se controle de acesso, otimização de performance, gerenciar o crescimento do data mart e recuperação de falhas.