CA inova no tradicional segmento de modelagem de dados

A CA Technologies, empresa com presença forte em diversos segmentos da indústria de TI (desde mainframe, gerenciamento e monitoração de infraestrutura, backup, gerenciamento de datacenter, etc.) é também responsável pela conhecida ferramenta ERWin, utilizada principalmente (mas não só para isso) em modelagem de dados. No começo de dezembro os clientes do Brasil tiveram uma apresentação em primeira mão da evolução desta grande plataforma que há muito deixou de ser apenas modelagem de dados, ampliando muito a capacidade da ferramenta. Donna Burbank, VP de marketing de produtos da CA Technologies esteve no Brasil e eu tive a oportunidade de conversar com ela sobre o novo ERWin 9.5 e também da evolução da plataforma no contexto de um mundo ampliado com Big Data, Nuvem, etc.

figura 01 – Donna Burbank VP de marketing da CA

Flavio Xandó: Donna eu gostaria de entender um pouco mais do papel dos recursos de modelagem de dados no ambiente das empresas e como tem sido usado.

Donna Burbank: o que é estimulante para nós é que o universo de “Modelagem de Dados” tem sido bem ampliado. Começamos atuando no mundo de base de dados relacionais, engenharia reversa de banco de dados (partir de um banco de dados físico e construir toda sua documentação em vez do uso mais natural que é criar toda a modelagem e migrar para bancos de dados reais) e hoje ampliamos a capacidade do produto para ir além disso como uma ferramenta de negócios. Eu escrevi alguns livros que versam sobre este tema que traduzem os recursos técnicos do produto para este contexto de negócios.

Flavio Xandó: atualmente muitas pessoas têm falado sobre Big Data que é na verdade um conjunto gigante de dados não estruturados (capturados a partir de fontes muito diversas e sem um formato padronizado, campos, etc. ). Como a solução da CA por ser usada neste diferente contexto para realizar um bom trabalho de Data Mining, uso em processos de BI (Businnes Inteligence – análise de dados de forma profunda baseada em estruturas multidimensionais para análise de negócios), etc.?

Donna Burbank: nesta nova versão temos dois pontos chave. Há mudanças na interface do produto para que usuários de negócio possam melhor compreender a representação dos dados e nos bastidores do produto há novos conectores e entre eles fontes de Big Data. Afinal eu posso querer integrar estas informações com os dados dos clientes integrado com meu CRM, dados de redes sociais, etc. Modelar dados de Big Data não faz muito sentido uma vez a informação já nasce não estruturada, mas um inteligente processo de captura de dados de redes sociais, como por exemplo o Facebook pode ser desenvolvido.

Flavio Xandó: mas o nível de confiabilidade das informações não é diferente em função de sua origem como por exemplo dados vindos de um Facebook?

Donna Burbank: Há muito lixo no Facebook, mas informações relevantes podem ser capturadas e serem agregadas aos dados de clientes. Quem vai usar os dados tem como saber a origem de cada informação. O importante é que dentro da empresa eu tenho dados seguros e confiáveis. Aqueles oriundos de rede social são úteis, mas como indicadores, algo menor relevância por conta da confiabilidade. Tempos atrás não tínhamos como fazer isso, apenas lidávamos com dados relacionais, mas hoje em dia abrimos esta nova possibilidade.

Flavio Xandó: você comentou sobre o lado “técnico” e o lado “negócios” da ferramenta. Gostaria de entender um pouco melhor isso.

Donna Burbank: em muitas empresas a preocupação principal é “eu quero saber tudo sobre o meu cliente”. E existem padrões interessantes de comportamento de consumidor que podem ser extraídos dos dados via “Business Inteligence” (BI), mas também há informações valiosas que podem ser obtidas de interações no Facebook. Por trás das informações pode existir um grande número de bases de dados modeladas para esta função. O usuário de negócios não tem a menor necessidade de saber da complexidade técnica, como as fontes de dados foram integradas, da relevância dos dados em função de sua origem. Mas ele precisa usar a informação para tomar suas decisões usando relatórios de BI, instrumentos de análise, cruzamento de informações, etc. Conseguimos ajudar o usuário de negócios a interagir com o pessoal técnico de forma a conseguir transmitir suas necessidades e ser mais produtivo..

Flavio Xandó: tempos atrás os usuários de negócio solicitavam ao pessoal técnico o tipo de relatório que queriam e estes produziam a extração de dados para ser analisada, mas nem sempre era o que o usuário queria. As pessoas de negócio devem ser capazes de fazer estes relatórios por elas mesmas. Como lidar com isso?

Donna Burbank: isso mesmo, deve ser do tipo “self service”, porque logo que eles começam a ver rapidamente as informações já percebem o que pode estar errado e corrigem o processo de manipulação dos dados. O que o pessoal de TI faz é preparar um conjunto de metadados (dados sobre os dados) e com estes em mãos o processo de gerar extrações e análises usando ferramentas como Excel, Visio, etc. é bem facilitado. Da mesma forma usando estes metadados painéis com informações (dashboards – que chamamos de Web Portal) podem ser construídos para uso pelos usuários de negócios. Estas definições facilitam muito para eles uma vez que mascara as complexidades. Ele pode estar usando dados vindos do SALESFORCE, CRM ou do ERP e nem sabe disso, mas é capaz de usar a informação.

Flavio Xandó: Qual é o suporte a bancos de dados? Quais ferramentas de mercado podem ser usadas? A CA não tem database próprio, não é?

Donna Burbank: Nós precisamos armazenar os dados sobre os dados, estrutura, regras, etc. Assim suportamos os bancos de dados usados pelo mercado como Oracle, SQL Server, Sybase, Teradata, DB2,... Nós da CA não temos um ambiente de database próprio e não temos intenção de ter. Usamos as soluções de mercado. Isso nos ajuda a criar soluções “cross platform” (implementada em diferentes ambientes). Na verdade nós temos forte sinergia com estas ferramentas de bancos de dados, pois nosso produto agrega valor porque eles não têm estes fortes recursos de design, documentação, etc., recurso que nós temos.

Flavio Xandó: O ERWin tem também integração com bases de dados de Mainframe? Sabemos que grandes corporações, principalmente as financeiras ainda usam bastante os Mainframes para suas aplicações e dados críticos. Também quero saber se pode ser feita integração de Mainframe com ambientes relacionais ou mesmo big data e cloud.

Donna Burbank: hoje em dia o que mais se fala é de Big Data e Cloud Computing, mas boa parte dos nossos negócios ainda estão em DB2 rodando nos Mainframes. Temos essa parceria estratégica e fazemos reuniões de usuários com estas empresas. Nós temos que entender e suportar metadados no Mainframe bem como muitos usuários que estão migrando para o Microsoft SQL Azure (na nuvem). Para o usuário do ERWin não faz muita diferença. Ele verá na interface linhas, caixas, botões e também pode usar os recursos de auxílio para migrar um banco de dados de um ambiente para outro totalmente diferente como, por exemplo, de DB2 para SQL Azure, Teradata, etc. e nós geramos para ele todos os scripts necessários.

Flavio Xandó: Mas no tal Web Portal, dashboard, etc. podem ser usados dados vindos de diversas fontes de dados totalmente distintas (SQL, DB2, Oracle, Big Data, etc.) para compor o painel de análises do usuário de negócios?

Donna Burbank: Definitivamente sim. E tudo começa com o recurso de “Inventory” que mapeia onde estão os recursos, documenta os dados, seja explicitamente ou pele técnica de engenharia reversa que analisa as fontes de dados e a partir daí o uso dos metadados fica à mão do usuário podendo criar estas “Visões Virtuais”. Bem como ao estudar um tipo de dado específico podemos descobrir que há informações de cliente em 17 databases no DB2 e 16 em Oracle e partir daí também se pode planejar um processo de migração e consolidação, seja em um destes ambientes ou um ambiente novo na nuvem...

Flavio Xandó: Eu pensei agora que os grandes bancos no Brasil que usam Mainframes para suas aplicações críticas com certeza usam também baixa plataforma x86 (Windows ou Linux) para suas soluções de Web. É também este um caso bastante comum de “cross platform” que sua solução lida aqui no Brasil?

Donna Burbank: sim e isto é algo mesmo desafiador. A começar pelo fato dos tradicionais técnicos de mainframe que interagem com os programadores de 22 anos (ou menos) que desenvolvem aplicações Web porque eles têm visões e necessidades diferentes entre si. Temos conseguido ajudar no diálogo entre estes dois mundos e isso interessante e até divertido.

Flavio Xandó: a CA tem um portfólio muito grande de produtos e soluções que vão desde ferramentas de monitoração de infraestrutura, gerenciamento de datacenter, mainframe e as ferramentas de dados. Como ocorre a interação entre estas diferentes áreas? Existem sinergia entre elas?

Donna Burbank: em todas estas áreas, infraestrutura, mainframe, dados, segurança, backup, etc. há evidente necessidade de troca de informações, custódia de dados. E como você falou Mainframe é uma das áreas fortes no portfólio da CA e somos muito próximos do mundo DB2. Então faz muito sentido termos recursos que transitam pelas diversas áreas de tecnologia, arquitetura, monitoração de rede. Somo próximos a todas esta áreas, mas temos nossa missão intrínseca na área de dados e obviamente a área de backup é muito próxima.

Flavio Xandó: falando mais especificamente na Nuvem, como é este mercado em relação às ferramentas de dados?

Donna Burbank: “Cloud” é muito mencionado e de fato vários clientes têm migrado suas bases de dados para a nuvem. Mas não tão rapidamente. Há cautela porque principalmente as grandes corporações sabem que seus dados são seus bens mais valiosos como informações sobre clientes, dados financeiros, etc. Mas mesmo estas empresas têm projetos em desenvolvimento na nuvem, algumas aplicações específicas ou mesmo versões de teste na nuvem e caberá a elas a decisão do melhor momento para esta migração.

Flavio Xandó: Como eu posso entender melhor esta multiplicidade de ambientes? Você tem algum exemplo?

Donna Burbank: nesta figura (figura 02) eu posso mostrar um caso típico onde existem diversas fontes de dados como SQL, DB2, Oracle onde moram os dados relacionais e também os dados transacionais da empresa como seu ERP e outras aplicações. Ao mesmo tempo tenho ferramentas de BI, Data Warehouse, ferramentas de ETL relacionadas todas convergindo para uma visão unificada dos dados. Isso também inclui fontes de informação oriundas de Big Data. Neste contexto o usuário pode detalhar mais, saber mais das suas entidades de dados, a definição de cliente, produtos, modelagem, estrutura, etc.

figura 02 – modelo unificando diversas origens de dados

Flavio Xandó: ERWin é um produto bastante maduro, com muitos e muitos anos de desenvolvimento e uso pelo mercado. Mas sobre Big Data, como o ERWin pode ajudar a melhor usar os dados de forma mais produtiva?

Donna Burbank: principalmente dados oriundos de redes sociais são bem complicados. As empresas monitoram o que se fala delas, interagem com clientes, falam de seus produtos, etc. Mas isso é feito de uma forma bastante desestruturada. Veja na figura 03 um exemplo disso como até mesmo identificar corretamente as relações com produtos e clientes é difícil. Conseguimos modelar os tipos de interação com o cliente e direcionar a análise da melhor forma possível. Mas mesmo assim dados vindos das redes sociais são boas ferramentas de apoio e confirmação, mas ainda não podem ser consideradas principais para tomada de decisão. Já fizemos muito nesta área, mas ainda há o que fazer. Seguimos trabalhando nisso.

figura 03 – usando o Big Data para extrair informações relevantes

Donna esteve no Brasil até dia 6 de dezembro apresentando a nova versão do ERWin para clientes em eventos em São Paulo, Rio de Janeiro e Brasília e também visitando e empresas e parceiros da CA. Sua grande experiência no mercado e conhecimento nesta estimulante área de tratamento de dados e informações tornou esta conversa muito interessante para mim e sinto que há ainda mais a falar dos produtos e soluções da CA os quais em futuro próximo vou desenvolver por meio de estudos de caso ou novas conversas. Que seja breve!

FX REVIEW - análises, opiniões e notícias

quarta-feira, 11 de dezembro de 2013

CA inova no tradicional segmento de modelagem de dados

Nenhum comentário:

Postar um comentário