quarta-feira, 28 de novembro de 2012

PRTG – monitorando totalmente sua rede e infraestrutura


No começo era apenas um servidor e um pequeno switch. A empresa cresce e com o tempo a infraestrutura começa a ficar mais ampla (não obrigatoriamente tão mais complexa). Porém chega um dia no qual muitos dispositivos estão presentes, de vários tipos e essencialmente cada um deles bastante crítico para algumas importantes tarefas.

Esta situação é extremamente comum nas empresas em desenvolvimento, cujo crescimento se dá de forma relativamente rápida.  Nesta hora se a equipe de TI não dispuser de muitos dados que se traduzam em informação de qualidade, eventos que causem alguma pane ou comprometimento na infraestrutura não serão facilmente percebidos ou localizados. Mais do que isso. O acompanhamento de alguns indicadores especialmente escolhidos pode auxiliar bastante uma ação proativa dos profissionais de TI ajudando-os a descobrir problemas e evitá-los antes mesmo de terem acontecido.

Parece bom demais para ser verdade? Nem pense nisso. A categoria de software de monitoração de rede e infraestrutura não é nova e há várias alternativas no mercado. Há softwares gratuitos de boa qualidade, há softwares extremamente complexos cujo custo não pode ser absorvido por muitas empresas. E existem produtos que julgo mais “inteligentes”, dentre os quais o PRTG, objeto deste teste.

A empresa alemã Paessler, autora do PRTG, conseguiu em minha opinião um equilíbrio muito interessante entre riqueza de recursos, facilidade de uso e custo de implantação. Um sistema que se propõe monitorar a infraestrutura não pode ser algo tão ou mais complexo que a própria infraestrutura, algo que exija semanas de implantação. Já vi soluções muito intrincadas.

Este será o meu primeiro texto sobre o PRTG, pois há espaço para muitas discussões, dicas e informações. Neste texto vou apresentar as características gerais e os recursos que usei em primeiro lugar.

Usando o PRTG – o ambiente da implantação

Tive a possibilidade de fazer um teste especial com o PRTG uma vez que não foi apenas um estudo do produto. Fiz uma implantação de fato da solução em uma rede razoavelmente complexa. Este seria o melhor cenário para testar os recursos de monitoração, um caso REAL.

O cenário em questão era composto de :

- 4 localidades
- 4 servidores físicos
- 4 servidores virtuais
- 7 links de Internet
- 15 pontos de acesso WiFi
- 5 impressoras de rede
- 4 roteadores duais (gerenciamento de dois links)
- 9 switches

A quantidade de usuários nestas diferentes redes locais, formam uma grande rede com mais de 160 usuários.

Uma das primeiras grandes diferenças do PRTG é que ele não exige um servidor exclusivo para ele. Pode até ser feito isso, mas não é necessário. Alguns produtos exigem servidores físicos ou virtuais para hospedar a solução. O PRTG foi instalado em um Windows Server 2008 R2 em uma das sedes da referida empresa. Este W2008 R2 era casualmente o servidor de arquivos e Active Directory da rede e a presença do PRTG não afetou em nada o desempenho percebido por mim e pelos usuários.

Como contei antes a empresa está dividida em 4 sedes distintas. Isso não foi obstáculo para uso do PRTG. A saber, nestas localidades está em uso um roteador da CISCO (RV042) que além de gerenciar dois links de Internet (dual wan), tem capacidade de estabelecer uma conexão VPN entre as localidades e a sede principal. Dessa forma tudo se passa como se fosse uma grande rede nas 4 localidades. E neste cenário híbrido, rede local e rede remota o PRTG deu-se igualmente bem. Aliás, esta é a alternativa para redes híbridas, usar VPN entre as localidades.

Uma observação importante!!! O PRTG está disponível em vários idiomas, inclusive o Português falado no Brasil. Eu instalei e testei o produto nesta modalidade. As traduções dos termos técnicos (quando aplicável) está bastante apropriada e correta e quem preferir vai poder usar desta forma com todo o conforto e comodidade. Porém eu acabei por optar pelo idioma inglês na interface do produto apenas e tão somente porque eu ainda me sinto mais à vontade para buscar por alguns elementos, termos relacionados à rede, servidores, etc. em inglês. Mas não posso deixar de registrar o fato do produto estar totalmente traduzido e bem traduzido!!

Usando o PRTG – implantando os sensores

A analogia não é perfeita nem das melhores, mas imagine um paciente em uma UTI de hospital. Ele tem alguns aparelhos conectados ao seu corpo que acompanham as informações consideradas mais sensíveis por seus médicos. Provavelmente batimentos cardíacos, pressão arterial, nível de glicose, grau de oxigenação do sangue, etc. Estes SENSORES são capazes de ler a informação em regime periódico (a cada minuto, a cada 10 segundos, etc.) e exibir em um monitor estes dados. Mas não é suficiente apenas colecionar e exibir as informações. Possivelmente o médico responsável determinou alguns parâmetros que são críticos para ele e definiu que se, por exemplo, o batimento cardíaco ultrapassar 120 bpm, um alerta seja emitido ou que um SMS seja enviado para o médico.

A analogia acaba por aqui. Penso que ficou bem ilustrado. A rede e a infraestrutura da empresa é tão crítica como a saúde do paciente sendo observado. O PRTG se baseia completamente no conceito de sensores, tanto no aspecto técnico como comercial. O produto dispõe de uma versão gratuita que gerencia um número limitado de sensores (10), uma versão ilimitada, mas que funciona por 30 dias e as versões comerciais que têm seu custo em função do número máximo de sensores que podem ser implantados.

Os tais sensores existem no produto com uma riqueza de opções impressionante. Há sensores para diversos tipos de hardware, ambientes de software, etc. A quantidade de itens que pode ser monitorada é grande a ponto de exigir alguns cuidados. Eu explico. Como o produto é licenciado pela quantidade de sensores que podem ser usados, se forem escolhidos muito mais sensores do que aqueles que são realmente importantes será necessário contratar uma versão mais cara. Mas não é só isso. Se escolhermos sensores demais nosso ambiente de monitoração fica excessivamente denso e difícil de identificar o que realmente é mais delicado e importante.

Essencialmente todo sensor está ligado a um dispositivo com endereço de rede, um endereço IP. O PRTG dispõe de um interessante recurso chamado “Network Auto-Discovery” capaz de vasculhar a rede em busca de todos os dispositivos, acrescentando-os ao sistema. Ao acrescentá-los existe a opção de também já acrescentar sensores automaticamente (todos aqueles pertinentes ao equipamento) ou apenas registrá-lo com um sensor básico e deixa para o administrador do PRTG acrescentar os sensores que desejar para cada um deles.

A inclusão de um dispositivo é feita por seu endereço de rede e nesta hora o PRTG pode fazer a inclusão automática dos sensores mais comuns ou incluir todos os sensores possíveis para um dispositivo. Eu gostei muito da última opção, mesmo que eu tenha depois removido 70% dos sensores alocados. Dessa forma o PRTG acaba mostrando todas as possibilidades me permitindo escolher aqueles de minha preferência que podem não ser os sensores mais comuns escolhidos pelo próprio PRTG.
Adicionando sensores manualmente – clique para ampliar

Como são centenas de sensores distintos, diferentes para cada tipo de dispositivo vou citar apenas alguns como exemplo. A saber, o produto permite por meio de uma interface documentada, a inclusão de sensores desenvolvidos pelo usuário, algo um pouco mais complexo, mas possível. Vamos aos exemplos:

SERVIDORES : disponibilidade (PING), uso de memória, uso de CPU total, uso de memória total, uso de CPU e memória pelo Hyper-V, resposta a solicitação HTTP (web server), reposta a acesso FTP, resposta dos serviços DNS, SMTP, POP, IMAP, Área de Trabalho remota, desempenho de SQL Server, Oracle e MySQL, espaço livre nos discos, pacotes ou MB trafegados na rede, ...

A figura abaixo mostra alguns servidores monitorados de uma das sedes da empresa. Alguns deles apenas há sensores de resposta (PING) , RDP e HTTP. Outros são mais complexos onde aparecem inclusive máquinas virtuais Hyper-V ativas, serviços de DNS, IMAP, etc. Um deles tem um alerta vermelho, pois o disco de dados está com menos de 10% espaço livre. Há também um alerta amarelo, pois a memória livre está em 12%. Curiosamente há abaixo dois sensores com alerta do tipo “U” em laranja, ou seja, “unusual” – não usual. São parâmetros que estão de forma pouco normal bem abaixo da média, embora não seja problema, é legal saber que o PRTG olha e chama a atenção para valores não muito esperados.

Alguns servidores com seus sensores – clique para ampliar
 
IMPRESSORAS : disponibilidade (PING), quantidade de páginas impressas, resposta HTTP (para tela de configuração), bytes trafegados, páginas impressas por minuto,... Na tela abaixo há um singelo controle que montei para algumas impressoras de uma das sedes onde monitoro a disponibilidade e tempo de resposta (ping), páginas impressas e acesso à interface HTTP. Uma das impressoras (SAMSUNG) está conectada via Printer Server USB e por isso não tem a variável de páginas impressas (o que está sendo monitorado é o printer server no qual se conecta a impressora).

Impressoras monitoradas pelo PRTG e seus sensores

ACCESS POINTS WiFi : não existe um conjunto de sensores específicos para este tipo de dispositivo. Mas configurei o sistema para checar a disponibilidade e tempo de resposta (PING) e resposta da interface HTTP que é usado para configuração dos APs. Descobri que existe uma situação incomum na qual o AP responde ao PING, mas não funciona e nestes casos o acesso HTTP está inativo. Dessa forma descubro se o AP está no ar e se está operacional. Pode haver outras formas de monitorar estes APs.

Access points WiFi monitorados pelo PRTG e seus sensores

Monitoração de Links de Internet e entre as sedes

Falar que Internet ativa e estável é importante nas empresas é total redundância. Usando os sensores do PRTG criei um grupo de monitoração apenas dos recursos ligados à Internet. Monitoro a resolução de nomes via DNS (que se falhar já é um forte indicativo de problema de link). Monitoro também o Firewall (Endian), bem como os roteadores DUAIS (dois links) em questão. Além disso, um simples teste de PING me permite ver se uma sede está conectada à outra (último sensor) e dessa forma de uma só vez reforço o teste da Internet bem como a saúde deste link. Sei que o PRTG pode ir mais longe neste ponto, pois alguns roteadores permitem que sejam avaliadas suas variáveis internas, algo que ainda vou me aprofundar e fazer. Mas esta simples já me serve para saber se as conexões estão sadias.

               
Roteadores, links e DNS monitorados pelo PRTG e seus sensores


Usando as informações dos sensores

Estes sensores mostrados são apenas um mínimo exemplo do que se pode obter com o PRTG. Pequeno exemplo mesmo. Eles foram mostrados em pequenos grupos, mas o administrador da rede poderá exibi-los todos de uma só vez e rapidamente saber o que está verde (está OK) e o que está vermelho (errado ou problema). Mas como o PRTG sabe diferenciar um do outro? É muito simples. Um sensor alocado pelo PRTG, por exemplo, espaço em disco no servidor herda um parâmetro automático do sistema o qual determina que abaixo de 10% é situação vermelha (problema) e abaixo de 20% é apenas um alerta amarelo. Mas o administrador pode alterar estes parâmetros segundo o seu próprio conceito e seu próprio entendimento mudando estes limites. Isso vale para todos os tipos de sensores.

Visão parcial da árvore com todos os  sensores – clique para ampliar

Um detalhe importante não foi comentado, mas provavelmente quem está lendo este texto já deve ter percebido ou pensado. Cada um destes alertas vermelhos ou amarelos podem ser comunicados para a equipe de TI de muitas formas, como por exemplo, pelo envio de e-mail para um administrador ou para um grupo responsável pela infraestrura.

Mas além dos sensores vistos individualmente há diversos gráficos que têm uma importância imensa no processo de análise e principalmente na operação de prevenção de problemas. E isso é muito simples de ser compreendido. Veja por exemplo o gráfico do uso de memória no servidor dos últimos 30 dias. Neste momento há um alerta amarelo neste sensor, pois há apenas 11% livre.

Uso de memória nos últimos 30 dias – clique para ampliar

Neste gráfico vejo que de uma forma praticamente constante a quantidade de memória livre vem caindo sistematicamente. Em pouco tempo entrará em alerta vermelho. Isso provavelmente significa que algum programa que roda neste servidor tem um defeito de programação conhecido como “memory leak”, ou seja, vazamento de memória. Usa o recurso e não o devolve apropriadamente para o sistema operacional. Deve ser feita uma busca seletiva do tal programa e enquanto não se descobre o real vilão da memória, programar um “restart” deste servidor é uma medida eficaz e necessária, caso contrário em alguns dias o servidor pode entrar em colapso por causa de falta de memória. Sem o PRTG seria muito difícil, senão impossível, ter esta visão e poder agir antes que algo ruim acontecesse.

De forma análoga os gráficos me ajudam a analisar outro problema reportado pelos sensores, o espaço em disco muito baixo, perto de 8%.  Analisando o gráfico abaixo vemos que em 30 dias houve um decréscimo de 10% para 8% no espaço livre, com algumas variações para cima e para baixo (algum tipo de movimentação de arquivos). Conclusões que posso tirar. Se nada for feito entre 3 e 4 meses este servidor entrará em colapso por falta de espaço para arquivos. Posso não ter ampliar o espaço amanhã, mas isso deve ser programado para nos próximos 30 dias no máximo.

Uso de HD nos últimos 30 dias – clique para ampliar

Estes são apenas dois exemplos muito simples de como observar os sensores de forma evolutiva é importante e como isso pode ajudar a antecipar problemas. Eu sei que ainda há uma quantidade colossal de informações a absorver e interpretar, bem como tantas outras ainda por coletar e monitorar. Mas enquanto isso posso olhar sempre que quiser a coleção de eventos críticos que aconteceram acompanhados pelo PRTG (tela abaixo).

Eventos críticos dos últimos dias – clique para ampliar

Usando o console do PRTG – Web e Desktop

O que torna o PRTG muito interessante e prático é sua forma de acesso, pois usando qualquer navegador como Internet Explorer, Chrome, Firefox, Safari, etc. ganhamos acesso ao sistema. Porém além desta forma há versão de aplicativos para vários ambientes. A versão PRTG Desktop Windows é incrivelmente sofisticada e com o uso das janelas, abas com diversas categorias de informações, tendo acesso a qualquer dado de qualquer dispositivo a apenas um ou dois cliques de mouse, etc. Claro que a interface Web consegue reproduzir toda funcionalidade, mas o aplicativo tem uma apresentação bastante rica e agradável na versão Desktop. Confesso que no dia a dia, como o aplicativo está instalado no próprio servidor onde reside o PRTG, acabo usando mais a versão Web.

PRTG versão aplicativo Windows – clique para ampliar

Mas havia outra surpresa preparada pelo PRTG para mim. No site da empresa, http://www.paessler.com estão disponíveis aplicativos para smartphones para que o PRTG possa ser usado no celular em qualquer lugar. Estão disponíveis para as plataformas iOS (iPhone) e Android.

Exemplo das telas do PRTG usado em um smartphone Android


Forma de contratação do produto

A Paessler é extremamente clara e transparente. Seus preços de listas (todos) estão publicados em seu site e a cobrança se dá em função da quantidade de sensores disponíveis para utilização. Relembro que há uma versão gratuita ilimitada que funciona por 30 dias, uma versão gratuita eterna que suporta 10 sensores e as contidas nas tabelas abaixo.

A primeira tabela é o custo de licenciamento inicial do produto em função do número de sensores. Por exemplo, 1000 sensores (uma quantidade extremamente generosa mesmo para redes médias tornando-se grandes) custa US$ 2.230. Isso inclui também um ano de suporte e atualizações gratuitas do software. A segunda tabela contém os custos para extensão do suporte por 12, 24 ou 36 meses após a expiração da contratação adicional.

 
PRTG – custos de licenciamento, suporte e atualização

Convém explicar o que significam as versões UNLIMITED e CORPORATE (as duas últimas da primeira tabela). A versão Unlimited como o próprio nome sugere não impõe limite ao número de sensores que podem ser configurados em uma instalação do PRTG, sejam 5000, 10000, 20000... A versão Corporate também é uma versão ilimitada em relação à quantidade de sensores, porém ela pode ser instalada em servidores distintos, em várias localidades, vários escritórios, filiais, unidades fabris, etc.

Conclusão

É desnecessário justificar a importância de uma ferramenta deste tipo. Não se discute. O PRTG é um produto que vai se mostrando aos poucos. Não há um dia que eu o manipule que não encontro uma tela nova, um tipo novo de sensor, um gráfico que eu não havia analisado ainda, uma forma de organizar os segmentos de redes ou servidores e assim por diante.

O conceito de licenciamento por sensores é muito interessante e também democrático. Cada um usa aquilo que realmente precisa e quando precisa. O que me chamou a atenção foram a grande simplicidade de uso, as várias formas de ativação de sensores, desde a descoberta automática de todos os parâmetros de apenas um dispositivo, como a descoberta de uma só vez da rede toda!!! Neste último caso possivelmente o administrador do PRTG desejará limpar vários sensores de que ele não precisa, mas é muito útil vasculhar a rede toda uma vez que por vezes são encontrados dispositivos esquecidos e que só assim são resgatados pela equipe de TI, nem que seja para desativá-los de vez.

Acesso via Web, também por um rico aplicativo desktop e aplicativos para os smartphones são de grande destaque pela riqueza na exibição de informações de um lado e pela praticidade de levar um console PRTG no bolso e acompanhar eventos importantes.

A política de preços é clara e transparente, publicada no site do produto, bem como as condições de suporte e manutenção. No Brasil há revendas habilitadas a vender o produto e até prestar serviços de implantação. Tive apenas uma situação que não ficou bem resolvida na minha implantação do PRTG que foi a impossibilidade de testar o funcionamento de um servidor DHCP. O sensor para isso não está completo e por isso espero que em uma das próximas atualizações venha a acrescentar esta importante facilidade, acabei me valendo de um artifício para isso.

Simplicidade, facilidade de uso, preço transparente, excelência técnica, riqueza na quantidade e variedade de sensores e ser um incrível instrumento para realizar análises e tirar conclusões. Estas são as virtudes que vi no PRTG. Afinal ter uma infraestrutura sem monitoração é como dirigir um carro às cegas. Por isso mesmo o PRTG é essencial para descobrir pontos de possíveis falhas antes mesmos delas ocorrerem e manter tudo funcionando.

7 comentários:

  1. Minha empresa é Parceira Oficial da Paessler no Brasil.
    Temos descontos muito bons em cima das licenças e parcelamos também.
    Qualquer coisa contato@lokstic.com.br

    ResponderExcluir
  2. Ótimo artigo meu amigo, sucesso à todos nós

    ResponderExcluir
  3. Parabéns pelo excelente artigo Flavio. A MAX3D incorporou o PRTG em seu Portfólio de produtos por conhecer os benefícios da Solução, mas não havíamos colocado estes benefícios com tanta clareza quanto você. Parabéns novamente!

    ResponderExcluir
  4. Para realização de Piloto (PoC) gratuito de PRTG favor preencher o Formulário a seguir:

    http://monitorarrede.com.br/piloto-de-prtg/

    ResponderExcluir
  5. Acesse o Curso GRATUITO sobre o PRTG para Monitoramento de Redes de Computadores!

    Clique Aqui! ==> http://bit.ly/MAX3D_PRTG3_2

    ResponderExcluir