terça-feira, 25 de setembro de 2018

PRTG 2018 Monitorando o ambiente de TI, teste completo - parte 2/3

Parte 1/3 - PRTG 2018 A vital importância da monitoração do ambiente de TI
Parte 2/3 - PRTG 2018 Monitorando o ambiente de TI, teste completo

Testando o PRTG – características do ambiente e instalação inicial

O PRTG é uma ferramenta que se adapta tão bem às minhas necessidades que venho renovando minhas análises de tempos em tempos. Pude testá-lo pela primeira vez em 2012  e na ocasião escrevi o texto “PRTG– monitorando totalmente sua rede e infraestrutura”.

Na sequência, em 2014 revisitei a ferramenta e escrevi o texto “PRTG2014 – monitorando ainda mais de perto a infraestrutura crítica” .

Em 2016, por causa das novidades e inovações fiz nova análise do PRTG que resultou no texto “PRTG2016 – monitoração da infraestrutura ampla e versátil, teste detalhado em situação real!”.
Fica claro que o conceito do produto e suas características não são novos para mim. Mas a Paessler vem trabalhando intensamente ano após ano e importantes evoluções têm sido implementadas, na forma, na interface, funcionalidades e na sua forma de uso que justificam a nova avaliação.  O ambiente usado desta vez era formado pelas seguintes localidades, equipamentos e características.
  • 8 localidades remotas
  • 16 servidores físicos
  • 30 servidores virtuais
  • 18 links de Internet
  • 45 pontos de acesso WiFi
  • 31 impressoras de rede
  • 9 roteadores Duais de Internet
  • 25 switches
  • mais de 500 usuários em todas as localidades·

Este cenário exposto indica que este teste não foi feito em “condição de laboratório” e sim em regime de uso real, em empresa real, infraestrutura em operação no dia a dia. Nada melhor do que isso para colocar à prova o PRTG e também realizar comparações com o Zabbix, um produto de mercado que se coloca em seu segmento de mercado. Este é um dos principais propósitos desta avaliação. Dar uma visão comparativa entre as duas soluções, implementação, usabilidades, facilidades, dificuldades, virtudes e produtividade no uso do PRTG comparado com o Zabbix.

O ponto central de atenção, os sensores!

Saber se algo vai bem ou mal parece ser algo simples, mas requisitos básicos são necessários. Deve existir um ponto de observação, uma variável a ser medida e esta medida deve poder ser comparada um dado padrão, uma referência. Embora em outro contexto, o brilhante economista Peter Drucker dizia “o que pode ser medido pode ser melhorado”. Trazendo isso tudo para o ambiente de TI traduzimos os pontos de observação como os sensores do PRTG.

No ambiente de TI, não é difícil enumerar os elementos que necessitam de acompanhamento para análise, diagnósticos, procedimentos preventivos, corretivos, etc. Esta é a grande riqueza do PRTG! Existe uma diversidade de sensores que vai além do óbvio e que permitem monitorações de cenários bastante complexos. E a cada nova versão da ferramenta, novos tipos de sensores são apresentados bem como funcionalidades periféricas ao mundo da monitoração, mas que tornam o trabalho muito mais fácil.


visão geral do ambiente sendo monitorado (clique para ampliar)

A cada versão do PRTG novas possibilidades de monitoração são introduzidas, aprimoradas ou aperfeiçoadas. São muitos pontos de interesse como monitoração de hardware, ambientes de software, rede, tráfego de dados, etc. Comercialmente o produto é licenciado pela quantidade de sensores disponíveis. Por isso é importante avaliar com cuidado a real necessidade de pontos de controle, pois se forem usados sensores em quantidade mais elevada, será necessário adquirir uma licença que suporte mais sensores. A troca da versão é extremamente simples, basta adquirir a nova licença, informa-la que o o número de sensores será ampliado.

Ao contrário do que se poderia imaginar, sensores demais implantados no ambiente de TI, e visíveis no painel do PRTG, podem “poluir” o console dificultando a indentificacao do que é mais importante para ser analisado. Precisa ser encontrado o equilíbrio entre a quantidade, a qualidade e a capacidade e avaliar as informações, mas o PRTG ajuda nessa tarefa.

Citar neste texto a totalidade dos sensores existentes no PRTG não é produtivo e não faz sentido, pois a quantidade é muito grande! Porém existem alguns que considero “básicos” e que geralmente são o ponto de partida de qualquer implantação. São estes o sensor de “presença” (resposta ao comando PING), nível de uso de CPU, espaço livre em disco, tempo em atividade, páginas impressas, etc. Mas há sensores bastante especializados que monitoram aplicações específicas como SQL Server, Microsoft Exchange, Oracle, servidor Web, etc.
  

exemplo de monitoração de Microsoft SQL – vários sensores  (clique para ampliar)


Nas recentes versões do PRTG este tipo de monitoramento especializado veio crescendo. Não apenas servidores Windows, mas Linux, ambientes de virtualização, etc. No caso de servidores Windows eu pude implantar sensores acompanhando a saúde de serviços específicos que são vitais para as operações. Assim se algum destes falhar, parar de funcionar imediatamente uma ação pode ser tomada. Além disso, o PRTG permite que se configure a reativação de um servico, caso o mesmo  seja interrompido,. Assim não apenas o PRTG avisa se um serviço parar, indicando uma anomalia a ser resolvida, como também toma uma ação corretiva!  Essa nem é a função do PRTG e sim monitorar, mas para apenas este tipo de sensor, ele tem essa capacidade.

Na tela abaixo podem ser vistos alguns serviços críticos como DNS, DHCP, Firewall, Update, etc. que escolhi monitorar em um dos servidores.
  

exemplo de monitoração de serviços do Microsoft Windows Server  (clique para ampliar)

Um problema real e complexo solucionado com ajuda do PRTG

No passado este recurso de monitorar serviços e reiniciar serviços já tinha me ajudado. Eu tive um problema com serviço NETLOGON que impedia acesso a pastas compartilhadas. Mas neste novo teste aconteceu novamente e em um cenário bastante intrincado. Em um dos servidores o serviço DHCP estava parando em momentos aleatórios (ao menos eu achava que era). Isso impedia que novos computadores entrassem na rede ao serem ligados. Ao ativar o recurso de reativar o serviço uma vez detectado que estava parado, ajudou a mitigar o problema.

Mas também ajudou a resolver em definitivo. Havia um access point na rede cuja tomada de força estava com mau contato. Isso fazia com que ele fosse religado de vez em quando. Depois descobri que este access point mesmo quando configurado com seu próprio DHCP desligado, no momento de “boot” ele subia com o DHCP ligado e depois era deligado. Servidor DHCP do Windows é desativado se outro DHCP na rede é identificado (o access point). Uma das vezes que pesquisava os logs do PRTG e do Windows descobri o conflito de 2 DHCPs desligado. Identificado o IP achei o access point. Mas não entendia pois estava desativado o DHCP. Fiz a atualização do firmware deste access point e o problema foi resolvido. De fato, Ele mesmo desativado entrava pós boot com o DHCP ligado e depois desligava, mas algumas vezes isso fazia desligar o mesmo serviço do Windows. Não fosse identificar isso nos logs, com ajuda do PRTG o Windows ficaria com o DHCP errático até hoje!
  

Gerenciador DHCP do Windows monitorado pelo PRTG

Detalhando o ambiente do teste

Escolhi para instalação a sede de uma empresa, local com infraestrutura mais complexa, que tem algumas localidades remotas. Assim teria como trabalhar inicialmente na rede local e posteriormente nas localidades remotas.

Já conhecia de outras implantações o recurso “Auto-Discovery”, muito prático, pois vasculha a rede, acha dispositivos e em função da política escolhida, aloca sensores básicos ou detalhados. Usei o modo “sensores básicos” e centenas de dispositivos foram localizados, incluindo os computadores de usuários. É possível selecionar dezenas de dispositivos de uma só vez e exclui-los uma vez que não são necessários e foi isso que eu fiz quando  foi preciso.

Em alguns dos servidores que não obtive o grau de informação que eu esperava,  executei novamente o Auto-Discovery com opção para alocar mais sensores e assim obter mais pontos de análise. Por outro lado, em alguns servidores foram ativados 20, 30 ou até mais sensores.

A função de Auto-Discovery pode ser feita para a rede toda, geralmente na implantação inicial. Mas também pode ser chamada depois, para completar sensores de um dispositivo que tem poucas informações introduzindo dezenas, muitas delas de novos sensores para aquele dispositivo.
  

adicionando sensores com Auto-Discovery

Nesta situação é importante a atuação do administrador do PRTG que com sua sensibilidade poderá rever os sensores e manter apenas aquilo que lhe é mais importante. Os sensores não essenciais podem ser selecionados e eliminados de uma vez só. É comum no início querer ter sensores de tudo e para tudo. Mas isso não é útil e pode até atrapalhar.

Fazendo uma analogia com a UTI médica, que utilidade tem de saber constantemente o comprimento do cabelo do paciente? Ou no caso de um servidor, quantas vezes o arquivo de paginação de memória virtual foi usado? Salvo se este servidor estiver apresentando lentidão extrema... Essa é grande característica do PRTG. Por trazer uma imensa variedade de sensores, na hora que algum evento extraordinário acontecer, que necessite de maior análise, sensores adicionais podem ser alocados neste momento, usados e depois desativados. Faz mais sentido monitorar aquilo que de fato é relevante para aquele ambiente.

Nas primeiras versões do PRTG era mais difícil usar o Auto-Discovery porque os dispositivos e sensores, em grande quantidade, eram alocados no painel de dispositivos, de forma não muito estruturada. Mas 2016 os dispositivos são automaticamente inseridos em um grupo chamado Network-Discovery e em subgrupos com nomes muitodidáticos como Servidores, Network, Virtual Systems, Impressoras, etc. Dessa forma fazer a os ajustes necessários, escolher dispositivos e sensores para apagar ou para manter fica muito mais simples.

Monitoração de filiais ou escritórios com Sondas Remotas


No ambiente de teste havia algumas filiais e pequenos escritórios remotos. Como conseguir também fazer a monitoração destes ambientes? Assim como existem as sondas espaciais, sondas submarinas, equipamentos enviados para lugares longínquos para analisar, estudar e obter informações, o PRTG também tem o conceito de sondas exatamente para endereçar este tipo de situação.

Localidades remotas, filiais, escritórios em outros endereços não têm obrigatoriamente conectividade VPN ou canais dedicados (como MPLS) com a matriz onde está instalado o núcleo do PRTG, o conceito de sonda se aplica muito bem. O acesso ao servidor PRTG se dá também por meio da Internet. É uma aplicação bem leve, instalada em pequenos servidores locais ou mesmo em simples estações de trabalho.

Sondas remotas - arquitetura

Caso o ambiente remoto seja extenso, muitos sensores sendo usados em muitos dispositivos, o processamento da sonda seria mais intenso e poderia requerer um computador dedicado. A segurança no acesso à sonda é garantida por fortes medidas de segurança, evitando acesso indevido. Na instalação uma senha é gerada para ela (para realizar a conexão com o PRTG central), o IP de acesso tem que ser previamente cadastrado/autorizado e, além disso, a sonda tem que ser aprovada no console do PRTG. Lembrete importante. No ponto central a porta TCP 23560 deve ser aberta no Firewall e redirecionado o tráfego desta porta para o servidor que executa o PRTG (Core Server).
  

Sonda remota  (clique para ampliar)

Uma vez que a sonda esteja instalada e aprovada o administrador do PRTG pode solicitar que um “Auto-Discovery” aconteça na rede remota para localizar dispositivos, alocar sensores, assim como na instalação do núcleo central do PRTG ou permitir que sensores sejam definidos manualmente. Dessa forma os escritórios remotos têm o mesmo nível de atenção e monitoração que o ponto central. Simples e eficiente!

Importante destacar a maneira como o PRTG lida com atualizações de versões na sua rede em relação às sondas remotas. Quando o núcleo do PRTG é atualizado, as sondas recebem esta informação e procedem a atualização de forma automática. Assim a comunicação com as sondas é garantida e após a atualização eventuais novos recursos para os sensores (ou novos sensores) estarão disponíveis nas localidades remotas.

Interface Web, aplicativo para PC e para dispositivos móveis

A interface natural de utilização do PRTG é o console WEB. Afinal, dessa forma a partir de qualquer computador situado no mundo todo o administrador poderá se conectar ao PRTG e realizar a totalidade das tarefas de monitoração, criação de novos sensores, implantação de sondas remotas, etc.

Aliás, a interface Web vem se renovando e se modernizando versão a versão. Desde a primeira versão que testei em 2012 a tela inicial foi recebendo informações importantes e ao mesmo tempo tornando-se mais clara e didática.
  

Tela inicial do PRTG – interface Web  (clique para ampliar)

Usei a expressão “interface didática” porque o que logo chama a atenção é este gráfico de “anel” que já comunica a quantidade de sensores em uso, visualmente mostra quantos estão verdes, amarelos (aviso) e vermelhos (alerta). No segundo gráfico ao lado, também na forma de anel, os avisos e alertas são representados, bem como a quantidade de cada um deles. No exemplo REAL acima eram 73 avisos (algo que não era problema, mas poderiam ser avaliados) e os “para baixo”, ou seja “down” dispositivos ou sensores que estão fora do padrão indicando problemas.
  


Visão geral da rede e sondas remotas  – interface Web  (clique para ampliar)



Toda a funcionalidade do PRTG está presente na interface Web, mas apesar disso existe o aplicativo chamado PRTG Desktop. É um programa “clássico”, no meu caso executado no Windows que com outra metáfora visual mostra as mesmas informações da versão Web.
  

Tela inicial do PRTG – PRTG Desktop (clique para ampliar)

Existe uma importante diferença entre o PRTG Desktop e a Interface Web. Embora mostrem as mesmas informações, o PRTG Desktop, quando carregado, tem a capacidade de acionar uma tela com alertas críticos quando eles ocorrem. A Paessler está substituindo a Enterprise Console pelo novo programa PRTG Desktop. Está em uma versão beta que pode ser usada e avaliada em www.paessler.com/prtg/prtg-desktop .


Tela inicial do PRTG – Enterprise Console que será descontinuado (clique para ampliar)

Também existe aplicativo equivalente para dispositivos móveis. Dessa forma o administrador pode ser informado da saúde de sua infraestrutura onde quer que ele esteja. Mesmo sem um computador para acesso ao PRTG pela Web (ou PRTG Desktop). Existem versões para iOS e Android. No passado havia para Windows Phone e Blackberry (usei esta versão em 2012) que pelo baixo uso desses sistemas foram descontinuados. Usando uma interface simplificada mostra dispositivos, sondas remotas e localidades. Usa a mesma notação, cores e padrões visuais para que cada dispositivo ou localidade possa ser avaliado. Aquele elemento que apresenta um alarme pode ser aberto e a cada toque na tela mais detalhes vão sendo abertos até saber o problema. Tickets de suporte podem ser visualizados e alarmes podem ser suspensos temporariamente (uma impressora que entrou em manutenção por 3 dias o sensor pode ser suspenso por este tempo para que não gere alarmes nestes dias).

O PRTG permite que notificações mais sensíveis sejam entregues imediatamente ao aplicativo. Normalmente é feito um “refresh” de status dos sensores a cada “x” segundos. Mas pode ser configurado para que se uma determinada situação ocorrer, um sistema de entrega de informação via e assim o administrador, um usuário ou todo um grupo seja instantaneamente notificado.


tela do PRTG versão smartphone – avaliando um sensor sem problema  (clique para ampliar)



tela do PRTG versão smartphone – avaliando um evento  com problema (clique para ampliar)

Sistema de Tickets de suporte para gestão das ocorrências

Além de tudo que o PRTG já faz, desde algumas versões ele traz consigo um recurso muito bem-vindo! Trata-se de um sistema para que analistas e usuários interajam nas atribuições de suporte para resolução de incidentes. Feito pensando nas ações e pendências de suporte gerados pelos alertas e alarmes enviados pelo PRTG, mas que pode ser usar além disso, um verdadeiro bônus este recurso para as áreas de TI interagirem entre si e com os usuários.

Quando o PRTG identifica uma situação de erro ou de alerta, descoberto por meio de seus sensores, além do alarme no painel de controle outras ações importantes também podem ser executadas. Uma mensagem com os dados do alarme pode ser enviada para o endereço de e-mail designado. Se a situação se modificar sem intervenção outro e-mail é enviado notificando que aquela situação se normalizou, por exemplo, uma indisponibilidade temporária de link de Internet, um excesso de consumo de CPU em um servidor, etc.

Geralmente o que faz disparar um alarme exige intervenção de um operador ou de um analista de suporte para corrigir o problema., seja naquele mesmo momento ou após breve intervalo. O PRTG gera alguns Tickets automaticamente, fruto de tarefas ou ações administrativas do próprio PRTG como notificação de término de Auto-Discovery ou necessidade de aprovação de uma sonda remota.
Adicionalmente o administrador do sistema pode criar Tickets de suporte relativos aos alarmes disparados ou outras tarefas. Assim a tarefa de lidar com aquela situação pode ser designada para uma pessoa específica (que tem o conhecimento para lidar com o assunto). Esta pessoa vai receber um e-mail e também quando ela entra no PRTG com seu login aparecerão todas as tarefas que lhe foram designadas. Quem abriu os Tickets pode atribuir 5 níveis de prioridade, assim o responsável fará a sua programação de trabalho baseada nas pendências que lhe foram atribuídas.
   

tela do PRTG Desktop - sistema de tickets  (clique para ampliar)

Alertas preditivos para antecipação de problemas:

É um recurso presente no PRTG há um bom tempo, mas que traz novos elementos para análise, visando antecipar problemas. Trata-se dos alertas de comportamentos não usuais! Ontem mesmo obtive o alerta mostrado abaixo. A rede estava funcionando perfeitamente, nenhum sensor com indicação de erro. Mas fui avisado, um dos servidores apresentou a mensagem “o acesso a este endereço (PING) está anormalmente alta para esta hora do dia”. Sabem a importância disso? O tal endereço era apenas o DNS externo usado pelo roteador de acesso à Internet, apresentando alta latência em um domingo. Imediatamente troquei este DNS por outro, senão na segunda feira, com centenas de pessoas usando esta rede o acesso à Internet ficaria bastante comprometido!! Muito bom ter esta função. Achei sensacional!

A tela abaixo mostra este caso de atividade não usual. Veja que a cor do alerta é laranja e o código é “U”, ou seja, “Unusual” (não usual em inglês). De fato, este alerta foi emitido em um final de semana, momento no qual um PING de 132ms é realmente alto. Isso provocou investigação por minha parte, descobri que um processo de replicação entre servidores estava em andamento, fator que causou este comportamento.
  

tela do PRTG Desktop– avaliando um alerta, evento não usual (clique para ampliar)

Relatórios
:

Os sensores geram um número muito grande de dados que são organizados e administrados pelo PRTG,  e que são bastante importantes para manter os administradores imediatamente a par dos acontecimentos que podem impactar os processos de negócio, interrupções, fragilidades, etc.. Mas o PRTG também tem importantes ferramentas para análise da base histórica de dados. Trata-se de um módulo de relatórios que traz alguns modelos prontos bastante interessantes como:
  • Relação de todos os sensores utilizados
  • Dispositivos mais estáveis e os mais instáveis
  • Dispositivos com maio e menor tempo de resposta ao PING
  • Dispositivos com maior e menor uso de banda de rede
  • Outros tipos de relatórios

Além destes modelos, que podem ser emitidos com algumas condições de filtro, período de análise, etc. existe uma ferramenta geradora de relatórios para que o administrador possa ele mesmo criar o relatório com as informações importantes para ele. Os relatórios prontos ou os criados pelos usuários podem conter dados numéricos ou gráficos.


relatórios padrão do PRTG  (clique para ampliar)



exemplo de relatório de PINGs mais lentos do PRTG  (clique para ampliar)



Conclusão

A evolução constante é fator muito importante, ainda mais em uma categoria que é crítica para o negócio das empresas. Ao testar o PRTG em 2012, 2014, 2016 e agora em 2018 a evolução do sistema é perceptível.  

A interface da versão Web recebeu uma nova organização, novas informações, um dashboard de dados da rede, dispositivos, sensores, avisos e alarmes. Adicionar sensores aos dispositivos ficou mais fácil, seja pelos atalhos criados, seja pelo assistente que direciona às inclusões de forma muito simples. As sondas remotas já não mais têm indisponibilidade apenas por um breve período (nesta versão senti ser mais rápido que em versões anteriores essa atualização) quando há alteração de versão do núcleo do PRTG.

O desempenho e navegação do aplicativo para smartphone está muito bom. E por fim, como acontece em cada nova versão, o conjunto de sensores tem sido ampliado permitindo que mais e mais situações, cenários e ambientes sejam analisados, monitorados e administrados.

Comercialmente a Paessler tem uma postura muito clara e transparente em relação à comercialização do PRTG, bem flexível. Existe uma versão de demonstração, que é ilimitada por 30 dias, com capacidade ilimitada. A Paessler é bastante transparente com sua política comercial, publicada no site, provendo versões com 500 sensores, 1000 sensores, 2500 sensores e  5000 sensores. Há ainda versões corporativas ilimitadas inclusive no nível de abrangência mundial. Veja na figura abaixo.
 
política de comercialização baseada em quantidade de sensores

Uma implantação pode começar com a versão de demonstração de 30 dias (sem limites) e após este prazo, em função da necessidade efetiva de monitoração, contratar a modalidade do produto com o volume de sensores conveniente. No futuro, se a necessidade crescer, a ferramenta pode, por exemplo, crescer de 500 para 1000 sensores (ou mais).

O grande valor do PRTG transcende à motivação técnica. Poder atuar sobre um evento técnico logo que ele ocorra, ou mesmo fruto da análise proporcionada pelo produto, permitindo prevenir a ocorrência de um problema sério, que poderia interromper atividades críticas da empresa, é algo essencial para as empresas atualmente, tão dependentes de seus recursos de tecnologia. O efeito prático do teste no ambiente desta empresa foi bem perceptível. O nível de problemas, indisponibilidade de recursos e tempo para reação a incidentes ficou sensivelmente menor.

Assim, vejo o PRTG em 2018 como um produto evoluído, maduro, robusto, cujo valor para as empresas é fundamental, afinal ter informação sobre seus processos de negócios, dependentes de tecnologia é importantíssimo. Simples de instalar e de manter, flexível, ampla gama de sensores, muita informação como alarmes, relatórios, gráficos, é no mínimo uma ferramenta que deve ser experimentada caso a empresa ainda não desfruta deste tipo de tecnologia ou se utiliza um produto complexo e complicado. Pode valer a pena a troca.

O PRTG pode ser obtido no site da Paessler em sua versão totalmente gratuita, ilimitada (sem restrições de sensores) que será operacional por 30 dias. Existe também uma versão gratuita, porém limitada a apenas 100 sensores, que é adequada para redes pequenas e também para experimentação por prazo maior.
  

download do PRTG versões Free e Trial

Nenhum comentário:

Postar um comentário