Fica claro que o conceito do produto e suas características
não são novos para mim. Mas a Paessler vem trabalhando intensamente ano após
ano e importantes evoluções têm sido implementadas, na forma, na interface,
funcionalidades e na sua forma de uso que justificam a nova avaliação. O ambiente usado desta vez era formado pelas
seguintes localidades, equipamentos e características.
- 8 localidades remotas
- 16 servidores físicos
- 30 servidores virtuais
- 18 links de Internet
- 45 pontos de acesso WiFi
- 31 impressoras de rede
- 9 roteadores Duais de Internet
- 25 switches
- mais de 500 usuários em todas as localidades·
Este cenário exposto indica que este teste não foi feito em
“condição de laboratório” e sim em regime de uso real, em empresa real,
infraestrutura em operação no dia a dia. Nada melhor do que isso para colocar à
prova o PRTG e também realizar
comparações com o Zabbix, um produto
de mercado que se coloca em seu segmento de mercado. Este é um dos principais
propósitos desta avaliação. Dar uma visão comparativa entre as duas soluções, implementação,
usabilidades, facilidades, dificuldades, virtudes e produtividade no uso do
PRTG comparado com o Zabbix.
O ponto central de atenção, os sensores!
Saber se algo vai bem ou mal parece ser algo simples, mas requisitos básicos
são necessários. Deve existir um ponto de observação, uma variável a ser medida
e esta medida deve poder ser comparada um dado padrão, uma referência. Embora
em outro contexto, o brilhante economista Peter Drucker dizia “o que pode ser medido
pode ser melhorado”. Trazendo isso tudo para o ambiente de TI traduzimos os
pontos de observação como os sensores do PRTG.
No ambiente de TI, não é difícil enumerar os elementos que necessitam de
acompanhamento para análise, diagnósticos, procedimentos preventivos,
corretivos, etc. Esta é a grande riqueza do PRTG! Existe uma diversidade de
sensores que vai além do óbvio e que permitem monitorações de cenários bastante
complexos. E a cada nova versão da ferramenta, novos tipos de sensores são apresentados
bem como funcionalidades periféricas ao mundo da monitoração, mas que tornam o
trabalho muito mais fácil.
visão
geral do ambiente sendo monitorado (clique para ampliar)
A cada versão do PRTG novas possibilidades de monitoração
são introduzidas, aprimoradas ou aperfeiçoadas. São muitos pontos de interesse
como monitoração de hardware, ambientes de software, rede, tráfego de dados,
etc. Comercialmente o produto é licenciado pela quantidade de sensores disponíveis.
Por isso é importante avaliar com cuidado a real necessidade de pontos de controle,
pois se forem usados sensores em quantidade mais elevada, será necessário adquirir
uma licença que suporte mais sensores. A troca da versão é extremamente simples,
basta adquirir a nova licença, informa-la que o o número de sensores será
ampliado.
Ao contrário do que se poderia imaginar, sensores demais implantados no
ambiente de TI, e visíveis no painel do PRTG, podem “poluir” o console dificultando
a indentificacao do que é mais importante para ser analisado. Precisa ser
encontrado o equilíbrio entre a quantidade, a qualidade e a capacidade e avaliar
as informações, mas o PRTG ajuda
nessa tarefa.
Citar neste texto a totalidade dos sensores existentes no
PRTG não é produtivo e não faz sentido, pois a quantidade é muito grande! Porém
existem alguns que considero “básicos” e que geralmente são o ponto de partida
de qualquer implantação. São estes o sensor de “presença” (resposta ao comando
PING), nível de uso de CPU, espaço livre em disco, tempo em atividade, páginas
impressas, etc. Mas há sensores bastante especializados que monitoram
aplicações específicas como SQL Server, Microsoft Exchange, Oracle, servidor
Web, etc.
exemplo de
monitoração de Microsoft SQL – vários sensores
(clique para ampliar)
Nas recentes versões do PRTG este tipo de monitoramento
especializado veio crescendo. Não apenas servidores Windows, mas Linux,
ambientes de virtualização, etc. No caso de servidores Windows eu pude
implantar sensores acompanhando a saúde de serviços específicos que são vitais
para as operações. Assim se algum destes falhar, parar de funcionar imediatamente
uma ação pode ser tomada. Além disso, o PRTG permite que se configure a
reativação de um servico, caso o mesmo seja
interrompido,. Assim não apenas o PRTG avisa se um serviço parar, indicando uma
anomalia a ser resolvida, como também toma uma ação corretiva! Essa nem é a função do PRTG e sim monitorar,
mas para apenas este tipo de sensor, ele tem essa capacidade.
Na tela abaixo podem ser vistos alguns serviços críticos como DNS, DHCP,
Firewall, Update, etc. que escolhi monitorar em um dos servidores.
exemplo de
monitoração de serviços do Microsoft Windows Server (clique para ampliar)
Um problema real e complexo solucionado com ajuda do PRTG
No passado este recurso de monitorar serviços e reiniciar serviços já tinha me
ajudado. Eu tive um problema com serviço NETLOGON que impedia acesso a pastas
compartilhadas. Mas neste novo teste aconteceu novamente e em um cenário
bastante intrincado. Em um dos servidores o serviço DHCP estava parando em
momentos aleatórios (ao menos eu achava que era). Isso impedia que novos
computadores entrassem na rede ao serem ligados. Ao ativar o recurso de
reativar o serviço uma vez detectado que estava parado, ajudou a mitigar o
problema.
Mas também ajudou a resolver em definitivo. Havia um access point na rede cuja
tomada de força estava com mau contato. Isso fazia com que ele fosse religado
de vez em quando. Depois descobri que este access point mesmo quando
configurado com seu próprio DHCP desligado, no momento de “boot” ele subia com
o DHCP ligado e depois era deligado. Servidor DHCP do Windows é desativado se
outro DHCP na rede é identificado (o access point). Uma das vezes que
pesquisava os logs do PRTG e do Windows descobri o conflito de 2 DHCPs
desligado. Identificado o IP achei o access point. Mas não entendia pois estava
desativado o DHCP. Fiz a atualização do firmware deste access point e o
problema foi resolvido. De fato, Ele mesmo desativado entrava pós boot com o
DHCP ligado e depois desligava, mas algumas vezes isso fazia desligar o mesmo
serviço do Windows. Não fosse identificar isso nos logs, com ajuda do PRTG o
Windows ficaria com o DHCP errático até hoje!
Gerenciador DHCP do Windows monitorado pelo PRTG
Detalhando o ambiente do teste
Escolhi para instalação a sede de uma empresa, local com infraestrutura
mais complexa, que tem algumas localidades remotas. Assim teria como trabalhar
inicialmente na rede local e posteriormente nas localidades remotas.
Já conhecia de outras implantações o recurso “Auto-Discovery”, muito prático,
pois vasculha a rede, acha dispositivos e em função da política escolhida,
aloca sensores básicos ou detalhados. Usei o modo “sensores básicos” e centenas
de dispositivos foram localizados, incluindo os computadores de usuários. É
possível selecionar dezenas de dispositivos de uma só vez e exclui-los uma vez
que não são necessários e foi isso que eu fiz quando foi preciso.
Em alguns dos servidores que não obtive o grau de informação que eu esperava, executei novamente o Auto-Discovery com opção
para alocar mais sensores e assim obter mais pontos de análise. Por outro lado,
em alguns servidores foram ativados 20, 30 ou até mais sensores.
A função de Auto-Discovery pode ser feita para a rede toda, geralmente na
implantação inicial. Mas também pode ser chamada depois, para completar
sensores de um dispositivo que tem poucas informações introduzindo dezenas,
muitas delas de novos sensores para aquele dispositivo.
adicionando sensores com Auto-Discovery
Nesta situação é importante a atuação do administrador do
PRTG que com sua sensibilidade poderá rever os sensores e manter apenas aquilo
que lhe é mais importante. Os sensores não essenciais podem ser selecionados e
eliminados de uma vez só. É comum no início querer ter sensores de tudo e para
tudo. Mas isso não é útil e pode até atrapalhar.
Fazendo uma analogia com a UTI médica, que utilidade tem de saber
constantemente o comprimento
do cabelodo
paciente? Ou no caso de um servidor, quantas vezes o arquivo de paginação de
memória virtual foi usado? Salvo se este servidor estiver apresentando lentidão
extrema... Essa é grande característica do PRTG. Por trazer uma imensa
variedade de sensores, na hora que algum evento extraordinário acontecer, que
necessite de maior análise, sensores adicionais podem ser alocados neste
momento, usados e depois desativados. Faz mais sentido monitorar aquilo que de
fato é relevante para aquele ambiente.
Nas primeiras versões do PRTG era mais difícil usar o Auto-Discovery porque os
dispositivos e sensores, em grande quantidade, eram alocados no painel de
dispositivos, de forma não muito estruturada. Mas 2016 os dispositivos são
automaticamente inseridos em um grupo chamado Network-Discovery e em subgrupos com
nomes muitodidáticos como Servidores, Network, Virtual Systems, Impressoras,
etc. Dessa forma fazer a os ajustes necessários, escolher dispositivos e
sensores para apagar ou para manter fica muito mais simples.
Monitoração de filiais ou escritórios com Sondas Remotas
No ambiente de teste havia algumas filiais e pequenos escritórios remotos. Como
conseguir também fazer a monitoração destes ambientes? Assim como existem as
sondas espaciais, sondas submarinas, equipamentos enviados para lugares
longínquos para analisar, estudar e obter informações, o PRTG também tem o
conceito de sondas exatamente para endereçar este tipo de situação.
Localidades remotas, filiais, escritórios em outros endereços não têm
obrigatoriamente conectividade VPN ou canais dedicados (como MPLS) com a matriz
onde está instalado o núcleo do PRTG, o conceito de sonda se aplica muito bem. O
acesso ao servidor PRTG se dá também por meio da Internet. É uma aplicação bem
leve, instalada em pequenos servidores locais ou mesmo em simples estações de
trabalho.
Sondas
remotas - arquitetura
Caso o ambiente remoto seja extenso, muitos sensores sendo
usados em muitos dispositivos, o processamento da sonda seria mais intenso e poderia
requerer um computador dedicado. A segurança no acesso à sonda é garantida por
fortes medidas de segurança, evitando acesso indevido. Na instalação uma senha
é gerada para ela (para realizar a conexão com o PRTG central), o IP de acesso
tem que ser previamente cadastrado/autorizado e, além disso, a sonda tem que
ser aprovada no console do PRTG. Lembrete importante. No ponto central a porta
TCP 23560 deve ser aberta no Firewall e redirecionado o tráfego desta porta
para o servidor que executa o PRTG (Core Server).
Sonda
remota (clique para ampliar)
Uma vez que a sonda esteja instalada e aprovada o
administrador do PRTG pode solicitar que um “Auto-Discovery” aconteça na rede
remota para localizar dispositivos, alocar sensores, assim como na instalação
do núcleo central do PRTG ou permitir que sensores sejam definidos manualmente.
Dessa forma os escritórios remotos têm o mesmo nível de atenção e monitoração que
o ponto central. Simples e eficiente!
Importante destacar a maneira como o PRTG lida com atualizações de versões na
sua rede em relação às sondas remotas. Quando o núcleo do PRTG é atualizado, as
sondas recebem esta informação e procedem a atualização de forma automática.
Assim a comunicação com as sondas é garantida e após a atualização eventuais
novos recursos para os sensores (ou novos sensores) estarão disponíveis nas
localidades remotas.
Interface Web, aplicativo
para PC e para dispositivos móveis
A interface natural de utilização do PRTG é o console WEB. Afinal, dessa
forma a partir de qualquer computador situado no mundo todo o administrador
poderá se conectar ao PRTG e realizar a totalidade das tarefas de monitoração,
criação de novos sensores, implantação de sondas remotas, etc.
Aliás, a interface Web vem se renovando e se modernizando versão a versão. Desde
a primeira versão que testei em 2012 a tela inicial foi recebendo informações
importantes e ao mesmo tempo tornando-se mais clara e didática.
Tela inicial
do PRTG – interface Web (clique para
ampliar)
Usei a expressão “interface didática” porque o que logo
chama a atenção é este gráfico de “anel” que já comunica a quantidade de
sensores em uso, visualmente mostra quantos estão verdes, amarelos (aviso) e
vermelhos (alerta). No segundo gráfico ao lado, também na forma de anel, os
avisos e alertas são representados, bem como a quantidade de cada um deles. No
exemplo REAL acima eram 73 avisos (algo que não era problema, mas poderiam ser
avaliados) e os “para baixo”, ou seja “down” dispositivos ou sensores que estão
fora do padrão indicando problemas.
Visão geral da rede e sondas remotas –
interface Web (clique para ampliar)
Toda a funcionalidade do PRTG está presente na interface Web, mas apesar disso
existe o aplicativo chamado PRTG Desktop. É um programa “clássico”, no meu caso
executado no Windows que com outra metáfora visual mostra as mesmas informações
da versão Web.
Tela inicial
do PRTG – PRTG Desktop (clique para ampliar)
Existe uma importante diferença entre o PRTG Desktop e a
Interface Web. Embora mostrem as mesmas informações, o PRTG Desktop, quando
carregado, tem a capacidade de acionar uma tela com alertas críticos quando
eles ocorrem. A Paessler está substituindo a Enterprise Console pelo novo programa
PRTG Desktop. Está em uma versão beta que pode ser usada e avaliada em
www.paessler.com/prtg/prtg-desktop
.
Tela inicial
do PRTG – Enterprise Console que será descontinuado (clique para ampliar)
Também existe aplicativo equivalente para dispositivos
móveis. Dessa forma o administrador pode ser informado da saúde de sua
infraestrutura onde quer que ele esteja. Mesmo sem um computador para acesso ao
PRTG pela Web (ou PRTG Desktop). Existem versões para iOS e Android. No passado
havia para Windows Phone e Blackberry (usei esta versão em 2012) que pelo baixo
uso desses sistemas foram descontinuados. Usando uma interface simplificada mostra
dispositivos, sondas remotas e localidades. Usa a mesma notação, cores e
padrões visuais para que cada dispositivo ou localidade possa ser avaliado.
Aquele elemento que apresenta um alarme pode ser aberto e a cada toque na tela
mais detalhes vão sendo abertos até saber o problema. Tickets de suporte podem
ser visualizados e alarmes podem ser suspensos temporariamente (uma impressora
que entrou em manutenção por 3 dias o sensor pode ser suspenso por este tempo
para que não gere alarmes nestes dias).
O PRTG permite que notificações mais sensíveis sejam entregues imediatamente ao
aplicativo. Normalmente é feito um “refresh” de status dos sensores a cada “x”
segundos. Mas pode ser configurado para que se uma determinada situação
ocorrer, um sistema de entrega de informação via e assim o administrador, um
usuário ou todo um grupo seja instantaneamente notificado.
tela
do PRTG versão smartphone – avaliando um sensor sem problema (clique para ampliar)
tela
do PRTG versão smartphone – avaliando um evento com problema (clique para ampliar)
Sistema de Tickets de
suporte para gestão das ocorrências
Além de tudo que o PRTG já faz, desde algumas versões ele traz consigo um
recurso muito bem-vindo! Trata-se de um sistema para que analistas e usuários
interajam nas atribuições de suporte para resolução de incidentes. Feito
pensando nas ações e pendências de suporte gerados pelos alertas e alarmes
enviados pelo PRTG, mas que pode ser usar além disso, um verdadeiro bônus este
recurso para as áreas de TI interagirem entre si e com os usuários.
Quando o PRTG identifica uma situação de erro ou de alerta, descoberto por meio
de seus sensores, além do alarme no painel de controle outras ações importantes
também podem ser executadas. Uma mensagem com os dados do alarme pode ser
enviada para o endereço de e-mail designado. Se a situação se modificar sem
intervenção outro e-mail é enviado notificando que aquela situação se
normalizou, por exemplo, uma indisponibilidade temporária de link de Internet,
um excesso de consumo de CPU em um servidor, etc.
Geralmente o que faz disparar um alarme exige intervenção de um operador ou de
um analista de suporte para corrigir o problema., seja naquele mesmo momento ou
após breve intervalo. O PRTG gera alguns Tickets automaticamente, fruto de
tarefas ou ações administrativas do próprio PRTG como notificação de término de
Auto-Discovery ou necessidade de aprovação de uma sonda remota.
Adicionalmente o administrador do sistema pode criar Tickets
de suporte relativos aos alarmes disparados ou outras tarefas. Assim a tarefa
de lidar com aquela situação pode ser designada para uma pessoa específica (que
tem o conhecimento para lidar com o assunto). Esta pessoa vai receber um e-mail
e também quando ela entra no PRTG com seu login aparecerão todas as tarefas que
lhe foram designadas. Quem abriu os Tickets pode atribuir 5 níveis de
prioridade, assim o responsável fará a sua programação de trabalho baseada nas
pendências que lhe foram atribuídas.
tela
do PRTG Desktop - sistema de tickets (clique para ampliar)
Alertas preditivos
para antecipação de problemas:
É um recurso presente no PRTG há um bom tempo, mas que traz novos elementos
para análise, visando antecipar problemas. Trata-se dos alertas de
comportamentos não usuais! Ontem mesmo obtive o alerta mostrado abaixo. A rede
estava funcionando perfeitamente, nenhum sensor com indicação de erro. Mas fui
avisado, um dos servidores apresentou a mensagem “o acesso a este endereço
(PING) está anormalmente alta para esta hora do dia”. Sabem a importância
disso? O tal endereço era apenas o DNS externo usado pelo roteador de acesso à
Internet, apresentando alta latência em um domingo. Imediatamente troquei este
DNS por outro, senão na segunda feira, com centenas de pessoas usando esta rede
o acesso à Internet ficaria bastante comprometido!! Muito bom ter esta função. Achei
sensacional!
A tela abaixo mostra este caso de atividade não usual. Veja que a cor do alerta
é laranja e o código é “U”, ou seja, “Unusual” (não usual em inglês). De fato,
este alerta foi emitido em um final de semana, momento no qual um PING de 132ms
é realmente alto. Isso provocou investigação por minha parte, descobri que um
processo de replicação entre servidores estava em andamento, fator que causou
este comportamento.
tela
do PRTG Desktop– avaliando um alerta, evento não usual (clique para ampliar)
Relatórios:
Os sensores geram um número muito grande de dados que são organizados e
administrados pelo PRTG, e que são bastante
importantes para manter os administradores imediatamente a par dos
acontecimentos que podem impactar os processos de negócio, interrupções,
fragilidades, etc.. Mas o PRTG também tem importantes ferramentas para análise
da base histórica de dados. Trata-se de um módulo de relatórios que traz alguns
modelos prontos bastante interessantes como:
- Relação de todos os sensores utilizados
- Dispositivos mais estáveis e os mais instáveis
- Dispositivos com maio e menor tempo de resposta ao PING
- Dispositivos com maior e menor uso de banda de rede
- Outros tipos de relatórios
Além destes modelos, que podem ser emitidos com algumas
condições de filtro, período de análise, etc. existe uma ferramenta geradora de
relatórios para que o administrador possa ele mesmo criar o relatório com as
informações importantes para ele. Os relatórios prontos ou os criados pelos
usuários podem conter dados numéricos ou gráficos.
relatórios
padrão do PRTG (clique para ampliar)
exemplo de relatório de PINGs mais lentos do PRTG (clique para ampliar)
Conclusão
A evolução constante é fator muito importante, ainda mais em uma categoria
que é crítica para o negócio das empresas. Ao testar o PRTG em 2012, 2014, 2016
e agora em 2018 a evolução do sistema é perceptível.
A interface da versão Web recebeu uma nova organização, novas informações, um
dashboard de dados da rede, dispositivos, sensores, avisos e alarmes. Adicionar
sensores aos dispositivos ficou mais fácil, seja pelos atalhos criados, seja
pelo assistente que direciona às inclusões de forma muito simples. As sondas
remotas já não mais têm indisponibilidade apenas por um breve período (nesta
versão senti ser mais rápido que em versões anteriores essa atualização) quando
há alteração de versão do núcleo do PRTG.
O desempenho e navegação do aplicativo para smartphone está muito bom. E por
fim, como acontece em cada nova versão, o conjunto de sensores tem sido
ampliado permitindo que mais e mais situações, cenários e ambientes sejam
analisados, monitorados e administrados.
Comercialmente a Paessler tem uma postura muito clara e transparente em relação
à comercialização do PRTG, bem flexível. Existe uma versão de demonstração, que
é ilimitada por 30 dias, com capacidade ilimitada.
A Paessler é bastante transparente com sua
política comercial, publicada no site, provendo versões com 500 sensores, 1000
sensores, 2500 sensores e 5000 sensores.
Há ainda versões corporativas ilimitadas inclusive no nível de abrangência
mundial. Veja na figura abaixo.
política
de comercialização baseada em quantidade de sensores
Uma implantação pode começar com a versão de demonstração de 30 dias (sem
limites) e após este prazo, em função da necessidade efetiva de monitoração,
contratar a modalidade do produto com o volume de sensores conveniente. No
futuro, se a necessidade crescer, a ferramenta pode, por exemplo, crescer de
500 para 1000 sensores (ou mais).
O grande valor do PRTG transcende à motivação técnica. Poder atuar sobre um
evento técnico logo que ele ocorra, ou mesmo fruto da análise proporcionada
pelo produto, permitindo prevenir a ocorrência de um problema sério, que
poderia interromper atividades críticas da empresa, é algo essencial para as
empresas atualmente, tão dependentes de seus recursos de tecnologia. O efeito
prático do teste no ambiente desta empresa foi bem perceptível. O nível de
problemas, indisponibilidade de recursos e tempo para reação a incidentes ficou
sensivelmente menor.
Assim, vejo o PRTG em 2018 como um produto evoluído, maduro, robusto, cujo
valor para as empresas é fundamental, afinal ter informação sobre seus
processos de negócios, dependentes de tecnologia é importantíssimo. Simples de
instalar e de manter, flexível, ampla gama de sensores, muita informação como
alarmes, relatórios, gráficos, é no mínimo uma ferramenta que deve ser
experimentada caso a empresa ainda não desfruta deste tipo de tecnologia ou se
utiliza um produto complexo e complicado. Pode valer a pena a troca.
O PRTG pode ser
obtido no site da Paessler
em sua versão totalmente gratuita, ilimitada (sem restrições de sensores) que
será operacional por 30 dias. Existe também uma versão gratuita, porém limitada
a apenas 100 sensores, que é adequada para redes pequenas e também para
experimentação por prazo maior.
download do PRTG versões Free e Trial