Log Analytics é um conjunto de informações coletadas de eventos capturados no ecossistema de TI a partir de redes, sistemas operacionais e computadores.
Uma análise de registro pode descobrir padrões ou anomalias nos comportamentos do usuário, identificar problemas e revelar problemas de segurança.
A análise de registros fornece a oportunidade de monitoramento ativo para analisar o desempenho, os comportamentos e quaisquer anomalias no aplicativo. O monitoramento proativo pode ajudar uma equipe a identificar quaisquer problemas que não acionaram um alerta ou que tenham uma explicação exclusiva. Independentemente de acionar ou não um alerta, ele será exibido nos dados do registro.
Dados agregados e estruturados podem fornecer a oportunidade de solução de problemas em todos os níveis. A análise de registros fornece uma linha de base para a atividade padrão, o que pode ajudar a determinar por que algo pode ter se desviado da linha de base.
As equipes de TI têm visibilidade de registros e métricas usando um painel de alto nível que fornece uma exibição unificada das informações para facilitar a análise. Os painéis fornecem a capacidade de destacar KPIs, SLAs e outras estatísticas necessárias usando dados de uma análise de registros.
A análise de registros oferece o benefício de informações sobre dados de tendências e taxas de crescimento. Um histograma pode ajudar a visualizar uma taxa de crescimento que pode auxiliar no gerenciamento do ciclo de vida e no planejamento da capacidade.
O software para análise de registros reúne informações de eventos em todo o ecossistema de TI, como: violações de segurança, instalação de aplicativos e operações de configuração/inicialização do sistema.
É importante usar dados utilizáveis e precisos. Existe a possibilidade de os dados serem corrompidos se:
- O disco de armazenamento travar.
- Os aplicativos não forem encerrados corretamente.
- Um vírus infectar o sistema.
- Houver problemas de configuração de entrada/saída.
Os dados tendem a usar diferentes convenções de nomenclatura, pois são coletados de várias fontes. É importante correlacionar os dados das várias fontes e padronizar a terminologia para reduzir confusão e erros durante a análise.
Os dados estão prontos para revisão assim que forem coletados, limpos e organizados. Há vários métodos de análise dependendo dos processos, do uso pretendido dos dados e do tamanho dos conjuntos de dados. Algumas das opções incluem:
- Classificação: pode ser mais fácil filtrar e ajustar dados quando eles são rotulados com etiquetas de palavras-chave que os organizam em diferentes categorias.
- Reconhecimento de padrões: a detecção de padrões por meio da filtragem de mensagens pode ajudar no reconhecimento de padrões de dados que podem auxiliar na detecção de anomalias.
- Ignorância artificial: os dados podem ser mais difíceis de examinar com mensagens de registro de rotina aumentando a densidade. A ignorância artificial é um sistema de aprendizado de máquina que ignora mais atualizações de rotina, a menos que elas não ocorram.
- Análise de correlação: pode ser ineficaz coletar informações de servidores, sistemas operacionais e dispositivos de rede quando não há uma maneira de comparar os dados caso haja um único evento em todo o sistema. A análise de correlação funciona por meio de mensagens de todos os componentes relacionados a um evento.
Isso também é conhecido como detecção de anomalias multidimensionais.
Os desenvolvedores têm mais tempo livre para se concentrar nas funcionalidades e aumentar o valor de um aplicativo em vez de gastar tempo solucionando problemas de latência e desempenho. As versões são aceleradas e há menos atrasos causados por problemas inesperados.
Muitas empresas precisam aderir a padrões e regulamentos, como HIPAA, PCI DSS, GDPR e outros, além dos requisitos de conformidade interna. As auditorias são conduzidas regularmente usando o Log Analytics para garantir que futuras auditorias não falhem, o que pode incorrer em multas caras se a organização não estiver em conformidade.
As organizações podem responder mais rapidamente a ameaças de segurança (inclusive ameaças de invasores e DOS) e encontrar a causa raiz de forma mais eficiente. Os eventos futuros poderão ser evitados quando uma causa raiz for identificada e o problema for reconciliado.
Vários departamentos contam com a TI para cumprir tarefas e responsabilidades. A análise de registros fornece a capacidade de detectar erros ou problemas do sistema antes que eles resultem em uma interrupção e os solucionam de forma eficiente e rápida. A análise de registros também faz parte da manutenção dos acordos de nível de serviço entre as equipes de TI, outros departamentos e clientes. A proatividade ajuda a evitar interrupções de serviço e tempo de inatividade de produtos, o que pode levar à perda de receita.
Organizações e equipes individuais podem melhorar o próprio processo de tomada de decisão, avaliar estratégias e fazer ajustes necessários. A análise de registros torna tudo isso possível.
Os registros oferecem a oportunidade de reunir informações sobre conversões, volume de tráfego e como os visitantes navegam em um site. Isso dá a oportunidade de analisar as interações e determinar se a experiência do cliente pode ou não ser melhorada ou se a equipe de vendas precisa ajustar as mensagens.
É importante acessar o máximo possível de informações quando algo falhar. Há dois tipos de aplicativos de monitoramento:
- Baseado em regras: quando as coisas que devem ser monitoradas são identificadas, as ferramentas de análise de registros podem ser usadas para identificar erros e otimizar aplicativos. Uma equipe pode criar seu próprio conjunto de regras para gerar alertas usando uma série de canais diferentes. Mas as regras baseiam-se em pessoas para conhecer todas as possíveis questões que podem ocorrer antecipadamente, o que não se dimensiona no atual ambiente de serviços digitais.
- Análise de registro de aprendizado de máquina: as ferramentas de aprendizado de máquina podem detectar problemas automaticamente e identificar anomalias no ecossistema de TI, inclusive o comportamento de um aplicativo. A ferramenta verifica os dados e interpreta os problemas que podem ocorrer.
As ferramentas padrão de análise de dados não são capazes de lidar com a variedade de volumes de dados da máquina que proliferam rapidamente. O Log Analytics envolve análise, visualização e dados da máquina gerados pelos sistemas de TI para coletar informações.
O recurso ServiceNow Health Log Analytics, parte do ITOM Predictive AIOps, alerta para sinais antecipados de possíveis indisponibilidades.
Com o ServiceNow ITOM Health Log Analytics, você pode:
- Obter informações sobre anomalias sem precisar estabelecer limites predefinidos.
- Obter visibilidade dos problemas que resultam de pontos cegos que você não poderia ter previsto com antecedência.
- Obter informações de causa raiz em tempo quase real, o que reduz significativamente o MTTR (tempo médio para reparo).
- Tomar medidas em relação aos alertas.
- Adicionar regras de alerta.
- Marcar alertas como significativos.
- Filtrar para reduzir o ruído.
- Exibir e ajustar o status das notificações de integridade do sistema.
- Adicionar um registro correlato para identificar relacionamentos nos logs.
Com a ServiceNow, preveja problemas antes que eles surjam.