Gestão de eventos preferências de configuração

Xanadu IT Operations Management

Release

xanadu

ft:locale

pt-BR

ft:publication_title

Xanadu IT Operations Management

ft:clusterId

itom

bundleId

itom

workflow

Technology

Gestão de eventos preferências de configuração

Versão de lançamento: Xanadu

Atualizado 1 de ago. de 2024

11 min. de leitura

Configurações preferenciais de propriedades e configuração geral.

Use o Portal de Erros Conhecidos e a Comunidade para ajudar você a encontrar problemas de informações.

Preferências gerais

Auto-integridade

Por padrão, o recurso de monitoramento de integridade automático não está habilitado. Para habilitá-lo, navegue até Gestão de eventos > Configurações > Propriedades e selecione Sim para a propriedade Enable Event Management self-health monitoring (evt_mgmt.self_health_active). Use este recurso para monitorar e rastrear muitos recursos Gestão de eventos.

Nota:

Os ICs usados no serviço de integridade automática são criados no CMDB.

Use as seguintes configurações para ajudar a evitar a degradação do desempenho.


Tópico	Detalhes
Regras de negócios	Evite escrever regras de negócios para tabelas de eventos [em_event], pois elas não são executadas na URL REST padrão atual que é usada para injeção de eventos. As regras de negócio que são escritas para tabelas de alerta [em_alert] devem ser altamente eficientes ou podem resultar em degradação do desempenho. Em vez de escrever uma regra de negócio, considere se é mais apropriado gravar um trabalho. Uma regra de negócio ineficiente pode fazer com que a criação de incidentes para um alerta falhe e o cálculo de impacto do alerta falhe. Não grave regras de negócio assíncronas para tabelas de alerta. As regras de negócio não devem mudar o campo Categoria nas tabelas de evento [em_event].
Escalonamento	Verifique o tempo médio de processamento de eventos antes de aumentar o rendimento de eventos ao iniciar pela primeira vez com Gestão de eventos. Faça esta verificação após um fluxo inicial de eventos e todas as regras estejam em vigor. Se o tempo de processamento demorar mais de alguns milissegundos por evento, determine a causa da lentidão do processamento antes de continuar a escalonar. A duração do desempenho pode ser verificada na tabela Estatísticas de desempenho [sa_performance_statistics].
Configure para ambientes de grande escala	Defina a propriedade Habilitar processamento de eventos de vários nós (evt_mgmt.event_processor_enable_multi_node) como Sim. Habilite vários nós em ambientes de produção e defina valores com base no tamanho da implantação e na taxa de eventos esperada. Defina a propriedade Número de eventos de processamento de trabalhos agendados (evt_mgmt.event_processor_job_count) como `4`. Se você estiver enviando eventos de uma origem personalizada, verifique se os eventos têm dados deChave de mensagem ou Origem, Nó, Tipoe Recurso.
Problemas de latência para receber eventos	Verifique as seguintes configurações: Verifique se o campo Bucket na tabela de eventos [em_event] está definido com um valor maior que zero (0). Navegar até Scheduler do Sistema > Trabalhos agendados e pesquise por - process events. Verifique se todos os trabalhos - process events existem de acordo com a configuração da propriedade Número de trabalhos agendados que processam eventos (event_processor_job_count). Verifique se o Estado é Running ou Ready. Se o estado for Queued ou Error, defina o estado do trabalho como Ready.
Arquivar eventos	Evite alterar o tempo de retenção padrão para eventos. Para registrar eventos por mais tempo, crie uma tabela de arquivamento e um trabalho que copie novos eventos para ela. Faça isso programando um trabalho para fazer backup regular de eventos [em_event] em uma tabela personalizada. Não estenda a rotação da tabela adicionando mais dias.

Integração de eventos

Interceptações SNMP

Use uma ferramenta de monitoramento para enviar interceptações SNMP, em vez de enviá-las diretamente dos dispositivos.
Para evitar a necessidade de reescrever regras de evento, carregue MIBs antes de definir as regras de evento.

API de serviço web

O uso de uma API de serviço Web para integração pode reduzir o número de regras de evento necessárias. Esta ação evita a necessidade de transformar eventos (os dados preparados são enviados em um evento para a instância).
Use credenciais dedicadas para integração. Opcionalmente, designe credenciais específicas para cada origem de evento.

CloudWatch

Use credenciais dedicadas para integrar o CloudWatch com ServiceNow.

E-mail

Use o e-mail somente se a origem tiver um baixo volume e outras opções não estiverem disponíveis, como executar um script ou encaminhar uma interceptação SNMP.

Regras de evento

Definições de configuração ao criar regras de evento:

Grave regras de evento para aplicar ao maior número possível de eventos. Regras mais específicas podem ser criadas conforme necessário e devem usar um valor de ordem inferior.
Se uma regra mais geral puder alcançar o mesmo resultado, evite escrever Regras de evento que se apliquem somente a um determinado subconjunto de eventos.
Quando as Regras de evento são aplicadas a eventos, nenhuma mudança é feita no evento original. Todo o processamento ocorre na memória, portanto, use o campo Anotações de processamento e/ou use o link Verificar processo de ação de IU do evento para solucionar problemas.
Se você alterar uma regra/transformação que tenha regras de mapeamento existentes, revise e teste novamente com eventos reais ou simulados.
Certifique-se de que o valor do campo De corresponda exatamente a uma cadeia de caracteres no JSON no campo additional_info de um evento. Essa correspondência acontece quando uma regra é configurada com base nas informações em um arquivo MIB. Se o arquivo MIB não for carregado, o JSON da interceptação SNMP mostrará varbinds (vinculação de variável) com nomes pontilhados, em vez do nome traduzido no MIB. A regra de mapeamento de campo de evento falha na aplicação.
Estabeleça uma convenção de nomenclatura consistente. Uma convenção comum é: <customer acronym>.<Event Source>.<Description>. Por exemplo, ACME.OEM.Normalize
Se duas Regras de Evento tiverem condições semelhantes definidas, use o campo Ordem para controlar qual Regra de Evento é executada.
Use Regras de evento para associar um alerta a um IC.

Configurações adicionais para criar regras de evento:


Resultado desejado	Atividade necessária
Desduplicação eficaz e processamento eficiente de eventos paralelos	Preencha os campos Origem, Nó, Tipo, Recursoe Nome da métrica.
Vinculação de IC	Vincule ao host — preenchendo o campo Nó e, opcionalmente, os identificadores de IC. Vinculação à aplicação e/ou dispositivo – preenchendo o campo Identificadores de IC e o campo Informações adicionais.
Correlação de alertas, usando agregação de alertas	Preencha os campos Recurso e Nome da métrica. Nota: Se o IC também estiver vinculado, a correlação de alertas será aprimorada.

Campos de evento personalizado: Inclua campos adicionais somente no campo Informações adicionais do evento.; Não adicione campos adicionais a um evento adicionando um campo personalizado à tabela de eventos [em_event].; Não adicione colunas à tabela de eventos [em_event].

Para obter informações sobre como incluir campos adicionais em eventos, consulte Campos de alerta personalizados.

Desduplicação: Definições de configuração para desduplicação.

O campo message_key é usado para desduplicação. Se valores de chave de mensagem confiáveis não forem fornecidos com o evento de origem, é importante ter um plano bem definido para construir esses identificadores.
Se a chave de mensagem não estiver definida, a chave de mensagem padrão será <Source + Node + Type + Resource + Metric Name> .
A diretriz é fazer com que a origem do evento preencha os campos <Source + Node + Type + Resource + Metric Name> prontos para uso e preencha a chave da mensagem. Esta ação permite uma melhor distribuição do processamento de eventos entre trabalhadores e nós da instância.
Se o evento de origem não tiver valores para esses campos, certifique-se de preenchê-los usando regras de transformação. Esta ação não afeta o processamento de eventos, mas é usada para desduplicação. Preencha o maior número possível desses campos antes que eles sejam enviados para a instância. Esta ação fornece melhor distribuição de eventos sobre os trabalhadores do processador e, portanto, melhor rendimento e escala.

Vinculação de IC

Sempre que possível, tente vincular um alerta a um IC.
Nota:
Embora as Regras de evento sejam definidas em eventos, os ICs são vinculados a alertas que resultam desses eventos e não estão vinculados ao evento.
Para vincular um host, máquina ou qualquer dispositivo a um IP, preencha o campo Nó do evento com um nome de host exclusivo, FQDN, IP ou endereço MAC. Se outros identificadores forem necessários para identificar um host, preencha o campo ci_identifiers com um formato JSON. O formato JSON deve conter o nome e o valor do campo do CMDB para executar a correspondência.
Nota:
O campo Nó de evento deve ser preenchido a partir de uma regra de evento ou preenchido com um nome de host exclusivo da origem antes que o evento seja inserido.
A estratégia de vinculação primária é usar o campo Nó. Se o campo Nó não estiver preenchido previamente no evento, ele poderá ser preenchido usando regras de evento.

Configurações de alerta

Ciclo de vida do alerta: Funcionalidade de alerta geral:

Um alerta é aberto sempre que um evento não é ignorado ou seu limite é excedido por uma regra de evento, e a desduplicação não identifica o evento como pertencente a um alerta existente.
Um alerta é encerrado quando um evento de encerramento é enviado na mesma chave de mensagem ou o alerta é encerrado manualmente.
Um alerta será reaberto se um alerta de abertura que tiver a mesma chave de mensagem for enviado dentro do intervalo de tempo definido nas propriedades (o padrão é uma hora).
Se um alerta for aberto e fechado em uma taxa alta, conforme definido nas propriedades, ele ficará oscilando. Quando essa taxa de abertura e fechamento para, o alerta sai do estado de oscilação.
Se um incidente for aberto a partir de um alerta, esse alerta permanecerá aberto enquanto o incidente permanecer aberto. Por padrão, quando o incidente ou o alerta é encerrado, o outro também é encerrado. Este comportamento pode ser configurado usando propriedades.
Não feche um alerta ao criar um incidente correspondente.
Não exclua um alerta em aberto. Feche um alerta primeiro e, em seguida, exclua-o.
Use Confirmar para indicar que o alerta é conhecido e pode ser temporariamente ignorado.
Não use Confirmar para marcar um alerta como precisando de atenção.
Não crie alertas em nenhum destes estados:
- Encerrado
- OK
- Abrir
A propriedade evt_mgmt.alert_auto_close_interval fecha automaticamente os alertas após o período especificado. Não especifique 0, pois esse valor desabilita o recurso e pode levar à degradação do desempenho.
Não crie alertas no estado OK. Em alguns sistemas de monitoramento, OK indica que um problema foi resolvido, enquanto em outros sistemas de monitoramento, OK é usado para denotar eventos que não são de importância operacional. Para o primeiro caso, use Limpar em vez de OK usando uma Regra de Mapeamento. Para o último caso, tenha uma regra de Ignorar, a menos que os eventos tenham um valor específico.

Regras de ação de alerta

Um trabalho agendado aplica regras de ação de alerta a novos alertas a cada 11 segundos. Se uma regra de alerta não for iniciada imediatamente, aguarde de 10 a 15 segundos antes de iniciar a solução de problemas.
Use o campo Ordem para controlar qual Regra de Alerta será executada se duas Regras de Alerta tiverem condições semelhantes definidas.
Use regras de ação de alerta com modelos de tarefa para preencher valores estáticos em um incidente. Use o script preenchedor para atribuir valores dinâmicos no incidente. O script do preenchedor pode retornar um valor falso para anular a criação do incidente.
Crie um usuário chamado Gestão de eventos (ou um nome semelhante). Em seguida, o campo Criado por em um modelo de tarefa (por exemplo, Incidente) pode ser definido para indicar que o usuário era a origem da tarefa.
Para executar qualquer atribuição de valor dinâmico ou para substituir a atribuição de valor dinâmico OOB, use a inclusão de script EvtMgmtCustomIncidentPopulator.

Correção

Sempre defina as propriedades do fluxo de trabalho de orquestração para a tabela Tarefa de correção [em_remediation_task].
Usar Fila do ECC e Fluxo de trabalho > Fluxo de trabalho em tempo real > Todos os Contextos para encontrar informações mais detalhadas sobre atividades de correção.

Regras de negócio

As regras de negócio criadas em tabelas de alerta não devem demorar mais do que alguns milissegundos. Em vez de usar uma regra de negócio, considere se a mesma funcionalidade pode ser alcançada usando um trabalho.
Não use regras de negócio para associar um alerta a um IC. Use regras de evento para fazer a vinculação em vez de usar regras de negócio.

Planejamento

Organize a configuração de origem de evento de filtros, módulos e assim por diante em vários esforços paralelos, em vez de em série.
Valide formatos de eventos processados para garantir que os dados analisados estejam alinhados com os resultados desejados.
Teste eventos de produção em um ambiente de não produção. Integre com gerenciadores de elementos de não produção e instâncias ServiceNow. Se os gerenciadores de elementos de não produção não estiverem disponíveis, envie eventos dos gerenciadores de elementos para ambientes de produção e não produção.

Serviços e painel

Use Grupos de Serviço para agrupar serviços em grupos lógicos para reduzir o número de serviços exibidos no painel de Integridade de Serviço.
Importe mapas de serviço criados manualmente.

Inteligência para métricas logs e arquivos do coletor

Inteligência para métricas logs e arquivos do coletor estão localizados no caminho $(MID_SERVER_DIR)/agent. Use esses logs e arquivos para fins de solução de problemas e monitoramento.

Tabela 1. Local de Inteligência para métricas logs e arquivos do coletor
Registrar ou arquivo	Caminho
Arquivo de log do coletor de métricas do PowerShell	Logs/retrieve_metrics{ID da instância do conector}.log
Arquivo de saída do PowerShell	work/metrics/metrics_output_{ID da instância do conector}.txt
Arquivo de entrada do PowerShell	work/metrics/parameters_{connector instance ID}.txt

O desempenhoInteligência para métricas pode ser verificado no arquivo de log MID Server quando o parâmetro mid.log.level MID Server está no modo de depuração.

Inteligência para métricas Os números de desempenho estão disponíveis na tabela Estatísticas de desempenho [sa_performance_statistics]. Para exibir os números de desempenho, filtre a lista Estatísticas de desempenho do Coletor de métricas.