Gestão de eventos preferências de configuração

  • Versão de lançamento: Xanadu
  • Atualizado 1 de ago. de 2024
  • 11 min. de leitura
  • Configurações preferenciais de propriedades e configuração geral.

    Use o Portal de Erros Conhecidos e a Comunidade para ajudar você a encontrar problemas de informações.

    Preferências gerais

    Auto-integridade
    Por padrão, o recurso de monitoramento de integridade automático não está habilitado. Para habilitá-lo, navegue até Gestão de eventos > Configurações > Propriedades e selecione Sim para a propriedade Enable Event Management self-health monitoring (evt_mgmt.self_health_active). Use este recurso para monitorar e rastrear muitos recursos Gestão de eventos.
    Nota:
    Os ICs usados no serviço de integridade automática são criados no CMDB.
    Use as seguintes configurações para ajudar a evitar a degradação do desempenho.
    Tópico Detalhes
    Regras de negócios
    • Evite escrever regras de negócios para tabelas de eventos [em_event], pois elas não são executadas na URL REST padrão atual que é usada para injeção de eventos.
    • As regras de negócio que são escritas para tabelas de alerta [em_alert] devem ser altamente eficientes ou podem resultar em degradação do desempenho. Em vez de escrever uma regra de negócio, considere se é mais apropriado gravar um trabalho. Uma regra de negócio ineficiente pode fazer com que a criação de incidentes para um alerta falhe e o cálculo de impacto do alerta falhe.
    • Não grave regras de negócio assíncronas para tabelas de alerta.
    • As regras de negócio não devem mudar o campo Categoria nas tabelas de evento [em_event].
    Escalonamento Verifique o tempo médio de processamento de eventos antes de aumentar o rendimento de eventos ao iniciar pela primeira vez com Gestão de eventos. Faça esta verificação após um fluxo inicial de eventos e todas as regras estejam em vigor. Se o tempo de processamento demorar mais de alguns milissegundos por evento, determine a causa da lentidão do processamento antes de continuar a escalonar. A duração do desempenho pode ser verificada na tabela Estatísticas de desempenho [sa_performance_statistics].
    Configure para ambientes de grande escala
    • Defina a propriedade Habilitar processamento de eventos de vários nós (evt_mgmt.event_processor_enable_multi_node) como Sim.

      Habilite vários nós em ambientes de produção e defina valores com base no tamanho da implantação e na taxa de eventos esperada.

    • Defina a propriedade Número de eventos de processamento de trabalhos agendados (evt_mgmt.event_processor_job_count) como 4.
    • Se você estiver enviando eventos de uma origem personalizada, verifique se os eventos têm dados deChave de mensagem ou Origem, , Tipoe Recurso.
    Problemas de latência para receber eventos Verifique as seguintes configurações:
    • Verifique se o campo Bucket na tabela de eventos [em_event] está definido com um valor maior que zero (0).
    • Navegar até Scheduler do Sistema > Trabalhos agendados e pesquise por - process events*.

      Verifique se todos os trabalhos - process events* existem de acordo com a configuração da propriedade Número de trabalhos agendados que processam eventos (event_processor_job_count). Verifique se o Estado é Running ou Ready. Se o estado for Queued ou Error, defina o estado do trabalho como Ready.

    Arquivar eventos
    • Evite alterar o tempo de retenção padrão para eventos.
    • Para registrar eventos por mais tempo, crie uma tabela de arquivamento e um trabalho que copie novos eventos para ela. Faça isso programando um trabalho para fazer backup regular de eventos [em_event] em uma tabela personalizada.
    • Não estenda a rotação da tabela adicionando mais dias.

    Integração de eventos

    Interceptações SNMP
    • Use uma ferramenta de monitoramento para enviar interceptações SNMP, em vez de enviá-las diretamente dos dispositivos.
    • Para evitar a necessidade de reescrever regras de evento, carregue MIBs antes de definir as regras de evento.
    API de serviço web
    • O uso de uma API de serviço Web para integração pode reduzir o número de regras de evento necessárias. Esta ação evita a necessidade de transformar eventos (os dados preparados são enviados em um evento para a instância).
    • Use credenciais dedicadas para integração. Opcionalmente, designe credenciais específicas para cada origem de evento.
    CloudWatch
    Use credenciais dedicadas para integrar o CloudWatch com ServiceNow.
    E-mail
    Use o e-mail somente se a origem tiver um baixo volume e outras opções não estiverem disponíveis, como executar um script ou encaminhar uma interceptação SNMP.
    Regras de evento
    Definições de configuração ao criar regras de evento:
    • Grave regras de evento para aplicar ao maior número possível de eventos. Regras mais específicas podem ser criadas conforme necessário e devem usar um valor de ordem inferior.
    • Se uma regra mais geral puder alcançar o mesmo resultado, evite escrever Regras de evento que se apliquem somente a um determinado subconjunto de eventos.
    • Quando as Regras de evento são aplicadas a eventos, nenhuma mudança é feita no evento original. Todo o processamento ocorre na memória, portanto, use o campo Anotações de processamento e/ou use o link Verificar processo de ação de IU do evento para solucionar problemas.
    • Se você alterar uma regra/transformação que tenha regras de mapeamento existentes, revise e teste novamente com eventos reais ou simulados.
    • Certifique-se de que o valor do campo De corresponda exatamente a uma cadeia de caracteres no JSON no campo additional_info de um evento. Essa correspondência acontece quando uma regra é configurada com base nas informações em um arquivo MIB. Se o arquivo MIB não for carregado, o JSON da interceptação SNMP mostrará varbinds (vinculação de variável) com nomes pontilhados, em vez do nome traduzido no MIB. A regra de mapeamento de campo de evento falha na aplicação.
    • Estabeleça uma convenção de nomenclatura consistente. Uma convenção comum é: <customer acronym>.<Event Source>.<Description>. Por exemplo, ACME.OEM.Normalize
    • Se duas Regras de Evento tiverem condições semelhantes definidas, use o campo Ordem para controlar qual Regra de Evento é executada.
    • Use Regras de evento para associar um alerta a um IC.
    Configurações adicionais para criar regras de evento:
    Resultado desejado Atividade necessária
    Desduplicação eficaz e processamento eficiente de eventos paralelos Preencha os campos Origem, , Tipo, Recursoe Nome da métrica.
    Vinculação de IC
    • Vincule ao host — preenchendo o campo e, opcionalmente, os identificadores de IC.
    • Vinculação à aplicação e/ou dispositivo – preenchendo o campo Identificadores de IC e o campo Informações adicionais.
    Correlação de alertas, usando agregação de alertas Preencha os campos Recurso e Nome da métrica.
    Nota:
    Se o IC também estiver vinculado, a correlação de alertas será aprimorada.
    Campos de evento personalizado
    Inclua campos adicionais somente no campo Informações adicionais do evento.
    Não adicione campos adicionais a um evento adicionando um campo personalizado à tabela de eventos [em_event].
    Não adicione colunas à tabela de eventos [em_event].

    Para obter informações sobre como incluir campos adicionais em eventos, consulte Campos de alerta personalizados.

    Desduplicação
    Definições de configuração para desduplicação.
    • O campo message_key é usado para desduplicação. Se valores de chave de mensagem confiáveis não forem fornecidos com o evento de origem, é importante ter um plano bem definido para construir esses identificadores.
    • Se a chave de mensagem não estiver definida, a chave de mensagem padrão será <Source + Node + Type + Resource + Metric Name> .
    • A diretriz é fazer com que a origem do evento preencha os campos <Source + Node + Type + Resource + Metric Name> prontos para uso e preencha a chave da mensagem. Esta ação permite uma melhor distribuição do processamento de eventos entre trabalhadores e nós da instância.
    • Se o evento de origem não tiver valores para esses campos, certifique-se de preenchê-los usando regras de transformação. Esta ação não afeta o processamento de eventos, mas é usada para desduplicação. Preencha o maior número possível desses campos antes que eles sejam enviados para a instância. Esta ação fornece melhor distribuição de eventos sobre os trabalhadores do processador e, portanto, melhor rendimento e escala.
    Vinculação de IC
    • Sempre que possível, tente vincular um alerta a um IC.
      Nota:
      Embora as Regras de evento sejam definidas em eventos, os ICs são vinculados a alertas que resultam desses eventos e não estão vinculados ao evento.
    • Para vincular um host, máquina ou qualquer dispositivo a um IP, preencha o campo do evento com um nome de host exclusivo, FQDN, IP ou endereço MAC. Se outros identificadores forem necessários para identificar um host, preencha o campo ci_identifiers com um formato JSON. O formato JSON deve conter o nome e o valor do campo do CMDB para executar a correspondência.
      Nota:
      O campo de evento deve ser preenchido a partir de uma regra de evento ou preenchido com um nome de host exclusivo da origem antes que o evento seja inserido.
    • A estratégia de vinculação primária é usar o campo . Se o campo não estiver preenchido previamente no evento, ele poderá ser preenchido usando regras de evento.

    Configurações de alerta

    Ciclo de vida do alerta
    Funcionalidade de alerta geral:
    • Um alerta é aberto sempre que um evento não é ignorado ou seu limite é excedido por uma regra de evento, e a desduplicação não identifica o evento como pertencente a um alerta existente.
    • Um alerta é encerrado quando um evento de encerramento é enviado na mesma chave de mensagem ou o alerta é encerrado manualmente.
    • Um alerta será reaberto se um alerta de abertura que tiver a mesma chave de mensagem for enviado dentro do intervalo de tempo definido nas propriedades (o padrão é uma hora).
    • Se um alerta for aberto e fechado em uma taxa alta, conforme definido nas propriedades, ele ficará oscilando. Quando essa taxa de abertura e fechamento para, o alerta sai do estado de oscilação.
    • Se um incidente for aberto a partir de um alerta, esse alerta permanecerá aberto enquanto o incidente permanecer aberto. Por padrão, quando o incidente ou o alerta é encerrado, o outro também é encerrado. Este comportamento pode ser configurado usando propriedades.
    • Não feche um alerta ao criar um incidente correspondente.
    • Não exclua um alerta em aberto. Feche um alerta primeiro e, em seguida, exclua-o.
    • Use Confirmar para indicar que o alerta é conhecido e pode ser temporariamente ignorado.
    • Não use Confirmar para marcar um alerta como precisando de atenção.
    • Não crie alertas em nenhum destes estados:
      • Encerrado
      • OK
      • Abrir
    • A propriedade evt_mgmt.alert_auto_close_interval fecha automaticamente os alertas após o período especificado. Não especifique 0, pois esse valor desabilita o recurso e pode levar à degradação do desempenho.
    • Não crie alertas no estado OK. Em alguns sistemas de monitoramento, OK indica que um problema foi resolvido, enquanto em outros sistemas de monitoramento, OK é usado para denotar eventos que não são de importância operacional. Para o primeiro caso, use Limpar em vez de OK usando uma Regra de Mapeamento. Para o último caso, tenha uma regra de Ignorar, a menos que os eventos tenham um valor específico.
    Regras de ação de alerta
    • Um trabalho agendado aplica regras de ação de alerta a novos alertas a cada 11 segundos. Se uma regra de alerta não for iniciada imediatamente, aguarde de 10 a 15 segundos antes de iniciar a solução de problemas.
    • Use o campo Ordem para controlar qual Regra de Alerta será executada se duas Regras de Alerta tiverem condições semelhantes definidas.
    • Use regras de ação de alerta com modelos de tarefa para preencher valores estáticos em um incidente. Use o script preenchedor para atribuir valores dinâmicos no incidente. O script do preenchedor pode retornar um valor falso para anular a criação do incidente.
    • Crie um usuário chamado Gestão de eventos (ou um nome semelhante). Em seguida, o campo Criado por em um modelo de tarefa (por exemplo, Incidente) pode ser definido para indicar que o usuário era a origem da tarefa.
    • Para executar qualquer atribuição de valor dinâmico ou para substituir a atribuição de valor dinâmico OOB, use a inclusão de script EvtMgmtCustomIncidentPopulator.
    Correção
    • Sempre defina as propriedades do fluxo de trabalho de orquestração para a tabela Tarefa de correção [em_remediation_task].
    • Usar Fila do ECC e Fluxo de trabalho > Fluxo de trabalho em tempo real > Todos os Contextos para encontrar informações mais detalhadas sobre atividades de correção.

    Regras de negócio

    • As regras de negócio criadas em tabelas de alerta não devem demorar mais do que alguns milissegundos. Em vez de usar uma regra de negócio, considere se a mesma funcionalidade pode ser alcançada usando um trabalho.
    • Não use regras de negócio para associar um alerta a um IC. Use regras de evento para fazer a vinculação em vez de usar regras de negócio.

    Planejamento

    • Organize a configuração de origem de evento de filtros, módulos e assim por diante em vários esforços paralelos, em vez de em série.
    • Valide formatos de eventos processados para garantir que os dados analisados estejam alinhados com os resultados desejados.
    • Teste eventos de produção em um ambiente de não produção. Integre com gerenciadores de elementos de não produção e instâncias ServiceNow. Se os gerenciadores de elementos de não produção não estiverem disponíveis, envie eventos dos gerenciadores de elementos para ambientes de produção e não produção.

    Serviços e painel

    • Use Grupos de Serviço para agrupar serviços em grupos lógicos para reduzir o número de serviços exibidos no painel de Integridade de Serviço.
    • Importe mapas de serviço criados manualmente.

    Inteligência para métricas logs e arquivos do coletor

    Inteligência para métricas logs e arquivos do coletor estão localizados no caminho $(MID_SERVER_DIR)/agent. Use esses logs e arquivos para fins de solução de problemas e monitoramento.

    Tabela 1. Local de Inteligência para métricas logs e arquivos do coletor
    Registrar ou arquivo Caminho
    Arquivo de log do coletor de métricas do PowerShell Logs/retrieve_metrics{ID da instância do conector}.log
    Arquivo de saída do PowerShell work/metrics/metrics_output_{ID da instância do conector}.txt
    Arquivo de entrada do PowerShell work/metrics/parameters_{connector instance ID}.txt

    O desempenhoInteligência para métricas pode ser verificado no arquivo de log MID Server quando o parâmetro mid.log.level MID Server está no modo de depuração.

    Inteligência para métricas Os números de desempenho estão disponíveis na tabela Estatísticas de desempenho [sa_performance_statistics]. Para exibir os números de desempenho, filtre a lista Estatísticas de desempenho do Coletor de métricas.