Fase 1 do operador: analisar e confirmar um alerta

  • Versão de lançamento: Xanadu
  • Atualizado 1 de ago. de 2024
  • 6 min. de leitura
  • Como um operador Gestão de eventos, a primeira coisa que você deve fazer é acessar os alertas e, em seguida, encontrar aqueles em que deseja se concentrar. Você pode abrir o formulário de Alerta para analisar os detalhes e confirmá-lo para que outros operadores saibam que o problema que causa o alerta deve ser resolvido de alguma forma.

    Antes de Iniciar

    Fase 1

    Ícone Analisar

    Analisar e confirmar um alerta

    Fase 2

    Ícone de triagem

    Alertas de triagem

    Fase 3

    Ícone Fechar alerta

    Fechar um alerta

    Você deve entender ambos os ambientes do operador: o Painel do Espaço de operações de serviços e o Espaço de operações de serviços. Revise Gestão de eventos ambiente do operador, caso ainda não tenha feito isso. Este tutorial usa o Painel do Espaço de operações de serviços.

    Função requerida: evt_mgmt_operator

    Procedimento

    1. Navegar até Gestão de eventos > Espaços > Espaço de operações de serviços.

      Na lista, clique em Alertas > Todos os Alertas. Por padrão, todos os alertas aparecem na lista classificada por Grupo. Clique em qualquer título para classificar por esse valor. Para exibir as configurações de filtro atuais, clique no ícone de filtro Ícone de filtro. Para modificar as configurações de filtro, clique em Exibição avançada.

      Lista de alertas
    2. Encontre os alertas nos quais se concentrar clicando em Serviços de aplicações > Serviçosou usando qualquer uma das opções de filtragem e classificação.
    3. Clique no nome de um alerta para abrir a guia Detalhes do alerta.
      Os campos importantes do formulário e os itens relacionados são descritos após a captura de tela.
      Detalhes do alerta
      Tabela 1. Campos na guia Detalhes do alerta para um alerta que está associado a um único IC
      Campo Descrição
      Número

      O número do alerta gerado automaticamente que você viu na lista de alertas no Painel do Espaço de operações de serviços.

      O nome do IC ao qual o alerta está associado. O evento que gerou o alerta ocorreu neste IC. Você pode ver um nome de computador ou um endereço IP ou endereço MAC de um dispositivo.
      Recurso O objeto no nó que causou o evento. Você pode ver valores como o nome de um disco rígido, uma CPU ou o nome de um processo ou serviço. Você pode adicionar informações a este campo, se necessário.
      Item de configuração O IC no CMDB ao qual este alerta se aplica. Se o campo estiver preenchido, mas este campo estiver vazio e se você souber qual IC o nó representa, poderá inserir o IC neste campo para associar manualmente o alerta a ele.
      Nota:
      Seu administrador pode configurar regras que vinculam automaticamente ICs a um alerta, geralmente com base no que está no campo . No entanto, é possível que o sistema não consiga encontrar o IC correto ao qual vincular o alerta. Nesse caso, talvez seja necessário selecionar um IC manualmente.

      Para fins deste tutorial, presumimos que o IC correto está vinculado ao alerta.

      Quando um alerta contém um IC, a guia Visão geral é aberta ao selecionar o alerta.

      Tarefa Qualquer tarefa existente associada ao alerta, como um incidente, solicitação de mudança ou problema, é mostrada neste campo. Quando você vê um alerta pela primeira vez, este campo está em branco. Você pode associar uma tarefa ao fazer a triagem do alerta. Você associa um incidente a um alerta e atribui o incidente a alguém em um estágio posterior neste tutorial.
      Descrição Uma descrição do alerta que veio do software de monitoramento de alertas em sua organização. Você pode adicionar informações, se necessário.
      Gravidade Valor de gravidade do alerta:
      • Crítico: requer ação imediata. O recurso não é funcional ou problemas críticos são iminentes.
      • Grave: funcionalidades principais estão gravemente afetadas ou o desempenho foi prejudicado.
      • Secundário: há uma perda parcial e não crítica de funcionalidade ou o desempenho foi degradado.
      • Aviso: é preciso atenção, embora o recurso ainda esteja funcional.
      • Informações: uma mensagem informativa. Um alerta é criado, mas o recurso ainda está funcional.
      • Limpar ou Resolvido: nenhuma ação é necessária. Um alerta não foi criado a partir deste evento. Os alertas existentes são encerrados.
      Estado O estado de processamento em que o alerta está. Um alerta recém-gerado está no estado Aberto. Outros estados são:
      • Reabrir indica que um alerta encerrado anteriormente está aberto novamente e requer sua atenção.
      • Aoscilação indica que o alerta está recebendo uma alta frequência de eventos idênticos da mesma origem, o que pode fazer com que muitos alertas sejam reabertos mesmo depois de encerrados.
      • Encerrado indica que o alerta está encerrado e não requer nenhuma ação adicional. Você fechará um alerta como parte da última fase deste tutorial.
      Manutenção

      Indica que o alerta não precisa ser trabalhado e está oculto na lista de alertas no Painel do Espaço de operações de serviços. Neste exemplo, não queremos colocar o alerta em manutenção.

      Reconhecido Indica que um operador verificou que o alerta é verdadeiro e o está fazendo a triagem. Você confirma o alerta em um estágio posterior neste tópico.

      Seu administrador Gestão de eventos também pode ter alertas reconhecidos automaticamente imediatamente após serem gerados. Se for esse o caso, a caixa de seleção Confirmar no formulário Alerta pode já estar marcada.

      Primária Exibe um valor somente para alertas secundários. O valor indica o número do alerta primário. O campo está vazio para alertas primários (alertas sem alerta primário).
      Artigo de conhecimento Qualquer artigo da base de conhecimento (KB) existente que esteja associado ao alerta. Quando você abre um alerta pela primeira vez, este campo está em branco. Você pode associar um artigo da base de conhecimento ao fazer a triagem do alerta.
    4. Clique na guia Serviços afetados e, em seguida, clique no nome do serviço.
      Antes de confirmar o alerta, talvez você queira saber mais sobre os serviços afetados devido ao serviço que é a origem do alerta.

      O serviço é aberto e exibe a guia Detalhes. Clique em Mapa de serviço para exibir o mapa de serviços de aplicações relacionados.

      Mapa de Serviço

      Observe que o indicador de gravidade principal em laranja é exibido em vários ICs. Ele começa com o banco de dados Oracle (PS ORA01) e se propaga para todos os ICs que dependem do banco de dados. A partir disso, você pode supor que o alerta com o nível mais alto de gravidade no banco de dados Oracle indica a causa raiz do problema.

      Isso não significa necessariamente que o sistema gerou alertas separados para cada IC, mas é possível. Ao fazer a triagem de um alerta, você pode determinar se os alertas em outros ICs devem ser correlacionados em um alerta primário.

    5. Clique na guia Árvore de impacto e revise os impactos em cada IC.

      As porcentagens ao lado de cada IC na árvore de impacto mostram o efeito em cada IC. Neste exemplo, cada IC é 100% afetado pelo alerta, o que significa que o problema subjacente que levou ao alerta é sério o suficiente para afetar a funcionalidade do Serviço de aplicações.

      Árvore de impacto

    6. Confirme o alerta.

      A confirmação de um alerta não o atribui a você nem cria uma tarefa, como um incidente ou solicitação de mudança. Ele simplesmente permite que outros operadores saibam que você está ciente do problema. Depois de confirmar um alerta, você realizará outras ações durante a fase de triagem.

      OpçãoDescrição
      Confirmar um único alerta Com este processo, você pode confirmar somente o alerta que está exibindo.
      1. Abra o formulário Detalhes do alerta conforme descrito anteriormente.
      2. Marque a caixa de seleção Reconhecido.
      Confirmar um ou mais alertas Com este processo, você pode confirmar um alerta ou vários alertas relacionados.
      1. Abra a lista de alertas conforme descrito anteriormente.
      2. Selecione cada alerta para confirmar.
      3. Clique em Confirmar.
    7. Navegue de volta e procure o alerta que você confirmou.
      Você pode ver que o valor Reconhecido é verdadeiro.
      Alerta confirmado

    O que Fazer Depois

    Acesse Fase 2 do operador: fazer a triagem de um alerta.