분산 추적이란?

분산 추적은 분산 시스템에서 서비스 요청을 추적하여 지연 시간, 성능 병목 현상 등에 대한 가시성을 제공하는 방법입니다.

데모 받기
분산 추적에 대해 알아야 할 사항
분산 추적의 역사 분산 추적의 작동 원리 조직에 분산 추적이 필요한 이유 데이터와 인사이트 비교 오픈 소스 분산 추적 표준이란? 분산 추적의 기능 분산 추적의 이점 분산 추적의 과제 분산 추적을 위한 ServiceNow

현대 비즈니스의 요구로 정보 기술이 폭발적으로 증가했고, 중앙 집중화된 레거시 컴퓨터 시스템은 강력하고 복잡한 분산 IT 환경으로 발전했습니다. 안타깝게도 이러한 복잡성의 증가는 오늘날의 클라우드 기반 네트워크 및 원격 데이터 처리의 향상된 기능과 함께 더 큰 위험을 초래하기도 합니다.

복잡한 시스템은 복잡한 상호의존성으로 인해 문제가 발생할 가능성이 더 높습니다. 한 부분의 오류가 시스템 전반으로 확산될 수 있으며, 중앙 집중식 시스템보다 문제를 식별하고 수정하는 것이 훨씬 더 어려운 경우가 많습니다. 동시에, 시스템이 복잡해질수록 한 부분의 변화가 다른 부분에 어떤 영향을 미칠지 예측하기가 어려워지며, 이로 인해 가장 무해하게 보이는 조정으로 인해 예상치 못한 결과가 초래될 수 있습니다. 그리고 이 모든 과정을 거치는 동안 복잡한 시스템을 철저하게 테스트하는 것은 기하급수적으로 더 어려워지고 있습니다. 즉, 문제가 감지되지 않을 가능성이 점점 더 높아지고 있음을 의미합니다. 이에 대한 해결책을 제시하는 것이 분산 추적입니다.

 

모두 확장 모두 축소 분산 추적의 역사

분산 추적은 대규모 분산 시스템 추적 인프라의 토대를 마련한 Dapper 논문(2010년 Google에서 소개)에서 시작되었다고 할 수 있습니다. 흥미로운 점은 Lightstep(이후 ServiceNow 클라우드 식별 가능성이 됨)의 설립자인 Ben Sigelman이 Dapper를 만드는 데 중요한 역할을 했다는 사실입니다. Dapper에 이어 Twitter는 2012년 최초의 오픈 소스 분산 추적 프로젝트인 Zipkin을 출시했습니다. 이후 Dapper에서 영감을 받은 Uber가 2015년 Jaeger를 출시했습니다.

Sigelman은 2016년 "Toward Turnkey Distributed Tracing(턴키 분산 추적 실현, OpenTracing Manifesto로 알려짐)"이라는 블로그 게시물을 작성했습니다. 이 게시물은 OpenTracing을 단일 표준으로 소개하여 추적 생태계 내의 표준화 부족 문제를 해결하고는 데 중요한 역할을 하고, OpenTracing이 CNCF(Cloud Native Computing Foundation)의 프로젝트가 되어 2019년에 이르러서는 OpenTelemetry와 병합될 수 있는 토대를 마련했습니다.

OpenTelemetry 버전 1.0은 2021년에 출시되었으며 이후 추적, 메트릭, 로깅의 실질적인 표준이 되었습니다. 2010년 Dapper부터 오늘날의 OpenTelemetry 기능에 이르기까지, 10년이 조금 넘는 기간 동안 분산 추적은 단일 백엔드 시스템에서 널리 사용되는 엔드 투 엔드 솔루션으로 발전했으며, 궁극적으로 현대적이고 포괄적인 식별 가능성 관행을 위한 길을 개척했습니다.

DevOps, 식별 가능성 및 AIOps 결합 DevOps, 옵저버빌리티, AIOps를 결합하여 애플리케이션 전송 속도를 높이고 비즈니스에 유용한 ServiceNow 솔루션을 살펴보는 방법을 이 백서에서 알아보세요. 백서 받기
분산 추적의 작동 원리

조직은 분산 추적을 통해 전체 범위의 애플리케이션, 특히 마이크로서비스 아키텍처를 사용하여 구축된 애플리케이션을 프로파일링하고 모니터링할 수 있습니다. 이 접근 방식은 분산 시스템 내의 개별 서비스가 서로 상호 작용하는 방식에 대한 가시성을 제공하여 시스템을 통과하는 개별 요청을 정확하게 파악할 수 있도록 합니다.

분산 추적은 요청 과정을 추적하고 각 단계에 소요되는 시간을 측정함으로써 성능 병목 현상, 지연 시간 문제, 잠재적 오류를 정확히 찾아내는 데 도움을 줍니다. 따라서 분산 추적은 DevOps 및 IT 팀이 시스템을 보다 효과적으로 최적화하고 문제를 해결하며 유지 관리할 수 있도록 지원하는 중요한 도구입니다.

분산 추적의 구조

분산 추적은 다음의 세 가지 핵심 구성요소를 기반으로 구축됩니다.

  • 스팬
    스팬은 시스템 내에서 서비스에 의해 수행되는 단일 작업 단위로, 시작 및 종료 시간 간격으로 표시되며 로그나 태그와 같은 메타데이터도 포함될 수 있습니다. 스팬은 워크플로우의 다양한 부분을 나타내는 트레이스의 구성요소입니다. 루트 스팬(상위 스팬이라고도 함)에는 자체 스팬(하위 스팬이라고도 함)가 있을 수 있고, 이 하위 스팬에도 자체 스팬이 있을 수 있습니다.
  • 트레이스
    트레이스는 하나의 스팬으로 구성되거나 분산 시스템을 통과할 때 서비스 요청의 전체 실행 경로를 함께 나타내는 여러 스팬으로 구성됩니다. 트레이스는 트리로 시각화되는 경우가 많습니다. 여기서 루트 노드는 사용자의 상호 작용을 나타내고, 다른 노드는 요청 처리 및 응답 준비와 관련된 다양한 마이크로서비스를 나타냅니다.
  • 태그
    태그는 스팬과 연결된 메타데이터 요소이며, 컨텍스트와 분류를 제공합니다.

트레이스/스팬 구조는 독립적인 마이크로서비스 간의 격차를 해소하고 시스템 성능에 대한 통합된 관점을 제공하는 요청 중심 뷰를 제공합니다. 이 정보를 바탕으로 조직은 사용자의 경험을 정확하게 파악하고 개선할 수 있습니다.

분산 추적과 로깅의 비교

추적, 로깅, 메트릭은 식별 기능에서 중요한 역할을 하지만 동일한 개념은 아닙니다. 각 요소에는 서로 다른 목적이 있고, 이러한 개념의 차이와 보완적 특성을 이해하는 것은 포괄적인 시스템의 모니터링과 디버깅에 필수적입니다.

  • 추적
    분산 추적은 분산 시스템의 구성요소를 통과하는 요청에 대한 상세한 뷰를 제공하여 성능 조정 및 문제 해결 시 중요한 역할을 하는 다양한 서비스를 통해 요청 흐름을 캡처합니다. 로깅 및 메트릭과 달리 분산 추적은 특정 요청의 여정에 초점을 맞춰 마이크로서비스 간의 상호 작용을 명확하게 보여줍니다.
  • 로깅
    로깅은 사용자 작업, 시스템 오류 또는 기타 활동과 같은 시스템의 특정 개별 이벤트를 기록하는 방법입니다. 타임스탬프가 포함된 로그는 특정 시점에 시스템에서 발생한 상황에 대한 세부 정보를 제공하며, 종종 디버깅 및 감사에 필수적입니다. 분산 추적은 요청의 흐름을 추적하지만, 로깅은 시스템 내 여러 부분 사이의 관계를 표시하지 않고도 이벤트에 대한 보다 정적인 스냅샷을 제공합니다.

분산 추적의 메트릭

메트릭은 특정 시점 또는 시간 간격 동안의 시스템 상태를 나타내는 숫자 값이며 응답 시간, 오류율, 시스템 자원 활용도가 포함될 수 있습니다. 메트릭은 분산 추적에서 중요한 역할을 하며, 분산 시스템 내 다양한 서비스의 성능을 모니터링하고 분석할 수 있는 정량적 방법을 제공합니다. 이러한 숫자 값은 트레이스 및 로그에서 추정할 수 있으며, '요약' 정보를 제공하거나 응답 시간, 오류율, 시스템 처리량과 같은 특정 측면에 대한 자세한 보고를 제공합니다.

핵심성과지표를 요약하는 메트릭의 관점에서 트레이스 및 로그 데이터를 고려함으로써 조직은 분산된 아키텍처를 포괄적으로 파악할 수 있으며, 이를 통해 빠르게 진단하고 실행 가능한 인사이트를 얻고 시스템을 효과적으로 최적화할 수 있습니다.

분산 추적의 마이크로서비스

마이크로서비스는 애플리케이션이 느슨하게 결합되고 독립적으로 배포 가능한 서비스의 컬렉션으로 구성된 소프트웨어 아키텍처 설계입니다. 각 마이크로서비스는 특정 기능 영역에 초점을 맞춰 광범위한 시스템 내에서 개별 구성요소로 작동합니다. 이 모듈식 접근 방식은 유연성과 확장성을 높이고 개발 속도를 향상시킬 수 있습니다. 분산 추적의 맥락에서 마이크로서비스는 요청이 통과하는 개별 노드로서 중요한 역할을 합니다.

요청이 마이크로서비스 간을 이동할 때 분산 추적은 각 단계에서 소요되는 시간을 포함하여 이러한 상호 작용의 세부 정보를 캡처합니다. 이 정보는 요청이 수많은 서비스를 통해 전달되는 방식을 자세히 설명하며 병목 현상, 지연 시간 및 잠재적인 오류를 식별합니다.

마이크로서비스가 분산 시스템 내에서 상호 작용하는 방식을 이해하는 것은 복잡할 수 있습니다. 분산 추적은 이러한 상호 작용에 대한 귀중한 인사이트를 제공하여 조직이 경로를 시각화하고, 시스템 성능을 모니터링하고, 발생 가능한 문제를 해결하여 더 강력하고 효율적인 시스템 아키텍처를 조성하도록 지원합니다.

조직에 분산 추적이 필요한 이유

분산 추적은 특히 마이크로서비스 및 동적 아키텍처 환경에서 분산 시스템을 사용하는 조직에 없어서는 안 될 도구가 되었습니다. 요청과 각 서비스 사이의 상호 작용을 포괄적으로 추적하여 모두 기록함으로써 모니터링, 디버깅, 성능 최적화에 대한 중요한 인사이트를 제공합니다. 추가 설명을 위해 트레이스에 속성을 추가할 수 있으며, 각 스팬은 상위-하위 관계를 포함한 상세 메타데이터와 함께 기록되므로 요청이 서비스를 통해 전달되고 서비스 간을 이동하는 방식을 완벽하게 이해할 수 있습니다.

따라서 최신 애플리케이션 환경의 복잡성을 관리하기 위해 분산 추적으로 전환하는 조직이 점점 늘어나고 있습니다. 오늘날의 복잡한 애플리케이션 스택에는 수많은 잠재적 오류 지점이 있으므로, 문제의 근본원인을 정확히 찾아내는 것은 어려울 뿐만 아니라 시간이 많이 걸리고 오류가 발생하기 쉽습니다. 분산 추적은 이 프로세스를 간소화하여 문제를 더 빠르고 정확하게 식별할 수 있도록 하여 탁월한 사용자 경험을 제공하는 회사의 역량을 직접적으로 강화합니다.

동시에 분산 추적은 데이터 저장소와 컴퓨팅 성능을 관리하기 어려울 정도로 데이터 볼륨이 증가하는 카디널리티 문제에 효과적인 해답을 제시합니다.

분산 추적의 이점은 마이크로서비스 성능에 대한 이해도를 높이고, 문제를 빠르게 해결하며, 고객 만족도를 높이는 데까지 확장됩니다. 각 마이크로서비스의 성능을 세부적으로 파악함으로써 조직은 안정적인 수익 흐름을 보장하는 동시에 전략과 혁신에 더 많은 시간을 할애할 수 있습니다.

데이터와 인사이트 비교

분산 추적을 통해 제공되는 데이터는 중요하지만, 데이터는 결국 데이터일 뿐입니다. 데이터가 무엇을 나타내는지 명확하게 이해하지 못하면 의사 결정 프로세스에 긍정적인 영향을 줄 수 없습니다. 데이터의 진정한 가치는 실행 가능한 인사이트로, 이는 관련성과 신뢰성이 높은 최신 데이터의 수치에서 도출됩니다.

이러한 데이터를 지능적으로 분석하고 상황에 맞게 이해함으로써 조직은 문제를 정확히 파악하고 원인을 식별하며 효과적인 솔루션을 구현할 수 있습니다. 그렇다면 분산 추적은 어떻게 단순한 데이터 수집을 넘어 다양한 시나리오에 대한 깊이 있는 인사이트를 제공할 수 있을까요? 다음을 고려하세요.

원인과 결과 사이의 관계를 집중 조명하는 추적

분산 추적은 지연 시간이나 낮은 처리량과 같은 불량한 소프트웨어 상태의 증상을 인식하는 데 중요한 역할을 합니다. 이는 진단 도구처럼 작동하여 옵저버블 효과를 근본원인과 연결하고 관찰된 변화를 유발했을 수 있는 가설을 검증합니다.

중단의 원인을 식별하는 데 유용한 추적

서비스를 사용할 수 없게 되면 그에 대한 설명이 필요합니다. 추적은 조직이 중단 전에 내부 또는 외부에서 어떤 변경이 이루어졌는지 파악하는 데 도움이 됩니다. 변형이 소프트웨어의 버그, 사용자에 의한 변경 또는 성능 문제로 이어지는 인프라 변경의 결과인지 여부에 관계없이 분산 추적을 사용하면 중단 전후의 시스템 상태를 파악하고 원인을 명확하게 식별할 수 있습니다.

추적을 통해 서비스 변경에 대한 인사이트 제공

개별 서비스의 변경 사항을 이해하는 것은 매우 중요합니다. 배포든, 버전 업데이트든, 분산 추적은 개별 단계의 성능을 세분화하고 버전 정보로 각 스팬에 태그를 지정합니다. 이 상세 뷰는 서비스 성능에 영향을 미치는 변경 사항을 진단하는 데 도움이 됩니다.

변화하는 사용자 요구를 고려하는 추적

시스템은 정적이지 않으며, 시스템에서 작업하는 사용자도 마찬가지입니다. 사용자 행동의 변화와 같은 외부 요인으로 인해 서비스 성과가 달라질 수 있습니다. 인사이트를 제공하는 추적은 태그를 사용하여 요청과 사용자 기능의 필수 부분을 캡처하므로, 사용자가 애플리케이션과 상호 작용하는 방식과 이러한 상호 작용이 어떻게 예기치 않은 요구를 발생시키는지를 심도 있게 파악할 수 있습니다.

추적을 통해 자원이 부족한 영역 발견

자원은 한정되어 있고, 모두에게 넉넉히 돌아갈 정도로 충분하지 않을 수도 있습니다. 분산 네트워크에서 자원 경쟁은 성능에 큰 영향을 미칠 수 있습니다. 분산 추적은 CPU, 컨테이너, 데이터베이스와 같은 공유 자원이 활용되는 방식에 대한 인사이트를 제공합니다. 트레이스 태그를 적절히 지정하면 집계 분석을 통해 성능 저하가 특정 자원의 사용량과 상관 관계를 보이는 시점과 위치를 파악하여 자원 계획 및 충돌 해결에 도움을 줄 수 있습니다.

업스트림 변경에 대한 가시성을 제공하는 추적

종속성의 동적 특성은 업스트림 변경이 서비스 성능에 영향을 미칠 수 있음을 의미합니다. 송신 작업의 태깅 및 버전 번호를 포함하여 인사이트를 제공하는 분산 추적을 통해 업스트림 서비스가 성능에 미치는 영향을 파악할 수 있습니다. 이러한 관계를 이해하면 이러한 변경 사항이 미치는 영향에 대응하거나 완화하는 데 도움이 됩니다.

오픈 소스 분산 추적 표준이란?

오픈 소스 분산 추적 표준은 다양한 서비스에서 표준화된 방식으로 추적 데이터의 수집, 관리, 분석을 안내하는 필수 프레임워크입니다. 이러한 표준은 상호 운용성을 촉진하고 벤더 종속을 줄여 개발자가 최소한의 조정으로 다양한 추적 백엔드와 도구 사이를 전환할 수 있도록 합니다. 또한 복잡한 분산 시스템 내에서 다양한 플랫폼, 언어 및 애플리케이션을 통합하기 위한 공통된 기반을 제공합니다.

가장 널리 사용되는 오픈 소스 분산 추적의 표준은 다음과 같습니다.

OpenTracing

CNCF(Cloud Native Computing Foundation)의 일부인 OpenTracing은 최초의 오픈 소스 분산 추적 표준입니다. 이 프레임워크에는 분산 컨텍스트 전파를 지원하는 API가 포함되어 있으며, 개발자가 특정 벤더에 종속되지 않고 애플리케이션 코드에 계측을 추가할 수 있게 해줍니다. OpenTracing은 여러 플랫폼 간에 일관된 추적 시맨틱을 제공했지만 이후 아카이브되었습니다. CNCF는 더 이상 프로젝트를 지원하지 않습니다.

OpenCensus

OpenCensus는 여러 익스포트 도구를 지원하도록 설계되었으며, 이를 통해 사용자가 분석을 위해 트레이스 데이터를 다른 백엔드로 보낼 수 있습니다. Google에서 시작된 이 프레임워크는 분산 트레이스와 메트릭을 자동 및 수동으로 수집할 수 있는 명확한 API 및 라이브러리 세트를 제공합니다. OpenCensus는 식별 가능성을 위한 통합 솔루션을 제공함으로써 필수 통계 데이터를 수집하고 관리하는 프로세스를 간소화합니다. OpenCensus도 마찬가지로 지원이 중단되었습니다.

OpenTelemetry

OpenTelemetry는 OpenTracing과 OpenCensus를 병합한 프로젝트로, 두 표준의 최고의 기능을 결합합니다. Lightstep이 공동 설립한 OpenTelemetry는 클라우드 네이티브 소프트웨어를 위한 완벽한 식별 가능성 프레임워크를 제공하기 위해 더욱 광범위하게 통합된 API, 라이브러리, 에이전트 및 계측 세트를 제공합니다. OpenTelemetry는 많이 사용되는 다양한 프레임워크와 라이브러리에 대한 지원을 기본 제공하여 애플리케이션 계측을 단순화합니다. 이 표준의 목표는 성장하는 커뮤니티와 광범위한 업계 지원을 바탕으로 분산 트레이스, 로깅 및 메트릭의 식별 가능성 표준이 되는 것입니다.

분산 추적의 기능

다양한 기능은 분산 추적의 기능과 성공에 필수적인 요소입니다. 각 기능의 역할은 다음과 같습니다.

경보

식별 가능성 백엔드의 경보 메커니즘을 통해 팀은 문제를 의미할 수 있는 특정 메트릭 또는 동작에 대한 임계값을 설정할 수 있습니다. 이러한 임계값에 도달하면 관련 담당자에게 경보가 전송되므로 잠재적인 문제를 빠르게 식별하고 해결할 수 있고 시스템 안정성이 향상됩니다.

엔드 투 엔드 인사이트

분산 추적은 다양한 서비스 및 구성요소를 통해 요청의 전체 여정에 대한 포괄적인 가시성을 제공합니다. 이러한 엔드 투 엔드 인사이트는 시스템 내에서 병목 현상, 비효율성, 이상 징후를 식별하는 데 도움이 되며, 성능 조정 및 오류 분석을 위한 자세한 컨텍스트를 제공합니다.

시간 및 비용 효율성

분산 추적은 시스템 동작에 대한 정확한 정보를 제공하여 문제를 디버깅하고 식별하는 데 소요되는 시간을 크게 줄여줍니다. 이러한 효율성은 비용 절감으로 이어지는데, 팀이 문제 해결 대신 기능 개발과 혁신에 더 많은 시간을 할애할 수 있기 때문입니다.

멀티 리전/멀티 클라우드 통합

여러 지리적 위치와 클라우드 제공자에서 분산 컴퓨팅이 증가함에 따라 분산 추적은 이러한 복잡한 환경 전반을 포괄하는 통합을 촉진합니다. 또한 여러 지역과 클라우드 플랫폼 전반의 시스템 성능을 일관되게 파악할 수 있으므로 일관된 모니터링 및 분석이 가능합니다.

서비스 성능 모니터링

분산 추적을 사용하면 각 서비스의 성능을 실시간으로 모니터링하고 추적할 수 있으므로 서비스 간의 상호 작용 방식을 이해하고 최적화가 필요한 영역을 정확히 파악할 수 있습니다.

수집기

수집기는 원격 측정 데이터(예: 트레이스, 메트릭, 로그)를 수집, 처리, 익스포트하는 데 중요한 구성요소 역할을 합니다. 벤더 제약 없이 데이터를 수집하고 전송할 수 있는 통합 옵션을 제공하므로, 다양한 식별 가능성 백엔드와의 원활한 통합이 가능합니다. 수집기의 유연성 덕분에 계측 코드를 변경하지 않고도 다양한 환경에 맞게 추적을 조정할 수 있습니다.

샘플링

샘플링은 모든 요청이 아닌 요청의 하위 집합을 수집하여 추적 백엔드로 전송되는 총 데이터 양을 줄이는 기능입니다. 이를 통해 분산 추적 시스템은 자원을 과도하게 사용하지 않고도 대규모로 작동하는 동시에 가치 있는 인사이트를 제공할 수 있습니다.

확장성

분산 추적은 시스템이 성장함에 따라 증가하는 복잡성과 데이터의 양에 적응해야 합니다. 추적은 확장성 기능을 사용해 대규모 환경을 처리할 수 있으므로 시스템 규모에 관계없이 일관된 성능 인사이트를 제공합니다. 물론 데이터 캡처는 첫 번째 단계일 뿐입니다. 조직이 데이터를 이해하려면 시스템의 성장과 발전에 따라 분산 추적과 함께 확장할 수 있는 플랫폼에 액세스할 수 있어야 합니다.

이기종 풀스택 환경 전반에 걸쳐 작동하는 기능

최신 애플리케이션은 다양한 언어, 프레임워크, 기술 및 클라이언트(웹 기반 및 모바일)로 구성됩니다. 이기종 풀스택 환경에서 작동하는 분산 추적 기능을 통해 개발자는 기술 스택의 다양성에 관계없이 전체 기술 스택에서 필요한 인사이트를 얻을 수 있습니다.

분산 추적의 이점

앞서 언급했듯이 분산 추적의 이점은 조직의 분산 시스템에 제공되는 향상된 가시성과 관련이 있습니다. 그러나 가시성 자체는 다른 이점을 제공할 때만 가치가 있습니다. 분산 추적의 주요 이점은 다음과 같습니다.

특정 사용자 작업의 정확한 평가

분산 추적의 주요 이점 중 하나는 구매와 같은 필수 사용자 작업을 수행하는 데 필요한 기간을 측정할 수 있다는 것입니다. 요청 경로를 추적하면 사용자 경험에 부정적인 영향을 미칠 수 있는 백엔드 장애 요인을 찾고 수정하는 데 도움이 됩니다.

간편한 SLA 평가

대부분의 조직은 서비스 수준 계약(SLA)의 범위 내에서 운영되며 고객 또는 기타 내부 부서에 대한 성과 약속을 공식화합니다. 분산 추적 도구는 개별 서비스의 성능 데이터를 컴파일하므로 팀이 SLA를 준수하는지 여부를 편리하게 평가할 수 있습니다.

SLO 및 SLI 관리 지원

서비스 수준 목표(SLO)는 서비스의 예상 성과 및 가용성을 정의하는 구체적이고 측정 가능한 목표이며, 조직이 서비스 수준을 측정하는 데 도움이 되는 서비스 수준 지표로 지원됩니다. 적절하게 배포된 분산 추적은 모니터링할 특정 신호를 선택하고 미리 결정된 범위를 벗어나는 오류나 데이터에 대한 경보를 설정하여 SLO를 추적하고 충족할 수 있는 기회를 제공합니다. 따라서 관련된 인시던트를 빠르고 효과적으로 해결할 수 있습니다.

서비스 관계에 대한 이해도 향상

분산 추적은 다양한 서비스 간의 복잡한 인과 관계에 대한 인사이트를 제공합니다. 이러한 인사이트는 기업이 전반적인 시스템 성능을 최적화하는 데 도움이 됩니다.

공동 작업 개선

여러 팀이 요청 이행과 관련된 다양한 서비스를 감독하는 환경에서 분산 추적은 오류가 발생한 위치와 이를 해결해야 하는 팀을 명확히 파악할 수 있게 해줍니다. 이러한 명확성은 팀 간의 공동 작업을 강화하고, '책임 소재 파악'에 소요되는 시간을 크게 줄이며, 조직 내 전반적인 생산성을 높입니다.

해결 완료 기간 단축

애플리케이션 성능에 문제가 발생할 경우 지원 팀은 분산 트레이스를 활용하여 문제가 백엔드에 있는지 여부를 정확히 알아낼 수 있습니다. 엔지니어는 영향을 받는 서비스의 트레이스를 분석하여 문제를 식별하고 해결할 수 있습니다. 엔드 투 엔드 분산 추적 도구를 활용하면 동일한 플랫폼 내에서 프론트엔드 성능 문제를 조사할 수도 있으므로 잠재적 문제에 대한 평균 감지 시간(MTTD)과 평균 해결 시간(MTTR)이 모두 줄어듭니다.

분산 추적의 과제

분산 추적은 수많은 이점을 제공하지만 잠재력을 최대한 끌어올리는 데 방해가 될 수 있는 장애물도 수반합니다. 분산 추적을 효과적으로 구현하려는 조직의 경우 이러한 과제를 이해하는 것이 중요합니다. 가장 주목할만한 과제 중 일부는 다음과 같습니다.

수동 계측의 어려움

일부 분산 추적 플랫폼에 있는 장애 요소 중 하나는 수동 계측의 필요성입니다. 다시 말해, 조직에서 요청 추적을 시작하기 위해 기존 코드를 변경하거나 수정해야 할 수 있습니다. 이러한 수동 개입에는 귀중한 엔지니어링 자원이 투입될 뿐만 아니라 코드 수정으로 인해 애플리케이션 내에 오류가 발생할 수 있습니다.

백엔드 범위에 대한 제한

기존의 분산 추적은 백엔드 서비스로 제한되는 경우가 많으며, 요청이 첫 번째 백엔드 서비스에 도달할 때만 트레이스 ID를 생성합니다. 엔드 투 엔드 분산 추적 플랫폼을 활용하지 않으면 프론트엔드에서 해당 사용자 세션을 여전히 명확히 파악하지 못할 수 있습니다. 이러한 제한으로 인해 일부 문제가 되는 요청의 근본원인을 찾고 프론트엔드 또는 백엔드 팀이 문제를 해결해야 하는지 여부를 판단하기가 더 어려워집니다.

다행히 OpenTelemetry와 같은 프레임워크를 채택하면 프론트엔드 트랜잭션에 대한 제한된 가시성 문제와 계측과 관련된 문제를 완화하거나 제거할 수 있습니다. 이러한 문제와 기타 과제는 OpenTelemetry를 핵심 코드베이스에 통합하는 많은 산업 기술(예: Kubernetes)에 내재되어 있습니다.

클라우드 식별 가능성 가격 요구 사항에 부합하는 ServiceNow 클라우드 식별 가능성 버전을 찾으려면 패키지를 선택하세요. 가격 정보 확인
분산 추적을 위한 ServiceNow

현대적 비즈니스 IT 환경이 규모와 복잡성 측면에서 계속 확장됨에 따라 분산 추적의 이점이 더욱 분명해지고 있습니다. 수상 경력에 빛나는 Now Platform®을 활용하는 ServiceNow 클라우드 식별 가능성은 추적의 새로운 표준을 설정하고 분산 시스템의 요청 전반에 대한 완벽한 가시성을 제공합니다.

기존 도구와 통합하고, 메트릭과 추적을 연결하여 원격 측정을 통합하면 조직의 MTTR이 크게 줄어듭니다. 그리고 이 모든 과정을 거치는 동안 비즈니스 결과에 맞춰 가격을 조정하여 사용량 증가에 따른 비용 증가 없이 가치를 높일 수 있습니다.

클라우드 식별 가능성은 비즈니스에 도움이 되도록 분산 추적을 혁신하고 있습니다. 더 자세히 알아보려면 ServiceNow에 문의하세요.

ServiceNow의 전문가가 ServiceNow 클라우드 식별 가능성을 활용하여 클라우드 네이티브 애플리케이션으로의 전환을 가속화할 수 있는 방법을 알려드립니다. 클라우드 식별 가능성 살펴보기 문의하기
리소스 기사 ServiceNow란? 옵저버빌리티란? OpenTelemetry란? 분석 보고서 Gartner, APM 및 옵저버빌리티 부문의 비전 있는 리더로 ServiceNow 선정 데이터 시트 클라우드 인사이트 ServiceNow® ITOM 최적화로 민첩한 멀티 클라우드 거버넌스 제공 오케스트레이션 전자책 ITIL 4로 변경 관리 재구성 Gorilla Guide® 요약 에디션: IT 자산 관리 전사적 소프트웨어 혁신 가속화 백서 클라우드 혁신 확장 클라우드 관리 ServiceNow 및 Azure를 통한 클라우드 도입