BerryDevelop

  • 홈
  • 태그

2025/04/22 1

Kafka 리스너에서 HTTP 호출 장애 대응기: 문제 분석과 개선까지

장애 상황어느 날, 외부기관 HTTP 호출이 지연되는 이슈가 발생했다.이 작은 문제가 예상보다 시스템 전체에 크게 영향을 끼쳤다.발생 원인외부 방화벽 전환 과정에서 몇 초 동안 네트워크 순단이 일어났고,프록시 서버가 외부기관과 연결할 수 없는 상태가 됐다.증상프록시 서버 타임아웃은 1분으로 설정돼 있었다.그런데 우리 서버의 HTTP 요청 부분에는 별도의 타임아웃 설정이 빠져 있어서,요청이 최대 1분간 블로킹됐다.이 요청을 처리하던 Kafka 리스너 스레드도 같이 블로킹되면서,Kafka 메시지의 offset commit이 지연되고,결과적으로 메시지가 적체(backlog) 되는 상황까지 이어졌다.장애 분석 요약프록시를 통해 외부기관 호출 시 소켓이 정상 종료되지 않으면서 블로킹 발생HTTP 클라이언트에 re..

장애 개선 2025.04.22
1
더보기
프로필사진

berry의 부지런한 개발공부 블로그입니다

  • 분류 전체보기 (59)
    • 개발 공부 (44)
      • 프로그래밍 (5)
      • 알고리즘 (21)
      • http (11)
      • kafka (1)
    • 자격증 (4)
      • 정보처리기사 (3)
      • SQLD (1)
    • 장애 개선 (1)
      • Error (7)
      • 이것저것 (1)

Tag

정렬, docker, http, jeknins, 우선순위큐, 정렬알고리즘, 삽입정렬, 더티체킹, 선택정렬, Sort Algorithm, 노마드코더 #리액트 #ReactJs, 이코테, 카드정렬하기, 자바스크립트 #노마드코더 #클론코딩, Algorithm, Depth-First Search, 인터넷네트워크, 스택자료구조, 큐자료구조, 알고리즘,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/04   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바