AI시대의 소프트웨어 아키텍처

  • 홈
  • 태그
  • 방명록

sliding window 1

Rate limiting 패턴 이란 ?

Rate Limiting은 시스템의 안정성과 보안을 보장하기 위해 단위 시간당 요청 수를 제한하는 설계 패턴입니다. 이 패턴은 클라이언트가 서버로 과도한 요청을 보내는 것을 방지하고, 서버 자원의 사용을 효율적으로 관리하며, 서비스 품질을 유지하는 데 중요한 역할을 합니다. 1.핵심 개념1) 요청 수 제한 : 클라이언트가 보낼 수 있는 요청 수를 정해진 단위 시간(초, 분, 시간, 일 등) 안에서 제한합니다.예: "1분에 최대 100개의 요청만 허용"2)제한 조건IP 주소 기반 제한 : 특정 IP에서 오는 요청만 제한사용자별 제한 : 사용자의 인증 정보(Token, API Key 등)에 기반한 요청 제한리소스별 제한 : API 엔드포인트별로 요청 제한3)정책 유형Fixed Window : 정해진 시간 간..

Architecture Pattern 2024.11.18
이전
1
다음
더보기
프로필사진

AI시대의 소프트웨어 아키텍처

software-archi-with-ai 님의 블로그 입니다.

  • 분류 전체보기 (62)
    • AI Service (7)
    • Technical Architecture (9)
    • Application Architecture (0)
    • Architecture Pattern (17)
    • AI모델 훈련 기법 (3)
    • AI모델 학습 데이터셋 (1)
    • AI모델 소개 (3)
    • SW Architecture Model (1)
    • AI모델 Fine-Tuning (2)
    • 클라우드 (14)
    • 파이썬 (3)
    • 전자정부 프레임워크 (1)

Tag

RLHF, 인스턴스, 오블완, MS, Azure, SW아키텍처, AI모델, AWS, 아키텍처 패턴, fine-tuning, 워크로드, GCP, AI, 파이썬, tpmc, architecture pattern, 클라우드, sw architect, 서버리스, Rag, AI서비스, MSA, 가상화 기술, 파인튜닝, 티스토리챌린지, SW Architecture, ai service, 컨테이너화 기술, poeaa, pattern,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/11   »
일 월 화 수 목 금 토
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바