🐾
개발자국
  • 🐶ABOUT
  • 🚲프로그래밍
    • 객체 지향 프로그래밍
    • 오브젝트
      • 1장: 객체, 설계
      • 2장: 객체지향 프로그래밍
      • 3장: 역할, 책임, 협력
      • 4장: 설계 품질과 트레이드오프
      • 5장: 책임 할당하기
      • 6장: 메시지와 인터페이스
      • 7장: 객체 분해
      • 8장: 의존성 관리하기
      • 9장: 유연한 설계
      • 10장: 상속과 코드 재사용
      • 11장: 합성과 유연한 설계
      • 12장: 다형성
      • 13장: 서브클래싱과 서브타이핑
      • 14장: 일관성 있는 협력
      • 15장: 디자인 패턴과 프레임워크
    • 도메인 주도 개발 시작하기
      • 1장: 도메인 모델 시작하기
      • 2장: 아키텍처 개요
      • 3장: 애그리거트
      • 4장: 리포지토리와 모델 구현
      • 5장: 스프링 데이터 JPA를 이용한 조회 기능
      • 6장: 응용 서비스와 표현 영역
      • 7장: 도메인 서비스
      • 8장: 애그리거트 트랜잭션 관리
      • 9장: 도메인 모델과 바운디드 컨텍스트
      • 10장: 이벤트
      • 11장: CQRS
    • 클린 아키텍처
      • 만들면서 배우는 클린 아키텍처
        • 계층형 아키텍처의 문제와 의존성 역전
        • 유스케이스
        • 웹 어댑터
        • 영속성 어댑터
        • 아키텍처 요소 테스트
        • 경계 간 매핑 전략
        • 애플리케이션 조립
        • 아키텍처 경계 강제하기
        • 지름길 사용하기
        • 아키텍처 스타일 결정하기
    • 디자인 패턴
      • 생성(Creational) 패턴
        • 팩토리 패턴
        • 싱글톤 패턴
        • 빌더 패턴
        • 프로토타입 패턴
      • 행동(Behavioral) 패턴
        • 전략 패턴
        • 옵저버 패턴
        • 커맨드 패턴
        • 템플릿 메서드 패턴
        • 반복자 패턴
        • 상태 패턴
        • 책임 연쇄 패턴
        • 인터프리터 패턴
        • 중재자 패턴
        • 메멘토 패턴
        • 비지터 패턴
      • 구조(Structural) 패턴
        • 데코레이터 패턴
        • 어댑터 패턴
        • 퍼사드 패턴
        • 컴포지트 패턴
        • 프록시 패턴
        • 브리지 패턴
        • 플라이웨이트 패턴
      • 복합 패턴
  • 시스템 설계
    • 1. 사용자 수에 따른 규모 확장성
    • 2. 개략적 규모 추정
    • 3. 시스템 설계 접근법
    • 4. 처리율 제한 장치
    • 5. 안정 해시
    • 6. 키-값 저장소
    • 7. 유일한 ID 생성기
    • 8. URL 단축기
    • 9. 웹 크롤러
    • 10. 알림 시스템
    • 11. 뉴스 피드
    • 12. 채팅 시스템
    • 13. 검색어 자동완성
    • 14. 유튜브 스트리밍
    • 15. 구글 드라이브
    • ⭐️. 캐싱 전략
    • ⭐️. 재고 시스템으로 알아보는 동시성이슈 해결방법
    • ⭐️. 실습으로 배우는 선착순 이벤트 시스템
  • 🏝️자바
    • 자바의 내부 속으로
      • Java 언어의 특징
      • JDK
      • JVM
        • 메모리 관리
        • Garbage Collector
          • 기본 동작
          • Heap 영역을 제외한 GC 처리 영역
          • (WIP) GC 알고리즘
        • 클래스 로더
      • 자바 실행 방식
      • 메모리 모델과 관리
      • 바이트 코드 조작
      • 리플렉션
      • 다이나믹 프록시
      • 어노테이션 프로세서
    • 자바의 기본
      • 데이터 타입, 변수, 배열
    • 이펙티브 자바
      • 2장: 객체의 생성과 파괴
        • item 1) 생성자 대신 정적 팩토리 메서드를 고려하라
        • item2) 생성자에 매개변수가 많다면 빌더를 고려하라
        • item3) private 생성자나 열거 타입으로 싱글톤임을 보증하라
        • item4) 인스턴스화를 막으려면 private 생성자를 사용
        • item5) 자원을 직접 명시하는 대신 의존 객체 주입 사용
        • item6) 불필요한 객체 생성 지양
        • item7) 다 쓴 객체는 참조 해제하라
        • item8) finalizer와 cleaner 사용 자제
        • item9) try-with-resources를 사용하자
      • 3장: 모든 객체의 공통 메서드
        • item 10) equals는 일반 규약을 지켜 재정의 하자
        • item 11) equals 재정의 시 hashCode도 재정의하라
        • item 12) 항상 toString을 재정의할 것
        • item 13) clone 재정의는 주의해서 진행하라
        • item 14) Comparable 구현을 고려하라
      • 4장: 클래스와 인터페이스
        • item 15) 클래스와 멤버의 접근 권한을 최소화하라
        • item 16) public 클래스에서는 public 필드가 아닌 접근자 메서드를 사용하라
        • item 17) 변경 가능성을 최소화하라
        • item 18) 상속보다는 컴포지션을 사용하라
        • item 19) 상속을 고려해 설계하고 문서화하고, 그러지 않았다면 상속을 금지하라
        • item 20) 추상 클래스보다는 인터페이스를 우선하라
        • item 21) 인터페이스는 구현하는 쪽을 생각해 설계하라
        • item 22) 인터페이스는 타입을 정의하는 용도로만 사용하라
        • item 23) 태그 달린 클래스보다는 클래스 계층구조를 활용하라
        • item 24) 멤버 클래스는 되도록 static으로 만들라
        • item 25) 톱레벨 클래스는 한 파일에 하나만 담으라
      • 5장: 제네릭
        • item 26) 로 타입은 사용하지 말 것
        • item 27) unchecked 경고를 제거하라
        • item 28) 배열보다 리스트를 사용하라
        • item 29) 이왕이면 제네릭 타입으로 만들라
        • item 30) 이왕이면 제네릭 메서드로 만들라
        • item 31) 한정적 와일드카드를 사용해 API 유연성을 높이라
        • item 32) 제네릭과 가변 인수를 함께 사용
        • item 33) 타입 안전 이종 컨테이너를 고려하라
      • 6장: 열거 타입과 어노테이션
        • item 34) int 상수 대신 열거 타입을 사용하라
        • item 35) ordinal 메서드 대신 인스턴스 필드를 사용하라
        • item 36) 비트 필드 대신 EnumSet을 사용하라
        • item 37) ordinal 인덱싱 대신 EnumMap을 사용하라
        • item 38) 확장할 수 있는 열거 타입이 필요하면 인터페이스를 사용하라
        • item 39) 명명 패턴보다 어노테이션을 사용하라
        • item 40) @Override 어노테이션을 일관되게 사용하라
        • item 41) 정의하려는 것이 타입이라면 마커 인터페이스를 사용하라
      • 7장: 람다와 스트림
        • item 42) 익명 클래스보다는 람다를 사용하라
        • item 43) 람다보다는 메서드 참조를 사용하라
        • item 44) 표준 함수형 인터페이스를 사용하라
        • item 45) 스트림은 주의해서 사용하라
        • item 46) 스트림에서는 부작용 없는 함수를 사용하라
        • item 47) 반환 타입으로는 스트림보다 컬렉션이 낫다
        • item 48) 스트림 병렬화는 주의해서 적용하라
      • 8장: 메서드
        • item 49) 매개변수가 유효한지 검사하라
        • item 50) 적시에 방어적 복사본을 만들라
        • item 51) 메서드 시그니처를 신중히 설계하라
        • item 52) 다중정의는 신중히 사용하라
        • item 53) 가변인수는 신중히 사용하라
        • item 54) null이 아닌, 빈 컬렉션이나 배열을 반환하라
        • item 55) 옵셔널 반환은 신중히 하라
        • item 56) 공개된 API 요소에는 항상 문서화 주석을 작성하라
      • 9장: 일반적인 프로그래밍 원칙
        • item 57) 지역 변수의 범위를 최소화하라
        • item 58) 전통적인 for문보다 for-each문을 사용하기
        • item 59) 라이브러리를 익히고 사용하라
        • item 60) 정확한 답이 필요하다면 float, double은 피하라
        • item 61) 박싱된 기본타입보단 기본 타입을 사용하라
        • item 62) 다른 타입이 적절하다면 문자열 사용을 피하라
        • item 63) 문자열 연결은 느리니 주의하라
        • item 64) 객체는 인터페이스를 사용해 참조하라
        • item 65) 리플렉션보단 인터페이스를 사용
        • item 66) 네이티브 메서드는 신중히 사용하라
        • item 67) 최적화는 신중히 하라
        • item 68) 일반적으로 통용되는 명명 규칙을 따르라
      • 10장: 예외
        • item 69) 예외는 진짜 예외 상황에만 사용하라
        • item 70) 복구할 수 있는 상황에서는 검사 예외를, 프로그래밍 오류에는 런타임 예외를 사용하라
        • item 71) 필요 없는 검사 예외 사용은 피하라
        • item 72) 표준 예외를 사용하라
        • item 73) 추상화 수준에 맞는 예외를 던지라
        • item 74) 메서드가 던지는 모든 예외를 문서화하라
        • item 75) 예외의 상세 메시지에 실패 관련 정보를 담으라
        • item 76) 가능한 한 실패 원자적으로 만들라
        • item 77) 예외를 무시하지 말라
      • 11장: 동시성
        • item 78) 공유 중인 가변 데이터는 동기화해 사용하라
        • item 79) 과도한 동기화는 피하라
        • item 80) 스레드보다는 실행자, 태스크, 스트림을 애용하라
        • item 81) wait와 notify보다는 동시성 유틸리티를 애용하라
        • item 82) 스레드 안전성 수준을 문서화하라
        • item 83) 지연 초기화는 신중히 사용하라
        • item 84) 프로그램의 동작을 스레드 스케줄러에 기대지 말라
      • 12장: 직렬화
        • item 85) 자바 직렬화의 대안을 찾으라
        • item 86) Serializable을 구현할지는 신중히 결정하라
        • item 87) 커스텀 직렬화 형태를 고려해보라
        • item 88) readObject 메서드는 방어적으로 작성하라
        • item 89) 인스턴스 수를 통제해야 한다면 readResolve보다는 열거 타입을 사용하라
        • item 90) 직렬화된 인스턴스 대신 직렬화 프록시 사용을 검토하라
    • 모던 자바 인 액션
      • 1장: 자바의 역사
      • 2장: 동작 파라미터화
      • 3장: 람다
      • 4장: 스트림
      • 5장: 스트림 활용
      • 6장: 스트림으로 데이터 수집
      • 7장: 병렬 데이터 처리와 성능
      • 8장: 컬렉션 API 개선
      • 9장: 람다를 이용한 리팩토링, 테스팅, 디버깅
      • 10장: 람다를 이용한 DSL
      • 11장: null 대신 Optional
      • 12장: 날짜와 시간 API
      • 13장: 디폴트 메서드
      • 14장: 자바 모듈 시스템
      • 15장: CompletableFuture와 Reactive 개요
      • 16장: CompletableFuture
      • 17장: 리액티브 프로그래밍
      • 18장: 함수형 프로그래밍
      • 19장: 함수형 프로그래밍 기법
      • 20장: 스칼라 언어 살펴보기
    • 자바의 이모저모
      • Javax
      • Objects
      • NIO
      • Thread
      • Concurrent
        • Atomic
        • Executor, ExecutorService
        • Interrupt
      • Assertions
    • Netty
      • 네티 맛보기
      • 네티의 주요 특징
      • 채널 파이프라인
      • 이벤트 루프
      • 바이트 버퍼
      • 부트스트랩
      • 네티 테스트
      • 코덱
      • 다양한 ChannelHandler와 코덱
      • 웹소켓
      • UDP 브로드캐스팅
    • 자바 병렬 프로그래밍
      • 2장: 스레드 안전성
      • 15장: 단일 연산 변수와 논블로킹 동기화
  • 🏖️코틀린
    • 코틀린 인 액션
      • 코틀린 언어의 특징
      • 코틀린 기초
      • 함수 정의와 호출
      • 클래스, 객체, 인터페이스
      • 람다
      • 타입 시스템
      • 연산자 오버로딩과 기타 관례
      • 고차 함수
      • 제네릭스
      • 어노테이션과 리플렉션
      • DSL 만들기
  • 🌸스프링
    • Spring Core
      • Cron Expression
      • Bean
        • Lifecycle
        • Aware
    • Spring MVC
    • Spring Security
      • 로그인 처리
      • 로그아웃 처리
      • JWT 인증 방식
      • 메소드별 인가 처리
    • Spring Data
      • Pageable
      • Spring Data Couchbase
      • Spring Data Redis
        • Serializer
    • Spring REST Docs
    • Spring Annotations
    • Spring Cloud
      • Service Discovery
      • API Gateway
      • Spring Cloud Config
      • MicroService Communication
      • Data Synchronization
    • Test
      • 테스트 용어 정리
      • JUnit
      • Spring Boot Test
      • Mockito
    • QueryDSL
      • 프로젝트 환경설정
      • 기본 문법
      • 중급 문법
      • 순수 JPA와 QueryDSL
      • 스프링 데이터 JPA와 QueryDSL
    • Lombok
      • @Data
      • @Builder
      • Log Annotations
  • 🕋DB
    • MySQL
      • CentOS7에서 MySQL 8 버전 설치하기
    • MongoDB
      • 
    • Redis
      • Sentinel
      • Cluster
      • Transaction
      • 자료구조
        • String
        • List
        • Set
        • Hash
        • Bitmaps
        • SortedSet
      • Lettuce 단일 서버, 클러스터 서버, 풀링 사용 방법
  • 📽️인프라
    • 리눅스
      • 주요 명령어 모음
    • Docker
      • Docker
      • Docker Compose
      • Docker Swarm
      • Docker Network
      • Linux에서 root 아닌 유저로 docker 실행하기
    • Kubernetes
      • 기초 개념
      • Pod
      • Configuration
      • ReplicationSet
      • Network
      • ConfigMap & Secret
      • Volume, Mount, Claim
      • Controller
      • Multi Container Pod
      • StatefulSet & Job
      • Rollout & Rollback
      • Helm
      • 개발 워크플로우와 CI/CD
      • Container Probes
      • Resource Limit
      • Logging & Monitoring
      • Ingress
      • Security
      • Multi Node/Architecture Cluster
      • Workload & Pod management
      • CRD & Operator
      • Serverless Function
      • K8S Cheat Sheet
    • Kafka
      • 카프카 개요
      • 카프카 설치 및 실습
      • Kafka Broker
      • Topic, Partition, Record
      • Producer
      • Consumer
      • Kafka Streams
      • Kafka Connect
      • MirrorMaker
  • AWS
    • AWS Console / CLI / SDK
    • IAM
    • EC2
      • EC2 Advanced
    • ELB / ASG
    • RDS / Aurora / ElastiCache
    • DynamoDB
    • DocumentDB / Neptune / Keyspaces / QLDB / Timestream
    • Route 53
    • Beanstalk
    • Solution Architect
    • S3
      • 보안
    • CloudFront
    • Global Accelerator
    • AWS Storage
    • Messaging
    • Container
    • Serverless
    • Data Analysis
    • Machine Learning
    • Monitoring
    • Security
    • VPC
    • Data Migration
    • 기타 서비스
  • 🏔️CS
    • 운영 체제
      • Introduction
      • System Structures
      • Process
      • Synchronization
      • Muitithreaded Programming
      • Process Scheduling
      • Memory Management
      • Virtual Memory
    • 네트워크
      • 네트워크 기초
      • 네트워크 통신 방식
      • OSI 7계층
        • 1계층: 물리계층
        • 2계층: 데이터 링크 계층
        • 3계층: 네트워크 계층
        • 4계층: 전송 계층
        • 5계층: 세션 계층
        • 6계층: 표현 계층
        • 7계층: 응용 계층
      • TCP/IP 스택
      • ARP
      • 데이터 크기 조절
      • WDM
      • NAT
      • DNS
      • DHCP
      • VPN
      • 네이글 알고리즘
      • 서버 네트워크
      • 네트워크 보안
        • 보안의 기본
        • 보안 장비
      • 이중화
    • 데이터베이스
      • 트랜잭션
    • 컴퓨터 구조
      • 개요
      • Instruction Set Architecture
      • Procedure Call & Return
      • Linking
      • Pipeline
      • Memory Hierarchy
      • Virtual Memory
      • Interrupt / Exception, IO
    • 자료 구조
      • Array
      • List
      • Map
      • Set
      • Queue
      • PriorityQueue
      • Stack
    • 웹 기술
      • HTTP
        • 쿠키와 세션
  • 🪂Big Data
    • Apache Hadoop
  • 🕹️ETC
    • Git
      • 내부 구조
      • 내가 자주 사용하는 명령어 모음
      • Commit Convention
    • 이력서 작성하기
    • Embedded
      • 라즈베리파이에서 네오픽셀 적용기
    • 기술블로그 모음집
Powered by GitBook
On this page
  • 개략적 설계안 제시
  • 상세 설계
  • 시스템 최적화
  • 오류 처리
  1. 시스템 설계

14. 유튜브 스트리밍

필수 기능 면에서 요구사항

  • 비디오 업로드/시청 기능

  • 지원해야 할 클라이언트: 앱, 웹, 스마트 TV

  • DAU : 5M

  • 평균 소비 시간: 30분 (하루 평균 5개의 비디오)

  • 다국어 지원 필요

  • 모든 비디오 종류와 해상도 지원

  • 암호화 필요

  • 파일 크기는 1GB로 제한

  • 클라우드 서비스 활용 가능

품질 면에서 요구사항

  • 빠른 비디오 업로드

  • 원활한 비디오 재생

  • 낮은 인프라 비용

  • 높은 가용성과 규모 확장성, 안정성

개략적 규모 추정

  • 일간 능동 사용자(DAU: Daily Active User)수는 5백만(5million)

  • 한 사용자는 하루에 평균 5개의 비디오를 시청

  • 10%의 사용자가 하루에 1비디오 업로드

  • 비디오 평균 크기는 300MB

  • 비디오 저장을 위해 매일 새로 요구되는 저장 용량

    • 5백만 x 10% x 300MB = 150TB

  • CDN 비용

    • 클라우드 CDN을 통해 비디오를 서비스할 경우 CDN에서 나가는 데이터의 양에 따라 과금

    • 아마존의 클라우드프론트(CloudFront)를 CDN 솔루션으로 사용할 경우, 100% 트래픽이 미국에서 발생한다고 가정하면 1GB당 $0.02의 요금이 발생

    • 문제를 단순화하기 위해 비디오 스트리밍 비용 만 따지도록 하겠다.

    • 매일 발생하는 요금은 5백만 x 5비디오 x 0.3GB x $0.02 = $150,000 이다.

개략적 설계안 제시

  • CDN과 BLOB 스토리지는 기존 클라우드 서비스 활용

    • 적절한 기술을 골라 설계를 마치는것이 가장 중요

    • 기술 각각의 동작 설명, 어떻게 구현할지 상세 설계할 필요는 없음

    • 직접 구현하는 것은 복잡하고 많은 비용이 들기 때문에 다른 회사의 서비스를 이용하는 것이 일반적임

  • 컴포넌트 구성도

  • CDN에 저장된 비디오를 스트리밍할 수 있는 기능

  • 비디오 스트리밍 제외한 모든 요청은 API 서버가 처리

    • 피드 추천, 비디오 업로드 URL 생성, 메타데이터 DB, 캐시 갱신, 사용자 가입 등

비디오 업로드 절차

  • 메타데이터 데이터베이스(metadata db): 비디오의 메타데이터를 보관

  • 메타데이터 캐시(metadata cache): 성능을 높이기 위해 비디오 메타데이터와 사용자 객체 (user object) 캐시

  • 원본 저장소(original storage): 원본 비디오를 보관할 대형 이진 파일 저장소 (BLOB) 시스템

    BLOB(Binary Large Object storage) 저장소: 이진 테이터를 하나의 개체로 보관하는 DBMS

  • 트랜스코딩 서버(transcoding server): 비디오의 포맷(MPEG, HLS 등) 변환을 담당, 단말이나 대역폭 요구사항에 맞는 최적의 비디오 스트림을 제공하기 위해 필요

  • 트랜스코딩 비디오 저장소(transcoded storage): 트랜스코딩이 완료된 비디오를 저장하는 BLOB 저장소다.

  • CDN: 비디오를 캐시하는 역할 담당

  • 트랜스코딩 완료 큐: 비디오 트랜스코딩 완료 이벤트를 저장할 큐

  • 트랜스코딩 완료 핸들러: 트랜스코딩 완료 큐에서 이벤트를 꺼내 메타데이터 캐시와 DB 갱신 작업을 위한 서버들

  • 비디오 업로드

    1. 원본 저장소에 비디오 업로드

    2. 원본 저장소에서 비디오 가져와 트랜스코딩 시작

    3. 비디오를 트랜스코딩 비디오 저장소에 업로드하는 동시에 트랜스코딩 완료 이벤트를 트랜스코딩 완료 큐에 보내 메타데이터 DB, 캐시 갱신

    4. 클라이언트에게 비디오 업로드가 완료됨을 알리기

  • 비디오 메타데이터 갱신

    1. 파일 이름, 크기, 포맷 등의 정보를 API 서버로 요청

    2. 메타데이터 캐시와 데이터베이스 업데이트

비디오 스트리밍 절차

  • 비디오 다운로드해서 보는 것이 아닌, 원격지의 비디오로부터 지속적으로 비디오 스트림을 전송받아 영상을 재생해야 함

  • 서비스의 용례에 맞는 스트리밍 프로토콜을 잘 골라야 한다

    스트리밍 프로토콜: 비디오 스트리밍을 위해 데이터 전송 시 사용되는 표준화된 통신 방법, 지원하는 비디오 인코딩과 플레이어가 천차만별임

  • CDN 에지 서버가 비디오 전송을 담당하도록 하여 낮은 전송 지연을 보장

상세 설계

비디오 트랜스코딩

  • 특정 단말에서 녹화된 비디오는 특정 포맷으로 저장된다. 이 비디오가 다른 단말에서 재생되려면, 호환되는 bitrate와 포맷으로 저장되어야 한다.

    bitrate: 비디오를 구성하는 비트가 얼마나 빨리 처리되어야 하는지 나타내는 단위, bitrate가 높을수록 높은 성능의 컴퓨팅 파워와 빠른 인터넷 회선 속도가 필요함

  • 원본 비디오는 용량이 크기 때문에 특정 포맷으로 변환이 필요

  • 호환성 문제 해결을 위해 하나의 비디오를 여러 포맷으로 인코딩 필요

  • 네트워크 대역폭이 충분하지 않으면 저화질, 충분하면 고화질 비디오 제공

  • 비디오가 끊김없이 재생될 수 있도록 화질 자동/수동 변경 기능 제공

인코딩 포맷

  • 컨테이너: 비디오 파일, 오디오, 메타데이터를 담는 형식을 나타낸다. 파일 확장자와 같은 의미 ex) avi, mp4

  • 코덱: 비디오 압축 및 압축해제 알고리즘 ex) H.264, HEVC, ..

DAG 모델

  • Directed Acyclic Graph, 유방향 비순환 그래프

  • 컴퓨팅 자원과 시간을 많이 소모하는 비디오 트랜스코딩 작업을 단계적으로 배열하고 순차적, 병렬적으로 실행될 수 있도록 한다.

  • 원본 비디오는 아래와 같이 세 부분으로 나뉜 후 작업이 적용된다.

비디오 트랜스코딩 아키텍처

  • 전처리기

    • 비디오 분할

      • GOP(Group of Pictures) 라는 비디오 스트림 단위로 분할

      • 특정 순서로 배열된 프레임의 그룹

      • 하나의 GOP는 독립적으로 재생 가능하며 몇 초 정도의 분량임

    • DAG 그래프 생성

      • 클라이언트 프로그래머가 작성한 config 파일에 따라 생성됨

    • 데이터 캐시

      • GOP, 메타데이터를 임시저장소에 보관

  • DAG 스케줄러

    • DAG 그래프 분할

    • 자원 관리자의 작업 큐에 작업 단계를 입력

    • 다운로드 작업도 분할하고 트랜스 코딩도 분할하고 하는건지 정확한 동작이 궁금하다..?

  • 자원 관리자

    • 자원 배분 효과적으로 수행하는 역할 담당

    • 세 개의 큐, 작업 스케줄러로 구성됨

      • 작업 큐: 실행할 작업 보관

      • 작업 서버 큐: 작업 서버의 가용상태 보관

      • 실행 큐: 실행중인 작업과 서버 보관

      • 작업 스케줄러: (최적의 작업, 서버) 조합을 골라 작업 서버에 수행하도록 지시하고 실행 큐에 입력한다. 작업 완료되면 작업을 실행 큐에서 제거한다.

  • 임시 저장소

    • 저장할 데이터의 유형, 크기, 이용 빈도, 데이터 유효기간에 따라 어떤 시스템을 사용할 지 결정

    • 메타데이터는 메모리에 캐시해두면 좋지만, 비디오/오디오 데이터는 BLOB 저장소에 두는 것이 좋다.

    • 비디오 프로세싱이 완료되면 데이터 삭제

  • 인코딩된 비디오

    • 인코딩된 최종 결과물인 비디오

시스템 최적화

  • 시청 패턴을 분석한 후 최적화를 시도하는 것이 좋다.

속도 최적화

  • GOP로 분할해 비디오를 병렬 업로드

  • 업로드 센터를 사용자 근거리에 지정 (CDN 사용하거나 각 업로드 센터 직접 구성하거나..)

  • 모든 절차를 병렬화

    • 시스템 간 결합도를 낮춰 의존성을 줄이기 위해 메시지 큐를 도입할 수 있다.

    • 이전 작업이 끝나기를 마냥 기다리지 않아도 되므로 병렬적 수행 가능

안전성 최적화

  • 미리 사인된 업로드 URL

    • 허가받은 사용자만 올바른 장소에 비디오를 업로드할 수 있도록 해야함

    • 사용자는 미리 사인된 URL 정보를 받은 후에만 해당 URL이 가리키는 위치에 비디오 업로드 가능

  • 비디오 저작권 보호

    • 디지털 저작권 관리 시스템 도입, AES 암호화, 워터마크 등 활용 가능

비용 최적화

  • 인코딩된 결과 비디오가 CDN에 저장된다.

  • CDN 비용을 낮추기 위해 long-tail 분포 활용할 수 있다. (인기있는 비디오만 대부분 시청한다는 이론)

  1. 인기 있는 비디오만 CDN을 통해 재생, 그외 비디오는 비디오 서버를 통해 재생

  2. 인기 없는 비디오는 인코딩 작업 줄이기, 짧은 비디오는 바로바로 인코딩해 재생 가능 (CDN 사용 감소)

  3. 특정 지역에만 인기가 높은 비디오는 다른 지역에 옮길 필요 없음

  4. CDN을 직접 구축하고 인터넷 서비스 제공자와 제휴 (대규모라면 가능하지만 소규모라면 어려울 것)

오류 처리

  • 회복 가능 오류

    • 비디오 세그먼트를 트랜스코딩하다 실패하는 등의 오류는 몇번 재시도하면 해결됨

    • 복구가 어렵다면 클라이언트에게 오류 코드 반환

  • 회복 불가능 오류

    • 비디오 포맷 잘못되는 등의 오류 발생 시, 작업 중단하고 클라이언트에게 오류 코드 반환

  • 시스템 컴포넌트의 전형적인 오류 해결법

    • 업로드 오류: 몇회 재시도한다.

    • 비디오 분할 오류: 낡은 버전의 클라이언트가 GOP 경계에 따라 비디오를 분할하지 못하는 경우라면 전체 비디오를 서버로 전송하고 서버가 해당 비디오 분할을 처리하도록 한다.

    • 트랜스코딩 오류: 재시도한다.

    • 전처리 오류: DAG 그래프를 재생성한다.

    • DAG 스케줄러 오류: 작업을 다시 스케줄링한다.

    • 자원 관리자 큐에 장애 발생: 사본(replica)을 이용한다.

    • 작업 서버 장애: 다른 서버에서 해당 작업을 재시도한다.

    • API 서버 장애: API 서버는 무상태 서버이므로 신규 요청은 다른 API 서버로 우회될것이다.

    • 메타데이터 캐시 서버 장애: 데이터는 다중화되어 있으므로 다른 노드에서 데이터를 여전히 가져올 수 있을 것이다. 장애가 난 캐시 서버는 새로운 것으로 교체한다.

    • 메타데이터 데이터베이스 서버 장애

      • 주 서버가 죽었다면 부 서버 가운데 하나를 주 서버로 교체한다.

      • 부 서버가 죽었다면 다른 부 서버를 통해 읽기 연산을 처리하고 죽은 서버는 새것으로 교체한다.

Previous13. 검색어 자동완성Next15. 구글 드라이브

Last updated 1 month ago