Large Data 처리 가이드

BLOB/CLOB <- TEXT, BYTEA

  • 1GB 이하

  • TOAST에 의존합니다.

    • PostgreSQL의 각 page영역은 일반적으로 8kb의 고정된 크기로 되어있고 각 tuple이 여러 페이지에 나뉘어 존재할 수 없습니다. (매우 큰 값을 바로 저장할 수 없습니다.)

      이 한계를 극복하기 위해서, 큰 필드 값은 압축되어 저장되거나 여러 개의 물리적 ROWS로 분할되어 저장됩니다.

    • 이 기법을 TOAST (The Oversized-Attribute Storage Technique)라고 하며 PostgreSQL에서 큰 데이터 값을 메모리 내에서 효율적으로 처리하는 데에 사용됩니다.


Large Object

  • 4TB 이하

  • 특징

    • 파일에 대한 표준 작업과 유사한 읽기/쓰기 API를 사용하여 생성, 수정 및 삭제할 수 있습니다.

    • 대형 개체의 일부를 읽고 업데이트하는 작업을 효율적으로 수행할 수 있는 반면 TOAST 로 처리된 필드의 대부분 작업은 전체 값을 단위로 읽거나 씁니다.

    • Chunk로 쪼개고 DB에 row로 저장. B-tree로 chunk index 탐색 가능하게 합니다.


Migration 가이드

오라클의 LOB은 4GB까지 지원하는 반면, O2의 LOB은 TEXT, BYTEA 타입에 기반하기 때문에 1GB까지 지원합니다. 따라서 1GB 넘는 데이터 이관 시에는 PostgreSQL의 Large Object를 사용해야 합니다.

Last updated