| GaonIT Cloud — 호스팅 & 클라우드
가온IT

벡터 데이터베이스

개발자가 사랑하는 호스팅 & 클라우드. 지금 바로 시작하세요.

벡터 데이터베이스 (Vector DB)

RAG/시맨틱 검색을 위한 임베딩 벡터 저장·검색 서비스. 컬렉션/네임스페이스, HNSW/IVF 등 인덱스, 필터링·하이브리드 검색, 모니터링/보안까지. 요금은 별도문의로 안내합니다.

⚡ 초저지연 KNN
코사인/내적/L2 거리. 배치 upsert·압축으로 비용/성능 밸런스.
🧱 컬렉션/네임스페이스
팀·프로젝트 단위 다중 네임스페이스와 메타데이터 필터.
🧮 인덱스 선택
HNSW, IVF-PQ, Disk 기반 인덱스(옵션) 중 워크로드별 선택.
🛡️ 보안/컴플라이언스
데이터 암호화, IAM 정책, 감사로그·모니터링 연동.
스키마(예시)
필드 타입 설명
id string 문서/청크 고유 ID
vector float[] d 차원 임베딩 (예: 768/1024/3072)
text string 원문 또는 청크 텍스트
meta object 키워드, 태그, 권한, 날짜 등 필터용
ns string 네임스페이스(팀/프로젝트 경계)
* 차원(d)/거리함수는 컬렉션 생성 시 고정됩니다.
예시: 임베딩 파이프라인
# 1) 텍스트를 청크로 분할 (예: 800자, 100자 오버랩)
# 2) 임베딩 모델 호출 → 벡터 리스트 생성
# 3) 메타데이터 생성(ns, 태그, 권한 등)
# 4) upsert(batch)로 컬렉션에 적재
예시: upsert(JSON)
POST /v1/vector/upsert
{
  "collection": "docs",
  "namespace": "team-a",
  "points": [
    {"id":"a1","vector":[0.12, ...],"text":"청크1","meta":{"topic":"guide","lang":"ko"}},
    {"id":"a2","vector":[-0.03, ...],"text":"청크2","meta":{"topic":"faq","lang":"ko"}}
  ]
}
인덱스/거리함수
유형 핵심 파라미터 특징/적합
HNSW M, efConstruction, efSearch 고정밀·낮은 지연. 대부분의 온라인 검색에 적합
IVF-PQ nlist, nprobe, pq(m×nbits) 대규모·저비용. 오프라인 배치/대용량 인덱스
DiskANN(옵션) 캐시 크기, I/O 병렬 메모리 제약 환경에서 대용량 처리
거리함수 cosine / ip / l2 임베딩 학습 방식에 맞춰 선택
하이브리드 검색 옵션
옵션 설명 비고
Late Fusion BM25·KNN 점수 결합 빠르고 간단
Cross-Encoder 상위 후보 재랭크 정확도↑, 지연↑
MMR 다양성 극대화(중복 억제) QA·요약에 유리
운영/확장
샤딩/복제 — 컬렉션당 샤드 수, 복제 계수 선택.
일괄 적재 — 배치 upsert·비동기 빌드로 재색인 단축.
백업/스냅샷 — 스냅샷 + 내보내기(객체 스토리지 연동).
일관성 — 쓰기 확인 수준(단일/쿼럼) 선택.
TTL/보존 — 임시 임베딩 자동 만료 옵션.
버전 관리 — 임베딩 모델 교체 시 롤링 마이그레이션.
보안
IAM — 사용자/역할/정책 기반 접근제어, 네임스페이스 격리.
암호화 — 저장 시(At-Rest)·전송 중(In-Transit) 암호화.
네트워크 — VPC/서브넷, 보안그룹, 프라이빗 엔드포인트.
감사로그 — 쿼리/업데이트 이벤트 기록·보관.
쿼터/레이트 — API 키·쿼터·속도 제한으로 오남용 방지.
디도스보호(프록시) — 엣지 프록시 보호 연동(옵션).
모니터링/로그
항목 범위 설명
메트릭 컬렉션/샤드/노드 QPS, 지연 p50/p95/p99, 인덱스 빌드, 리콜 샘플링
로그 요청/오류 슬로우 쿼리, 필터/스코어, 재시도
트레이싱 요청 체인 임베딩→검색→LLM 응답 경로 추적
요금 안내
요금: 별도문의

컬렉션 수/차원 수(d)/인덱스 유형/스토리지 용량/트래픽/보관기간에 따라 산정됩니다.

RAG·시맨틱 검색, 지금 시작하세요
문서 유형/임베딩 차원/예상 QPS를 알려주시면 최적 구성을 제안드립니다.