입력

토큰/문서
원/USD

결과

월 임베딩 + 벡터 DB 비용 (KRW) · MONTHLY
-
값을 입력하세요
총 토큰
-
임베딩 비용 (일회)
-
벡터 DB 월 비용
-
벡터 DB 연 비용
-
USD 임베딩
-
USD DB 월
-
초기 + 1년 운영 (KRW)
-

모델별 임베딩 비용 비교 (현재 입력 기준)

모델1M 토큰 단가임베딩 비용 (KRW)저장 + 임베딩 1년

어떻게 계산하나요

총 토큰 = 문서 수 × 평균 문서 토큰

임베딩 비용 (일회) = 총 토큰 ÷ 1M × 모델 단가

벡터 DB 월 = (벡터 수 ÷ 1M) × 차원배율 × $70

벡터 DB 월 비용은 Pinecone Standard (1M 벡터 1536차원 ≈ $70/월) 기준. 차원이 1024 면 0.67배, 3072 면 2배 가산 (저장 용량 비례). Weaviate Cloud·Qdrant Cloud 도 비슷한 가격대이며, 자체 호스팅(pgvector·Chroma) 은 GPU 비용으로 대체됩니다. 핵심 답변(월 비용)은 임베딩 일회성을 12개월로 분할한 추정치 + 벡터 DB 월 비용 합산입니다.

2026 추정 임베딩 모델 단가 (USD per 1M tokens)

모델단가기본 차원제공자
text-embedding-3-small$0.021536OpenAI
text-embedding-3-large$0.133072OpenAI
text-embedding-ada-002$0.101536OpenAI (레거시)
voyage-3$0.061024Voyage AI

임베딩은 일회성, 벡터 DB 저장이 지속 비용입니다. 1년 운영 시 벡터 DB 비용이 임베딩 비용의 5~10배에 달하므로 차원 선택과 저장 정책(주기적 삭제·압축)이 장기 비용에 결정적입니다. 2026 추정 단가이며 정확한 가격은 platform.openai.com / pinecone.io 확인 필수.

한계와 비용 절감 전략

  • 벡터 DB 가격 단순화 — Pinecone Standard $70/M (1536차원) 단일 기준. Serverless 는 사용량 기반(쿼리당 과금)이라 더 저렴할 수 있습니다
  • 쿼리 임베딩 미반영 — 검색 시 쿼리도 매번 임베딩이 필요합니다. 일 검색 1만 회 × 평균 50토큰 ≈ 일 50만 토큰, text-embedding-3-small 기준 월 $0.30 정도
  • 차원 트레이드오프 — 1024 차원은 저장·검색이 빠르지만 정확도 약간 감소. 3072 는 정확하지만 저장 비용 3배. RAG 정확도 측정 후 결정
  • 자체 호스팅 옵션 — pgvector(Postgres) 또는 Chroma 로 직접 운영 시 벡터 DB 비용 0 (서버비만 발생). 100만~1000만 벡터 규모는 자체 호스팅이 유리합니다
  • 모델 업그레이드 = 재임베딩 — ada-002 → 3-small 처럼 모델 변경 시 전체 재임베딩 비용이 발생합니다. 신규 프로젝트는 처음부터 최신 모델 권장
  • 청크 크기 최적화 — 너무 작으면(100 토큰) 검색 정확도 낮고, 너무 크면(8000 토큰) 검색 결과 노이즈. RAG 표준은 300~800 토큰