DIGITAL · BASIC
임베딩 API 비용 계산기
RAG(검색 보강 생성) 시스템 구축 시 임베딩(벡터 변환) 일회성 비용과 벡터 DB(임베딩 저장소) 월 비용을 분리 산출합니다. OpenAI·Voyage AI 모델 지원, 차원(임베딩 벡터 길이) 1024/3072 에 따른 저장 비용 자동 환산. 2026 추정 단가.
입력
개
토큰/문서
원/USD
결과
월 임베딩 + 벡터 DB 비용 (KRW) · MONTHLY
-
값을 입력하세요
총 토큰
-
임베딩 비용 (일회)
-
벡터 DB 월 비용
-
벡터 DB 연 비용
-
USD 임베딩
-
USD DB 월
-
초기 + 1년 운영 (KRW)
-
모델별 임베딩 비용 비교 (현재 입력 기준)
| 모델 | 1M 토큰 단가 | 임베딩 비용 (KRW) | 저장 + 임베딩 1년 |
|---|
어떻게 계산하나요
총 토큰 = 문서 수 × 평균 문서 토큰
임베딩 비용 (일회) = 총 토큰 ÷ 1M × 모델 단가
벡터 DB 월 = (벡터 수 ÷ 1M) × 차원배율 × $70
벡터 DB 월 비용은 Pinecone Standard (1M 벡터 1536차원 ≈ $70/월) 기준. 차원이 1024 면 0.67배, 3072 면 2배 가산 (저장 용량 비례). Weaviate Cloud·Qdrant Cloud 도 비슷한 가격대이며, 자체 호스팅(pgvector·Chroma) 은 GPU 비용으로 대체됩니다. 핵심 답변(월 비용)은 임베딩 일회성을 12개월로 분할한 추정치 + 벡터 DB 월 비용 합산입니다.
2026 추정 임베딩 모델 단가 (USD per 1M tokens)
| 모델 | 단가 | 기본 차원 | 제공자 |
|---|---|---|---|
| text-embedding-3-small | $0.02 | 1536 | OpenAI |
| text-embedding-3-large | $0.13 | 3072 | OpenAI |
| text-embedding-ada-002 | $0.10 | 1536 | OpenAI (레거시) |
| voyage-3 | $0.06 | 1024 | Voyage AI |
임베딩은 일회성, 벡터 DB 저장이 지속 비용입니다. 1년 운영 시 벡터 DB 비용이 임베딩 비용의 5~10배에 달하므로 차원 선택과 저장 정책(주기적 삭제·압축)이 장기 비용에 결정적입니다. 2026 추정 단가이며 정확한 가격은 platform.openai.com / pinecone.io 확인 필수.
한계와 비용 절감 전략
- 벡터 DB 가격 단순화 — Pinecone Standard $70/M (1536차원) 단일 기준. Serverless 는 사용량 기반(쿼리당 과금)이라 더 저렴할 수 있습니다
- 쿼리 임베딩 미반영 — 검색 시 쿼리도 매번 임베딩이 필요합니다. 일 검색 1만 회 × 평균 50토큰 ≈ 일 50만 토큰, text-embedding-3-small 기준 월 $0.30 정도
- 차원 트레이드오프 — 1024 차원은 저장·검색이 빠르지만 정확도 약간 감소. 3072 는 정확하지만 저장 비용 3배. RAG 정확도 측정 후 결정
- 자체 호스팅 옵션 — pgvector(Postgres) 또는 Chroma 로 직접 운영 시 벡터 DB 비용 0 (서버비만 발생). 100만~1000만 벡터 규모는 자체 호스팅이 유리합니다
- 모델 업그레이드 = 재임베딩 — ada-002 → 3-small 처럼 모델 변경 시 전체 재임베딩 비용이 발생합니다. 신규 프로젝트는 처음부터 최신 모델 권장
- 청크 크기 최적화 — 너무 작으면(100 토큰) 검색 정확도 낮고, 너무 크면(8000 토큰) 검색 결과 노이즈. RAG 표준은 300~800 토큰