임베딩은 한 번만 만들면 되나요?

원본 문서가 변경되지 않으면 임베딩은 일회성 비용입니다. 그러나 검색 쿼리는 매번 임베딩이 필요 (쿼리 토큰 비용). 또한 모델 업데이트 시 전체 재임베딩이 필요합니다 (예: text-embedding-ada-002 → 3-large 마이그레이션).

Voyage AI 가 OpenAI 보다 좋다는데 사실인가요?

Voyage AI 의 voyage-3 는 일부 벤치마크(MTEB)에서 OpenAI text-embedding-3-large 와 동급 또는 우수하며 가격은 절반 수준($0.06 vs $0.13/1M). Anthropic 이 공식 추천한 임베딩 파트너입니다. 단 OpenAI 는 생태계·SDK 가 풍부하므로 신규 프로젝트는 둘 다 PoC 후 결정 권장.

DIGITAL · BASIC

임베딩 API 비용 계산기

TL;DR 임베딩 API 호출 비용 자체는 차원과 무관합니다 (토큰 수 × 단가). 그러나 1024 vs 3072 차원은 벡터 DB 저장 용량이 3배 차이라서 Pinecone·Weaviate 등 벡터 DB 의 월 운영 비용이 약 3배 차이가 됩니다.

RAG(검색 보강 생성) 시스템 구축 시 임베딩(벡터 변환) 일회성 비용과 벡터 DB(임베딩 저장소) 월 비용을 분리 산출합니다. OpenAI·Voyage AI 모델 지원, 차원(임베딩 벡터 길이) 1024/3072 에 따른 저장 비용 자동 환산. 2026 추정 단가.

입력

임베딩 모델 2026 추정 단가, 변동 가능

3-small 3-large ada-002 voyage-3

문서 수 임베딩할 청크 개수

개

평균 문서 토큰 청크당 토큰 수

토큰/문서

벡터 차원 저장 용량에 영향 (호출 비용은 동일)

1024 1536 3072

환율 USD → KRW

원/USD

결과

월 임베딩 + 벡터 DB 비용 (KRW) · MONTHLY

값을 입력하세요

총 토큰

임베딩 비용 (일회)

벡터 DB 월 비용

벡터 DB 연 비용

USD 임베딩

USD DB 월

초기 + 1년 운영 (KRW)

모델별 임베딩 비용 비교 (현재 입력 기준)

모델	1M 토큰 단가	임베딩 비용 (KRW)	저장 + 임베딩 1년

어떻게 계산하나요

총 토큰 = 문서 수 × 평균 문서 토큰

임베딩 비용 (일회) = 총 토큰 ÷ 1M × 모델 단가

벡터 DB 월 = (벡터 수 ÷ 1M) × 차원배율 × $70

벡터 DB 월 비용은 Pinecone Standard (1M 벡터 1536차원 ≈ $70/월) 기준. 차원이 1024 면 0.67배, 3072 면 2배 가산 (저장 용량 비례). Weaviate Cloud·Qdrant Cloud 도 비슷한 가격대이며, 자체 호스팅(pgvector·Chroma) 은 GPU 비용으로 대체됩니다. 핵심 답변(월 비용)은 임베딩 일회성을 12개월로 분할한 추정치 + 벡터 DB 월 비용 합산입니다.

2026 추정 임베딩 모델 단가 (USD per 1M tokens)

모델	단가	기본 차원	제공자
text-embedding-3-small	$0.02	1536	OpenAI
text-embedding-3-large	$0.13	3072	OpenAI
text-embedding-ada-002	$0.10	1536	OpenAI (레거시)
voyage-3	$0.06	1024	Voyage AI

임베딩은 일회성, 벡터 DB 저장이 지속 비용입니다. 1년 운영 시 벡터 DB 비용이 임베딩 비용의 5~10배에 달하므로 차원 선택과 저장 정책(주기적 삭제·압축)이 장기 비용에 결정적입니다. 2026 추정 단가이며 정확한 가격은 platform.openai.com / pinecone.io 확인 필수.

한계와 비용 절감 전략

벡터 DB 가격 단순화 — Pinecone Standard $70/M (1536차원) 단일 기준. Serverless 는 사용량 기반(쿼리당 과금)이라 더 저렴할 수 있습니다
쿼리 임베딩 미반영 — 검색 시 쿼리도 매번 임베딩이 필요합니다. 일 검색 1만 회 × 평균 50토큰 ≈ 일 50만 토큰, text-embedding-3-small 기준 월 $0.30 정도
차원 트레이드오프 — 1024 차원은 저장·검색이 빠르지만 정확도 약간 감소. 3072 는 정확하지만 저장 비용 3배. RAG 정확도 측정 후 결정
자체 호스팅 옵션 — pgvector(Postgres) 또는 Chroma 로 직접 운영 시 벡터 DB 비용 0 (서버비만 발생). 100만~1000만 벡터 규모는 자체 호스팅이 유리합니다
모델 업그레이드 = 재임베딩 — ada-002 → 3-small 처럼 모델 변경 시 전체 재임베딩 비용이 발생합니다. 신규 프로젝트는 처음부터 최신 모델 권장
청크 크기 최적화 — 너무 작으면(100 토큰) 검색 정확도 낮고, 너무 크면(8000 토큰) 검색 결과 노이즈. RAG 표준은 300~800 토큰