Retrieval-Augmented Generation (RAG) — это техника, которая усиливает генеративный AI, комбинируя его с системой поиска. Вместо того чтобы полагаться исключительно на данные обучения модели, RAG динамически получает релевантную информацию из внешней базы знаний и использует её как контекст при генерации.
sentence-transformersPinecone, Chroma, FAISS)User Query → Embed Query → Vector Search → Retrieved Chunks
→ Prompt (query + chunks) → LLM → Final Response
Векторные базы данных критически важны для RAG, потому что они обеспечивают быстрый семантический поиск в масштабе:
FAISS (локальная), Chroma (лёгкая) и Pinecone (облачная)LangChain или LlamaIndexВекторные базы данных в системах RAG выполняют точный поиск совпадений, чтобы найти документы, которые точно соответствуют embedding запроса, обеспечивая идеальную точность поиска.
Новый — ещё не проверен сообществом
Вы