S3 Vector Bucket для демократизации RAG

3 минуты

275

3

S3 Vector Bucket для демократизации RAG

В Amazon S3 появился новый тип «vector bucket» (часть превью-функции S3 Vectors). Он хранит и индексирует эмбеддинги так же дёшево и надёжно, как обычные объекты S3, при этом предоставляет быстрый поиск и отдельный API.

По расчётам AWS, перенос «холодных» векторов из постоянно работающей базы OpenSearch в S3 снижает совокупные расходы на хранение и поиск до 90 % — именно то, чего не хватало массовым RAG-системам, где объём эмбеддингов растёт быстрее, чем сами модели. (Amazon Web Services, Blocks and Files)

Vector Bucket: как это устроено

Емкость и масштаб. В одном vector-bucket можно держать до 10 000 индексов, каждый — десятки миллионов векторов. (Amazon Web Services)
Метаданные и фильтры. К каждому вектору добавляются пары «ключ-значение»; по ним можно мгновенно отфильтровать выдачу (дата, языковая версия, владелец и т. д.). (Blocks and Files, AWS Documentation)
Кейсы. От медицинских снимков и дублирующих видео до enterprise-поиска — там, где нужно быстро найти «семантически похожие» объекты в петабайтах данных. (AWS Documentation)

Retrieval-Augmented Generation (RAG) добавляет внешние знания к LLM, но требует постоянного пополнения и переиндексации эмбеддингов. (Amazon Web Services)

Дешёвое долговременное хранение — S3 Vectors снимает главный вопрос стоимости, особенно для «архивных» датасетов, которые нужны модели лишь иногда. (Blocks and Files)
Качество ответов — исследования уже показывают, что RAG-системы должны уметь бороться с амбивалентными или конфликтными источниками (см. MADAM-RAG).
Мультимодальность — свежие практики предлагают хранить единый эмбеддинг для текста + картинок и строить truly-multimodal RAG, что опять-таки требует огромных, но недорогих векторных хранилищ.

Экспертное мнение Baum

Мы в Baum выстраиваем сотрудничество с ведущими российскими разработчиками LLM для RAG в продукте Swarm, чтобы построить «внутренние источники знаний” компаний на собственных данных.

Что это значит для отрасли

Vector Buckets делают векторизацию «коммодити»-услугой: вместо собственных кластеров Milvus/Faiss теперь достаточно S3. Это удешевляет вход в RAG-проекты, а значит, ускорит внедрение корпоративных ассистентов, поисковых движков и агентных ИИ-систем. Следующий логичный шаг — появление «умных» объектных сторажей, где векторный поиск, версионирование и AI-функции войдут в ядро, а не будут внешними аддонами. И именно над такой гибридной архитектурой мы в Baum уже работаем.

Андрей Гантимуров
andrey_gantimurov@baum.ru

< вернуться назад

Андрей Гантимуров

CTO BAUM

Об авторе

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Посетитель сайта

Добавить комментарий Отменить ответ

Комментариев пока нет

Другие статьи, которые могут быть полезными

Файловая система UDS

Admin Admin

2169

4

Файловая система UDS

В продукте UDS BAUMSTORAGE используется две файловые системы: обычная функциональная и быстрая. Обычная функциональная файловая система Функционал обычных пулов предоставляется обычной функциональной файловой системой (ФС) BAUMSTORAGE. Ключевой особенностью данной ФС...

2169

4

Мониторинг и логирование

Admin Admin

2172

5

Мониторинг и логирование

1. Мониторинг работы оборудования Работа оборудования контролируется при помощи встроенных датчиков, показания которых отображаются в интерфейсе управления BAUMSTORAGE. За мониторинг аппаратного обеспечения контроллеров отвечает сервис аппаратного мониторинга – HWmon. ...

2172

5

Эволюция корпоративных SSD: от простых решений к многоуровневой архитектуре

Олег Ларин

413

10

Эволюция корпоративных SSD: от простых решений к многоуровневой архитектуре

Новая парадигма корпоративных накопителей: пять специализированных направлений Современный рынок корпоративных SSD преодолел простое разделение на устройства, ориентированные на чтение (read-intensive) или запись (write-intensive). Разнообразие рабочих нагрузок и растущие объёмы данных...

413

10

Современные распределенные объектные/файловые/блочные и key-value хранилища – Intel DAOS (часть 2)

Многопутевое (multipathing) подключение дисковых полок (SAS)

Сбалансированные HPC-AI инфраструктуры

Запасные диски (hot spare disk)

Консистентные снапшоты (плагин BMapp)

S3 Vector Bucket для демократизации RAG

Добавить комментарий

Добавить комментарий Отменить ответ

Комментариев пока нет

Другие статьи, которые могут быть полезными

Файловая система UDS

Мониторинг и логирование

Эволюция корпоративных SSD: от простых решений к многоуровневой архитектуре