< вернуться назад

WALSH — новый подход к хранению dedup-индекса

WALSH — новый подход к хранению dedup-индекса
#BAUM #MDS #BaumTechPulse #WALSH
2 минуты
WALSH — новый подход к хранению dedup-индекса

Write-Aggregating Log-Structured Hashing: новая модель хранения данных

Недавно группа ученых представили WALSH — Write-Aggregating Log-Structured Hashing (источник: https://dl.acm.org/doi/10.1145/3715010), индекс для гибридной DRAM + постоянной памяти (PM), который одновременно:

Сокращает write-amplification записи

Вместо множественных мелких обращений WALSH собирает их в мини-журнал в DRAM и единым блоком сбрасывает в PM. Это резко снижает аппаратное write-amplification, критичное для Storage-Class Memory подобных модулей .

Хранит минимум метаданных в ОЗУ

«Голова» каждой цепочки остаётся в DRAM, а «хвосты» ведутся прямо в журналах PM;в  итоге  -87 % DRAM по сравнению с лучшими гибридными хеш-таблицами.

Обеспечивает параллелизм

Четырёхфазный протокол отделяет поиск, запись, компакцию и очистку; потоки работают без глобальных блокировок и при этом сохраняют crash-consistency.

Восстанавливается за секунды

Для базы на ≈1 млрд ключей контекст журнала перечитывается за «несколько секунд», тогда как аналоги требовали минут. Производительность вставок до 2,4× выше других современных подходов.

Почему для BAUM это важно?

Мы в BAUM MDS постоянно исследуем подобные архитектуры. 

Хранить огромные хеш-таблицы — будь то карты дедупликации или карты размещения блоков — очень сложная инженерная задача:

  • Обновление таблиц происходит мелкими вставками 24/7;
  • Карты размещения должны переживать сбой и подниматься в секунды, иначе падает весь storage-кластер;
  • Объем метаданных может быстро разрастаться, сталкивая нас с Memory-wall 

WALSH демонстрирует, как лог-структурная идея LSM может жить внутри простой хеш-структуры и тем самым убивать сразу три боли: износ SLC модулей, нехватку оперативки и длительное recovery.

Мы будем анализировать, какие элементы решения можно перенести в наши модули MDS.

Автор: Андрей Гантимуров

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *
Author
Посетитель сайта

Добавить комментарий

Комментариев пока нет

Другие статьи, которые могут быть полезными

4075
40
Введение В течение многих десятилетий RAID-контроллеры были основным ключевым элементом построения высокопроизводительных высокодоступных СХД, но с появлением NAND SSD ситуация стала меняться. Все большее значение на рынке стали занимать программные...
4075
40
Проблема дефицита GPU-памяти в современных AI-системах Современные системы искусственного интеллекта всё чаще сталкиваются с критическим ограничением GPU-памяти: объём видеопамяти на ускорителях не успевает за ростом размеров и сложности нейронных моделей....
889
5
№ Вопрос Ответ 1. Какова сервисная поддержка BAUMSTORAGE ? Гарантийная и сервисная поддержка производится инженерами BAUMSTORAGE и сервисными службами партнёров. Имеются три вида сервисной поддержки: гарантия на аппаратное обеспечение,...
2930
1