GPU Archives

Современная архитектура хранения данных для крупномасштабного ИИ

2 недели назад

104

33

Современная архитектура хранения данных для крупномасштабного ИИ

Введение В кругах, занимающихся искусственным интеллектом, долгое время господствовал миф о том, что обучение передовых крупномасштабных моделей ИИ — это прерогатива исключительно монолитных, дорогостоящих параллельных файловых систем (PFS), унаследованных от...

104

33

2 недели назад

Ускорение объектного хранилища для AI/ML с помощью S3 RDMA

2 месяца назад

Андрей Гантимуров

222

19

Ускорение объектного хранилища для AI/ML с помощью S3 RDMA

S3 over RDMA: как ускорить путь данных к GPU без отказа от S3 Мы продолжаем говорить про S3/RDMA и сегодня подробно разберем доклад на SDC'25. Вопрос у него очень приземленный:...

222

19

2 месяца назад

NVIDIA Inference Context Memory Platform (платформа контекстной памяти для инференса)

4 месяца назад

Андрей Гантимуров

390

35

NVIDIA Inference Context Memory Platform (платформа контекстной памяти для инференса)

Архитектура и назначение платформы Context Memory Storage NVIDIA Inference Context Memory Storage Platform – это новая архитектура хранения данных, специально разработанная для ускорения инференса крупных моделей за счет эффективной работы...

390

35

4 месяца назад

NFS over RDMA: от базовых принципов до вариантов использования с ИИ

6 месяцев назад

Олег Ларин

611

8

NFS over RDMA: от базовых принципов до вариантов использования с ИИ

NFS (Network File System): как работает доступ к файлам по сети NFS (Network File System) — это файловый протокол поверх IP (чаще TCP), через который СХД публикует каталоги, а клиенты...

611

8

6 месяцев назад

Архитектуры для расширения памяти GPU через высокоскоростные сетевые фабрики: обзор исследований

9 месяцев назад

Андрей Гантимуров

706

45

Архитектуры для расширения памяти GPU через высокоскоростные сетевые фабрики: обзор исследований

Раздел 1: Необходимость расширения памяти GPU за пределы монолитного сервера Современные вычислительные задачи, особенно в области искусственного интеллекта, анализа больших данных и научных симуляций, предъявляют беспрецедентные требования к ресурсам графических...

706

45

9 месяцев назад

Боремся с дефицитом памяти GPU

9 месяцев назад

Андрей Гантимуров

842

5

Боремся с дефицитом памяти GPU

Проблема дефицита GPU-памяти в современных AI-системах Современные системы искусственного интеллекта всё чаще сталкиваются с критическим ограничением GPU-памяти: объём видеопамяти на ускорителях не успевает за ростом размеров и сложности нейронных моделей....

842

5

9 месяцев назад