Введение В кругах, занимающихся искусственным интеллектом, долгое время господствовал миф о том, что обучение передовых крупномасштабных моделей ИИ — это прерогатива исключительно монолитных, дорогостоящих параллельных файловых систем (PFS), унаследованных от...
GPU
222
19
S3 over RDMA: как ускорить путь данных к GPU без отказа от S3 Мы продолжаем говорить про S3/RDMA и сегодня подробно разберем доклад на SDC'25. Вопрос у него очень приземленный:...
222
19
390
35
Архитектура и назначение платформы Context Memory Storage NVIDIA Inference Context Memory Storage Platform – это новая архитектура хранения данных, специально разработанная для ускорения инференса крупных моделей за счет эффективной работы...
390
35
611
8
NFS (Network File System): как работает доступ к файлам по сети NFS (Network File System) — это файловый протокол поверх IP (чаще TCP), через который СХД публикует каталоги, а клиенты...
611
8
706
45
Раздел 1: Необходимость расширения памяти GPU за пределы монолитного сервера Современные вычислительные задачи, особенно в области искусственного интеллекта, анализа больших данных и научных симуляций, предъявляют беспрецедентные требования к ресурсам графических...
706
45
842
5
Проблема дефицита GPU-памяти в современных AI-системах Современные системы искусственного интеллекта всё чаще сталкиваются с критическим ограничением GPU-памяти: объём видеопамяти на ускорителях не успевает за ростом размеров и сложности нейронных моделей....
842
5