Новости про A100 и графические процессоры

NVIDIA выпустила майнинговую карту с производительностью 164 МХ/с

Ранее в этом году компания NVIDIA представила четыре видеокарты, которые специально предназначены для майнинга. Они вышли под именем Crypto Mining Processor (CMP) и предложили майнерам производительность от 26 МХ/с до 86 МХ/с.

Все эти карты основываются на GPU семейств Turing и Ampere и оснащаются системами охлаждения от производственных партнёров.

Видеоускоритель NVIDIA 170HX

Теперь же семейство этих ускорителей пополнилось новой флагманской моделью 170HX с пассивным охлаждением на базе ускорителя NVIDIA A100 с процессором GA100.

Система охлаждения NVIDIA 170HX

Эта новая модель ускорителя стала первой для NVIDIA, которая включает 4480 ядер CUDA и 8 ГБ памяти HBM2E, что заметно меньше, чем в других продуктах на базе GA100. Кроме этого, компания ограничила шину связи до 4 линий PCIe Gen 1. Таким образом, эту карту нельзя будет использовать для задач, отличных от майнинга. Тепловыделение карты 170HX составляет 250 Вт, а её базовая частота равна 1140 МГц с заблокированным BIOS, который не позволяет разгонять память.

Производительность NVIDIA 170HX
Спецификации NVIDIA 170HX из GPU-Z

В результате производительность ускорителя составляет 164 МХ/с в алгоритме Etash.

NVIDIA может выпустить самую мощную карту для майнинга

Согласно свежим слухам компания NVIDIA может использовать свой флагманский ускоритель расчётов Ampere A100 для создания лучшего майнера, с невероятной производительностью.

Компания NVIDIA провела некоторые действия с GPU A100, создав устройство на его базе в формате SXM. Затем компания выпустила PCIe-версию карты с пассивным охлаждением. Если говорить о цене такого ускорителя, то она будет составлять около 10 000 долларов, однако карта Ampere A100 будет и невероятно эффективной в майнинге.

Ускоритель NVIDIA A100

Производительность GPU NVIDIA Ampere A100 составляет 19,5 терафлопс при расчётах обычной точности. Также карта содержит 40 ГБ памяти HBM2 с производительностью 1,6 ТБ/с. Именно скорость работы памяти является ключевым фактором. На самом деле, для майнинга хватит и одного стэка HBM2 объёмом 8 ГБ.

Таким образом компания может выпустить ускоритель CMX HX на базе A100, который заметно дешевле 10 000 долларов. Однако, когда это произойдёт, информации пока нет.

Дефицит GPU добрался до центров обработки данных

В этом году наблюдается необычный дефицит графических процессоров, с которым столкнулись как NVIDIA с графикой Ampere, так и AMD с RDNA 2.

Все хотят купить новые ускорители, однако спрос на них высок, а производство столкнулось с проблемами и не может обеспечить выпуск видеокарт в достаточных объёмах.

Чтобы обезопасить своих корпоративных заказчиков компания NVIDIA установила правило, согласно которому приоритет производства отдаётся продукции для центров обработки данных. Однако и этот план находится под угрозой.

Ускоритель расчётов NVIDIA A100

Дефицит GPU достиг и ЦОД, и NVIDIA уже не в состоянии удовлетворить требования на поставку ускорителей A100 для высоконагруженных расчётов. Как известно, NVIDIA заявляла, что для «насыщения рынка потребуется несколько месяцев», и теперь это касается и коммерческих решений.

Этот факт является индуктором того, насколько велики проблемы в отрасли и насколько большой спрос на эти ускорители. Он особенно обострился после того, как компания представила ускорители A100 с 80 ГБ видеопамяти, которые будут доступны в первом полугодии 2021.

Сейчас мы можем лишь надеяться, что ситуация с дефицитом будет решена в течение обещанных нескольких месяцев.

Появились тесты NVIDIA Ampere A100

Когда компания NVIDIA представляла графический ускоритель Ampere A100, было сказано, что это её быстрейшее творение. Но никто не знал, как быстро он работает.

Этот ускоритель содержит 6912 ядер CUDA, а всего кристалл имеет 54 миллиарда транзисторов. Этот монстр работает с 40 ГБ сверхбыстрой памяти HBM2E с пропускной способностью 1555 ГБ/с.

Ускоритель NVIDIA A100

Жюль Урбах, исполнительный директор OTOY, компании, занимающейся разработкой ПО и известного теста OctaneRender, представила результаты первого тестирования GPU Ampere A100.

В тесте OctaneBench ускоритель набрал 446 балла, и занял первое место в мире. Для сравнения, видеокарта GeForce RTX 2080 Ti набирает в этом тесте 302 балла, что делает A100 на 47,7% быстрее Turing. Примечательно, что самая быстрая карта Turing — это Quadro RTX 8000, однако и она заметно проигрывает новичку, показывая лишь 328 очков.

Результаты тестирования A100 в OctaneBench

В ходе тестирования A100 работал с отключённым блоком RTX, так что при его включении можно ожидать ещё некоторый прирост в производительности.

GPU для видеокарт NVIDIA RTX 30-й серии будут изготовлены по 8 нм нормам Samsung

Согласно множеству слухов, компания NVIDIA планирует использовать 8 нм LPP-процесс от Samsung для производства графических процессоров своих видеокарт RTX 30-й серии, вместо 7 нм технологии TSMC.

При этом известно, что ускоритель NVIDIA Ampere A100 производится именно TSMC по 7 нм нормам. Множественные источники гласят, что новое поколение видеокарт NVIDIA будет полностью изготовлено по 8 нм процессу на заводах Samsung.

Честно говоря, эти слухи не выглядят правдоподобными. Известно, что Samsung хочет побороться за лидерство с TSMC, для чего продаёт свои блины с микросхемами дешевле конкурента. Но это не означает, что NVIDIA откажется от TSMC.

NVIDIA RTX 3080

Раньше NVIDIA всегда удавалось создать высокопроизводительные и экономные к энергии продукты, не прибегая к топовым технологиям. Достаточно сравнить энергопотребление 7 нм Navi от AMD с 12 нм решениями NVIDIA.

При этом не стоит исключать частичного перехода на процессоры, производства Samsung. Сейчас NVIDIA заказывает у южнокорейского гиганта GPU для нижнего сегмента видеокарт. Возможно, этот же подход сохраниться и в будущем.

В любом случае, правду мы узнаем после анонса видеокарт 30-й серии.

NVIDIA анонсирует самый крупный процессор — GPU Ampere A100

После нескольких небольших тизеров компания NVIDIA наконец-то представила новый графический процессор архитектуры Ampere под названием GA100, а также тензорный ускоритель A100.

Архитектура Ampere станет единой для всех типов ускорителей NVIDIA, при этом её реализация будет несколько отличаться в зависимости от назначения. Пока компания ведёт речь лишь о профессиональном применении, таком как ИИ, ЦОД и облачные вычисления. Для этих целей и предлагается новый GPU A100 с производительностью 20 терафлопс.

Платформа GA100

Чип A100 станет наследником Volta V100. Он производится по 7 нм нормам на заводах TSMC и содержит 54 миллиарда транзисторов, вдвое больше, чем у предшественника. В операциях обычной точности производительность составит 19,5 Тфлопс, 9,7 Тфлопс при двойной точности вычислений.

Если говорить о ядрах Tensor Core, применяемых в машинном обучении, то их производительность составляет 312 Тфлопс в задачах Tensor точности FP16. Что касается самой платформы ускорителя, то она содержит 40 ГБ памяти HBM2 с пропускной способностью в 1,6 ТБ/с. Количество ядер CUDA равно 6912 штукам. Тепловой пакет процессора A100 составляет 400 Вт, что на 50 Вт выше, чем у V100.

Что касается GA100, то он содержит 8192 ядра CUDA. В качестве видеопамяти используется 6 стеков HBM2 с пропускной способностью 2,4 Гб/с, которые подключены к 5 512-битным контроллерам памяти. всё вместе это обеспечивает ширину шины памяти в 6144 бита. Объём самой видеопамяти составляет 48 ГБ.

К сожалению, в ходе презентации, которую Дженсен Хуан вёл из дома, он ничего не сообщил о том, когда же новая архитектура найдёт себе место в игровых видеокартах GeForce.