Новости про графические процессоры

Раджа Кодури продемонстрировал процессоры Xe

Раджа Кодури, глава компании Intel, представил фотографии с новыми графическими процессорами Xe, продемонстрировав анонсированный ранее плиточный дизайн.

Архитектура Xe изначально создавалась масштабируемой для использования в центрах обработки данных, и теперь стало понятно, как это «плиточное» масштабирование выглядит.

Плиточная конструкция процессоров Xe для GPGPU

На представленных изображениях показаны три варианта ускорителей, на одну плитку, две и четыре. Последний назван BFP (big 'fabulous' package).

Ранее сообщалось, что эта мультичиповая масштабируемая система построена как чиплет. За счёт масштабирования она позволит получить ту же гибкость, что предлагают мультичиповые процессоры AMD EPYC. При этом такая конструкция может не коснуться рынка потребительских видеокарт, поскольку они требовательны ко времени задержек, а именно этот параметр и является слабым местом конструкций MCM.

Младшие GPU RDNA2 тоже получат трассировку лучей

Словосочетание «трассировка лучей» доносится из каждого утюга уже два года. Два главных участника рынка игровых видеокарт готовят новые решения, где будет представлена эта технология.

Для AMD это более важно, ведь у NVIDIA уже есть первое поколение ускорителей RTX, которые представлены только средними и топовыми моделями. Похоже, что у AMD с RDNA 2 ситуация будет несколько иной. В Сети появился новый GPU ID неизвестной видеокарты Radeon. По всей видимости, речь идёт о графическом процессоре GFX1032, который также называют Navi 23. Дело в том, что Navi 21 называется GFX1030, а Navi 22 — GFX1031. Но самое главное, что все они будут поддерживать аппаратное ускорение трассировки лучей.

AMD Radeon

Модель Navi 23 будет представлять собой продукт среднего или нижнего уровня. Средний сегмент будет построен на Navi 22, а верхний — на Navi 21.

NAVI14:gfx1012
NAVI21:gfx1030
NAVI22:gfx1031
NAVI23:gfx1032
RAVEN2:gfx909
RENOIR:gfx909
NAVI10:gfx1010
NAVI12:gfx1011
VANGOGH:gfx1033
VANGOGHLITE:gfx1040

Ожидается, что первые видеокарты на базе архитектуры RDNA 2 появятся уже в этом году.

AMD поставила полмиллиарда GPU за 7 лет

Согласно аналитической компании John Peddie Research, компания AMD выпустила на рынок 533 миллиона графических процессоров за последние 7 лет.

Это достижение разделено на несколько категорий. Большую часть продаж составили дискретные решения компании, 36%. Графика в составе APU дала 35% этой величины, а консоли — 29%. Неудивительно, что количество APU для ноутбуков превзошло таковые для настольных ПК в два раза.

Процессоры AMD

Кроме успехов AMD компания JPR также сообщила статистику по поставкам и других игроков рынка. За последние 7 лет компания AMD занимает 22% рынка, NVIDIA — 16%, и Intel — 62%. Поскольку все процессоры Intel (ну кроме моделей HEDT) оснащаются GPU, то технически, лидером рынка является Intel. Тем не менее, заслуги AMD никак нельзя умалять. А учитывая популярность нынешних процессоров Ryzen и подготовку новых консолей, через несколько лет компания вполне может заявить о миллиардных поставках за десятилетие.

Круговая диаграмма графических процессоров AMD по применению

Intel показала производительность Xe в Battlefield V

Похоже, что у Intel получается создать весьма неплохой графический ускоритель.

Главный стратег по производительности Intel Райан Шраут показал, как будет работать игра Battlefield V на новом GPU компании. Стратег запустил игру на тестовом ноутбуке, оснащённом готовящимся процессором Tiger Lake, который содержит вычислительные ядра нового поколения Willow Cove и графика 12-го поколения, известную как Xe. В результате, игра на высоких настройках качества и в разрешении 1080p стабильно выдавала 30 к/с.

Главный стратег по производительности Intel Райан Шраут демонстрирует Tiger Lake

Это очень хороший результат для интегрированной графики. Для сравнения, свежий процессор AMD Ryzen 9 4900HS с его графикой Vega 8 выдаёт 25 к/с в идентичных условиях.

В драйвере Linux появился GPU Sienna Cichlid

То, что AMD готовит новую серию видеокарт Radeon RX 6000 на базе архитектуры RDNA2 — ни для кого не секрет. И момент выхода приближается, поскольку в драйвере Linux появились новые упоминания об этих GPU.

Драйвер теперь включает дополнительные строки кода, которые намекают на Navi 21. В коде упоминаются GFX1030, GFX1010 и GFX1012, которые связывают с графическими процессорами Navi 21, Navi 10 и Navi 14. Phoronix утверждает, что этот патч подтверждает поддержку VCN 3.0 процессорами Navi и они имеют возможности аппаратного кодирования видео и содержат обновление DCN3 для дисплеев.

Radeon

Программный инженер AMD Алекс Дюшер пояснил, что кодовое имя Sienna Cichlid означает «GPU от AMD. Этот патч даёт дополнительную поддержку, включая управление питанием, дисплеем, KFD, прерываниями, GFX, мультимедиа и так далее».

Плагин для RivaTuner Statistic Server получил ряд существенных плюсов

Продолжается работа над плагином визуального редактора оверлея в RTSS.

За пару выходных Алексей Николайчук добавил в него несколько базовых улучшений, на основе которых теперь можно создавать как пассивные, так и комплексные динамические анимации. В видео ниже демонстрируются 3 базовых «кирпичика», лежащих в основе создания анимаций в оверлее:

  • Источники данных на основе таймеров.
  • Асинхронно обновляемые слои.
  • Улучшенный лексический анализатор и транслятор формул, позволяющий использовать в формулах коррекции перекрёстные ссылки на другие источники данных.

На основе этого в видео показан процесс создания пассивной анимации вращающегося кулера, а затем процесс создания динамической анимации с привязкой скорости вращения к реальному сенсору скорости кулера GPU.

Testing new features in OverlayEditor plugin. Simple passive and advanced dynamic animations.

Активная работа над программой продолжается!

Adobe Premiere Pro получил поддержку кодирования на GPU

Сбылась мечта многих видеографов. Компания Adobe выпустила обновление своего пакета видеомонтажа Premiere Pro, который теперь для кодирования видео может использовать аппаратное ускорение GPU.

Версия 14.2 Premiere Pro позволяет применять технологию NVENC, которая ускоряет процесс кодирования видео до 5 раз, по сравнению с использованием CPU. Пакет и раньше использовал шейдеры видеокарт для ускорения обработки эффектов и времени экспорта, однако раньше он не умел применять аппаратный кодек от NVIDIA. Теперь же владельцы видеокарт GeForce и Quadro последних моделей могут резко сократить время экспорта при использовании кодеков H.264, H.265 и HEVC. Кроме того, Adobe смогла обеспечить также аппаратное ускорение экспорта видео и на видеокартах AMD Radeon.

Прирост производительности кодирования видео при ускорении GPU

Сейчас поддерживается довольно широкий спектр видеокарт от NVIDIA, начиная от GeForce GTX 1050 и более новых, а также их аналоги в серии Quadro. Что касается AMD, пока аппаратное кодирование видео возможно лишь на серии Radeon Pro.

Перечень поддерживаемых видеокарт для аппаратного ускорения кодировки видео

NVIDIA анонсирует самый крупный процессор — GPU Ampere A100

После нескольких небольших тизеров компания NVIDIA наконец-то представила новый графический процессор архитектуры Ampere под названием GA100, а также тензорный ускоритель A100.

Архитектура Ampere станет единой для всех типов ускорителей NVIDIA, при этом её реализация будет несколько отличаться в зависимости от назначения. Пока компания ведёт речь лишь о профессиональном применении, таком как ИИ, ЦОД и облачные вычисления. Для этих целей и предлагается новый GPU A100 с производительностью 20 терафлопс.

Платформа GA100

Чип A100 станет наследником Volta V100. Он производится по 7 нм нормам на заводах TSMC и содержит 54 миллиарда транзисторов, вдвое больше, чем у предшественника. В операциях обычной точности производительность составит 19,5 Тфлопс, 9,7 Тфлопс при двойной точности вычислений.

Если говорить о ядрах Tensor Core, применяемых в машинном обучении, то их производительность составляет 312 Тфлопс в задачах Tensor точности FP16. Что касается самой платформы ускорителя, то она содержит 40 ГБ памяти HBM2 с пропускной способностью в 1,6 ТБ/с. Количество ядер CUDA равно 6912 штукам. Тепловой пакет процессора A100 составляет 400 Вт, что на 50 Вт выше, чем у V100.

Что касается GA100, то он содержит 8192 ядра CUDA. В качестве видеопамяти используется 6 стеков HBM2 с пропускной способностью 2,4 Гб/с, которые подключены к 5 512-битным контроллерам памяти. всё вместе это обеспечивает ширину шины памяти в 6144 бита. Объём самой видеопамяти составляет 48 ГБ.

К сожалению, в ходе презентации, которую Дженсен Хуан вёл из дома, он ничего не сообщил о том, когда же новая архитектура найдёт себе место в игровых видеокартах GeForce.

Новый Intel Xe DG1 появился в базе SiSoftware

Ранний образец графического ускорителя Intel Xe DG1 появился в базе данных SiSoftware. Также появился слайд, который говорит о нацеленности этого ускорителя на рынок ноутбуков.

Согласно записям, в базе SiSoftware, видеокарта Intel Xe DG1 получит 3 ГБ видеопамяти и графический процессор с тактовой частотой 1,50 ГГц, 1 МБ кэша L2 и 96 исполнительных блоков (EU), что означает 768 шейдерных процессоров.

Видеокарта Intel Xe DG1-SDV

При этом новая Xe DG1 отличается от DG1-SDV, информация о которой была опубликована раньше. Ускоритель DG1-SDV имел частоту в 900 МГц и производительность на уровне 1,382 терафлопса FP32. У нового решения производительность составляет 2,30 терафлопс. Для сравнения, графический процессор в консоли PS4 обладает производительностью 1,84 Тфлопс, а у GeForce GTX 1050 Ti — 2,1 Тфлопс.

Согласно утекшему презентационному слайду, Xe DG1 будет видеокартой для маломощных ноутбуков. При этом Intel Xe DG1-SDV, показанная на CES 2020, была представлена в виде карты для настольного ПК.

Спецификации видеокарты Intel Xe DG1

Учитывая характеристики видеокарты Xe DG1, опубликованные в базе SiSoftware, решение Intel вполне сможет конкурировать с серией NVIDIA MX300.

Новая бета-версия RivaTuner Statistics Server уже доступна для скачивания

Традиционно выдержав необходимую для внутреннего тестирования задержку в несколько дней, Алексей Николайчук публично объявил о выходе очередной версии и сделал её видимой серверам обновления.

Ключевые изменения новинки мы уже описывали ранее: во-первых, это внутренний HAL и встроенное мини-ядро мониторинга на его основе (только встроенные сенсоры драйвера видеоадаптера с минимальным риском конфликта со сторонними ядрами мониторинга). Во-вторых, это встроенная возможность подключения счётчиков производительности операционной системы (загрузка/скорость чтения/записи накопителей, скорости скачивания/закачки сетевых интерефейсов и так далее) — полный функциональный клон плагина PerfCounter из SDKMSI AB но для тех, кто хочет использовать RivaTuner Statistics Server отдельно от него.

Также добавился альтернативный интерфейс для стриминга абсолютных меток времени кадров в стороннее ПО через именованный пайп. Специально для этого проекта: RTSS_time_reader.

Скачать программное обеспечение можно как обычно — на странице утилиты.