Сравнение последних версий Detonator: 30.82 vs 40.41

10.09.2002


Содержание

Введение

Сказать, что драйверы NVIDIA выпускает часто, это значит, ничего не сказать. Драйвер для чипа TNT, не без доли юмора названный NVIDIA как "Detonator", продолжает волновать умы пользователей. Сегодня, риск "детонации", того количества утекающих в сеть неофициальных бета-версий Detonator, уже представляет серьезную угрозу, даже без самого "тринитротолуола", именуемого теперь "GeForce4". Да, NVIDIA нам не раз показывала, что ее драйверы могут быть страшным оружием в конкурентной борьбе, добавляя новейшим чипам компании дополнительной "взрывной мощи" в "критические дни".

Сегодня мы посмотрим, что может дать последним чипам NVIDIA очередное творение их же программистов.

Герой дня:

Версия: 40.41
Размер: 9 MB
Дата релиза: August 29, 2002
Подана заявка на WHQL-сертификат (герой дня без галстука?)
Загрузить с сайта NVIDIA

Официальные нововведения:

  • Увеличение производительности, вплоть до 25%
  • Улучшенные возможности nView (nView 2.0)
  • Возможность изменения ориентации изображения на экране, актуальная для владельцев LCD-мониторов с возможностью поворота дисплея (NVRotate)
  • Эмулятор CineFX, облегчающий разработчикам написание сложных шейдеров на языке Cg.

Первый пункт наиболее притягивает внимание пользователей. Он зовет, манит и вот уже рука сама тянется к заветной ссылке "Download". Мы, как обычно, проанализируем новейший официальный драйвер на широком круге приложений и попробуем дать свою оценку.



Direct3D-тесты:
  • 3DMark 2001 SE b.330, общий результат
  • 3DMark 2001 SE b.330, игровые тесты
  • 3DMark 2001 SE b.330, некоторые синтетические тесты
  • Codecreatures Benchmark Pro
  • VillageMark v1.1, Benchmark 2
  • Comanche 4 Demo Benchmark v.1.0.1.18
  • Dungeon Siege Benchmark
  • Unreal Tournament 2003 Demo v.927
  • Unreal Tournament 2003 Demo v.927 анизотропная фильтрация
  • Unreal Tournament 2003 Demo v.927 антиалиасинг

OpenGL-тесты:

  • Star Wars JK II Jedi Outcast, анизотропная фильтрация 2х
  • Quake3 Arena v.1.31
  • Quake3 Arena v.1.31, анизотропная фильтрация
  • Serious Sam: The Second Encounter Demo v.1.05
  • Serious Sam: The Second Encounter Demo v.1.05, анизотропная фильтрация



Система:

Драйверы тестировались на следующем стенде:

Процессор

AMD Athlon Thunderbird 1400MHz

Материнская плата

Abit KT7A (KT133A)

Видеокарта

ASUS V8420 Deluxe 128MB (GeForce4 Ti4200 260core/550mem)

Оперативная память

256Mb PC133 SDRAM

Жесткий диск

IBM DTLA 305020

Операционная система

Windows XP Pro

Мы не спроста использовали в данном тестировании именно карту на последнем чипе компании NVIDIA GeForce4 Ti. Именно от таких карт и стоит ожидать обещанного "вплоть до 25%" прироста. Если его не будет там, то ожидать чего-то подобного, скажем, от карт на чипах GeForce2 MX, не стоит и подавно. Обратите внимание, что карта работает на повышенных частотах, близких к GeForce4 Ti 4400 (причем эти частоты для карты ASUS V8420 Deluxe стандартны, т.е. используются по умолчанию).



Direct3D-тесты

3DMark 2001 SE b.330

Общий результат

Начнем с общего, мало чего конкретно говорящего, но, тем не менее, очень популярного среди пользователей современных игровых видеокарт, результата:

Прирост хотя и не "25%", но есть. В разрешении 1024х768 - 8%, в 1280х1024 - 6% и в 1600х1200 - 5%. Конечно, без знания того, в каких именно игровых тестах увеличилась скорость, а в каких упала (что совсем не исключено!), эти "общие" цифры нам ни о чем не говорят. Напомню, что общий результат 3DMark 2001 расчитывается по формуле:

(Game1LowDetail+ Game2LowDetail+Game3LowDetail)x10+(Game1HighDetail+Game2HighDetail+Game3HighDetail+Game4)x20

Как видно, "синтетика" на результат не влияет вообще, а очень влияет поддержка картой пиксельных шейдеров (т.е. прошел ли тест Game4 Nature или нет).

3DMark 2001 SE b.330, игровые тесты

Максимальный прирост наблюдается в тесте Nature, в разрешении 1024х768 и превосходит все, даже самые оптимистичные ожидания - 56%! Неплохой прирост наблюдается и в тесте Dragothic (особенно LowDetail) - 13% в 1024х768. В остальных тестах значительных изменений не произошло, а некоторые из них, с новым драйвером даже стали работать медленнее.

Объяснить столь значительный прирост в тестах Nature и Dragothic можно либо заточкой нового драйвера конкретно под эти два теста (т.е. такой прирост будет только в этих тестах), либо значительной оптимизацией кода драйвера при работе с пиксельными и вершинными шейдерами, а так же механизма HSR и блока T&L (т.е. раньше эти возможности были реализованы крайне криво, что, правда, столь же крайне сомнительно). Тем не менее, проверим это на других тестах, использующих аналогичные возможности:

Контрольная проверка скорости выполнения шейдеров и блока T&L

Значительный прирост отмечен только в тесте High Polygon Count - 22%. Это может объяснять прирост в тесте Dragothic, также активно использующего блок T&L. Феноменальный прирост в тесте Nature не находит никакого разумного объяснения, кроме банальной "заточки" драйвера 40.41 именно под этот тест.

Попробуем поискать аналогичный прирост в другом тесте, Codecreatures Benchmark Pro, так же активно использующем как пиксельные, так и вершинные шейдеры:

Codecreatures Benchmark Pro

Тест состоит из восьми сцен, сгруппированных таким образом, что первые четыре (Grass Section) зависят от скорости исполнения вершинных шейдеров (описывают анимацию травы и т.п.). Следующие четыре (Water Section) используют пиксельные и вершинные шейдеры одновременно (в кадре появляется озеро). Отмечен примерно равный прирост во всех тестах - 8%, что совсем не похоже на 56%, которые мы наблюдали в 3DMark 2001 Nature (т.е., вероятно, драйвер просто "заточили" именно под этот тест). Тем не менее, меньший, но тоже заметный прирост в тесте Codecreatures позволяет предполагать, что NVIDIA все же немного улучшила работу драйвера с пиксельными и вершинными шейдерами и прирост может быть и не только в Nature (хотя, конечно, NV могла заточить драйвер и под тест Codecreatures ) Осталось проконтролировать эффективность механизма HSR (им также можно было бы объяснить прирост в тесте Dragothic).

VillageMark

Тест разработан Imagination Technologies для демонстрации преимуществ тайловой архитектуры их же чипа Kyro. Написан тест под Direct3D и позволяет не менее успешно рассматривать на его примере и работу других карт.

Этот 1% преимущества можно отнести и к погрешности измерения, а, следовательно, преимущество в Dragothic объясняется явно не оптимизацией механизма HSR, а либо улучшенной работой блока T&L (помните преимущество High Polygon Count?), либо все той же заточкой драйвера именно под этот тест. Ниже мы рассмотрим игры, использующие, в том числе, и блок T&L карты, выяснив этот вопрос до конца.

Comanche 4 Demo Benchmark

Тест чрезвычайно процессорозависим. Скорость лимитировалась Athlon 1400MHz во всех из представленных разрешений. Ранее мы наблюдали в этом тесте уверенное равенство всех версий драйверов именно по этой причине. Сейчас же, новый драйвер NVIDIA не смог показать производительность, хотя бы равную старому, не иначе как по причине своей большей "кривизны" - проиграв до 6%. С некоторой опаской переходим к следующему игровому тесту:

Dungeon Siege Benchmark

Тест может быть запущен как в режиме T&L Software, так и Hardware. Нам интересно поискать оптимизацию последнего режима в новом драйвере - помните, так уверенно и не объясненное преимущество в 3DMark 2001, в тестах "High Polygon Count" и "Game2 Dragothic"?

Присмотритесь внимательно к результатам. В режиме Software T&L, Detonator 40.41 немного проигрывает 30.82 (до 3%), в режиме Hardware T&L он уже выигрывает до 19%. Примерно такой прирост мы видели и в тестах High Polygon Count и Dragothic. Возможно, NVIDIA действительно несколько оптимизировала работу своего блока T&L. По крайней мере, это преимущество пока представляется более весомым, чем "56% прироста" в Nature, при отсутствии такого преимущества в сходных тестах.

Unreal Tournament 2003 Demo

На примере этой … почти игры, мы начнем сравнение скоростей таких важных функций, как анизотропная фильтрация и антиалиасинг, которых так же могла коснуться оптимизация по скорости.

Unreal Tournament 2003 Demo анизотропная фильтрация

Отсутствие каких-либо заметных изменений в этой игре даже несколько озадачивает. Небольшое (менее 2%) преимущество Detonator 40.41 в разрешении 1600х1200 при использовании только трилинейной фильтрации - это несерьезно. Быть может, Epic так тщательно оптимизировал игру под чипы NVIDIA, что последней, для оптимизации уже простора не осталось? Мы видим также, что анизотропная фильтрация в D3D у NVIDIA все еще топчется на месте, хотя простор для оптимизации есть, о чем мы говорили в прошлом обзоре.

Unreal Tournament 2003 Demo антиалиасинг:

Режимы Quincunx и 2x, с новым драйвером, заработали быстрее на 4% … возможно, это преимущество.

OpenGL-тесты

Star Wars JK II Jedi Outcast, анизотропная фильтрация 2х

Мы тестировали Jedi Outcast на максимальных настройках качества, доступных из меню игры, которые включают анизотропию Level 2. Игра сильно зависит от мощности центрального процессора (по крайней мере, демка jk2ffa), поэтому лишь в сверхвысоком разрешении мы заметили влияние карты и драйвера. Detonator 40.41 оказался быстрее предшественника, но не более чем на 6%.

Quake3 Arena

По ряду тестов можно сказать, что новый драйвер стал работать чуть быстрее предшественника в обычных режимах (до 8% в 1600х1200), однако при активации анизотропии это преимущество теряется и уже нельзя уверенно утверждать, какой из драйверов быстрее. Почти во всех тестах с анизотропной фильтрацией, скорость разнится в пределах погрешности измерений.

Serious Sam: The Second Encounter Demo

Ситуация в Serious Sam SE немного иная. Небольшое преимущество Detonator 40.41, с активацией анизотропии уже не пропадает. По всем трем OpenGL-тестам, Detonator 40.41 показал скорость, немного превосходящую предшественника.

Проблемы

К сожалению, с драйвером Detonator 40.41 мы отметили целый ряд проблем:

1). В некоторых OpenGL-играх (Quake3, Jedi Outcast) были замечены проблемы с гаммой, изображение было довольно темным. Настройками гаммы, средствами самой игры, эту проблему решить не удалось. Однако попытка снять скрины, демонстрирующие этот недостаток, ни к чему не привела. При снятии скринов, коррекция гаммы выполнялась правильно, и картинка выходила точь-в-точь как снятая при использовании драйвера 30.82. С другой стороны, в игре Serious Sam: The Second Encounter и тесте Vulpine GLMark, также использующих OpenGL API, проблем с гаммой не отмечено. Гамма-коррекция в этих приложениях выполнялась нормально, т.е. точно так же, как драйвером 30.82.

2). FastWrite. У Detonator 40.41 отмечены некоторые проблемы с этой функцией. При ее активации, изображение в играх иногда "мерцало" (эффект был похож на срыв синхронизации монитора), чего очевидно не наблюдалось с драйвером 30.82. Тесты Detonator 40.41 мы проводили с отключенной данной функцией.

3). У драйвера 40.41 была отмечена некоторая нестабильность при многократном прогоне тестов 3DMark 2001 в режиме "batсh". Произвольный тест из серии иногда мог прерваться следующей ошибкой:


Но система не зависала, и серия тестов успешно продолжалась, несмотря на вылетевший один из них. Проблему эту удалось побороть банальным удалением (переименованием) файла nvsvc32.exe.

4). Отмечена некорректная работа функций панели настроек драйвера, в управлении форсированием анизотропной фильтрацией в Direct3D. После форсирования анизотропии, средствами драйвера, в любое значение и последующая попытка ее отключить (т.е., установка дефолтного "level 0" приводит именно к форсированию level 0 ("nearest point"), а не к "определяется приложением", как это было изначально. Грозит это, ни много, ни мало, отсутствием фильтрации текстур вообще (даже билинейной). Результатом чего будут текстуры, при приближении "распадающиеся на квадраты" (т.н. "эффект DOOM").

Фактически выходит, что в текущей реализации интерфейса форсирования анизотропии драйвера 40.41 NVIDIA, установка "level 0" имеет сразу два совершенно разных, но объединенных одним выбором, значения: - "выбирается приложением" (используется до того, как вы хотя бы один раз не форсируете анизотропию средствами панели управления драйвером) и "nearest point" (используется после того, как вы хотя бы один раз форсировали анизотропию и захотели ее отключить установкой, казалось бы, дефолтного "level 0"). Избавится от этой беды можно отключением анизотропии, но не ручной установкой "level 0", а нажатием кнопки "restore to default", либо ручной правкой реестра, либо управлением режимами анизотропии старым добрым RivaTuner .

Очевидным багом форсирования анизотропии через панель управления драйвера является также невозможность форсирования Level 8. Хотя, панель управления всем своим видом пытается показать, что может делать это, тем не менее, установка 8х равнозначна установке 4х. Объяснение этому очень странное и простое: - программисты NV никак не выучат значения ключей драйвера, отвечающих за каждый уровень форсирования анизотропии!

Вывод:

Мы не можем рекомендовать новый драйвер к установке, большинству пользователей видеокарт на чипах NVIDIA. Несмотря на некоторый прирост во многих 3D-приложениях, оптимизацию работы блока T&L и возможно скорости исполнения вершинных и пиксельных шейдеров, новейший драйвер имеет серьезную, и пока неразрешимую проблему с регулировкой гаммы в некоторых OpenGL играх, которую пока невозможно никоим образом обойти. Непотребное качество этих "некоторых" OpenGL игр способно свести на нет все преимущества новейшего драйвера по скорости. Мы ограничимся пока лишь рекомендациями, остановиться на драйвере 30.82 и подождать окончательной версии Detonator серии 40.х. Последний, возможно, будет лишен перечисленных недостатков 40.41, имеющего статус хотя и официальной, но "бета" версии.



Андрей Дерябин a.k.a. andser (andser@nvworld.ru)



"Мир NVIDIA" благодарит российское представительство ASUSTeK Computer Inc., за предоставленную на тестирование видеокарту.

Обсудить/дополнить в конференции