Настройки тестов
Первые два теста — традиционные бенчмарки, предназначенные для тестирования производительности системы в целом c использованием популярных офисных приложений. Результаты этих тестов определяются не только процессором, но и пропускной способностью памяти, а также производительностью дисковой подсистемы компьютера. При использовании данных тестов устанавливалось разрешение экрана 1024 х 768 точек при 32-битной глубине цвета.
Приложение ABBYY FineReader 8.0 использовалось для распознавания многостраничного pdf-документа, в процессе которого измерялось время выполнения задачи. Данный тест является многопоточным и оптимизирован под двухъядерные процессоры.
В тесте WinRAR 3.0 использовалась максимальная степень сжатия с размером словаря 4096 Кбайт. При этом отметим, что сам по себе тест является однопоточным, поэтому ожидать, что двухъядерные процессоры получат в этом тесте преимущество, не приходится.
Ещё одна группа тестов была ориентирована на измерение производительности процессора при обработке аудио- и видеоданных. Для конвертации аудиоданных из формата wav в формат mp3 использовались кодеки Lame 4.0 alpha 14 и iTunes 5.0.0.1.4. Кроме того, для обработки mp3-файла использовалась утилита MP3Gain v.1.2.5.
Отметим, что кодек iTunes 5.0.1.4 эффективно раскладывает аудиоданные на два потока и использует два ядра процессора. В то же время, использование технологии Hyper-Threading в процессоре серии Extreme Edition не приводит к распараллеливанию потока на четыре логических ядра процессора.
Отметим, что при конвертировании аудиофайла с использованием кодека iTunes 5.0.1.4 использовался файл размером 701,5 Мбайт (1411 kbps, 44 кГц, Stereo, 16 бит), а битрейт составлял 160 kbps.
При использовании для конвертирования кодека Lame 4.0 alpha 14 использовался тот же самый wav-файл, причём запуск процесса конвертирования производился из командной строки. При этом использовалась команда запуска с параметром -nores (команда c:\lame.exe –nores –mt mixTest.wav), что позволяет задействовать два ядра процессора.
В кодеке Lame 4. 0 alpha 14 скорость потока составляла 128 kbps, а скорость сэмплирования – 44 кГц. Для конвертирования видеофайла из формата MPEG-2 (расширение файла mpg) в формат DivX (контейнер avi) использовалась утилита XMPEG 5.2 с кодеком DivX 6.0. Размер исходного видеофайлафайла (в формате MPEG-2) составлял 110 Мбайт (разрешение 720 х 480), а размер сжатого файла в формате DivX – 88,8 Мбайт. При этом звук не подлежал компрессии (48 кГц, Stereo, 128 kbps), а скорость видеопотока составляла 6147 kbps. Отметим, что утилита XMPEG 5.2 с использованием кодека DivX 6.0 прекрасно раскладывает поток данных на два ядра процессора, равномерно загружая их. В то же время, разложение на четыре потока (с учётом технологии Hyper-Threading) малоэффективно. Для конвертирования avi-видеофайла в формат m2v использовалась утилита TMPGEnc 2.5.24. При этом устанавливались настройки DVD NTSC (4:3, 525 lines) (MPEG-2, 720x480, битрейт 7995 kbps). В итоге исходный видеофайл, который был создан кодеком DivX MPEG-4 Low Motion, с размером 51,9 Мбайт конвертировался в m2v файл размером 222 Мбайт и wav-файл размером 42,7 Мбайт. Отметим, что процесс конвертирования с помощью утилиты TMPGEnc 2.5.24 оптимизирован под двухъядерные процессоры. В процессе конвертирования в равной степени загружаются оба ядра процессора. Добавление технологии Hyper-Threading к каждому ядру процессора не способствует росту эффективности конвертирования. Для конвертирования того же avi-файла (кодек DivX MPEG-4 Low Motion) в формат wmv использовались программы Windows Media Encoder 9.0 (Advanced Profile). При использовании конвертора Windows Media Encoder 9.0 (Advanced Profile) размер результирующего файла составлял 7,82 Мбайт. Следующий тест – это популярное 3D-приложение Discreet 3d Studio Max 7.0, которое использовалось только для рендеринга трёхмерных сцен, поскольку именно в этом режиме на центральный процессор системы ложится наибольшая нагрузка. Во всех тестах, кроме пакта VeriTest Business Winstone 2004 и VeriTest Multimedia Content Creation Winstone 2004, измеряемой характеристикой являлось время выполнения задачи.
Поэтому чем меньше оказывалось время, то есть результат теста, тем лучше. Кроме того, для того, чтобы оценить преимущества двухъядерных процессоров при многопоточной обработке данных одновременно комбинировалось несколько тестов, запускавшихся одновременно. Так, процесс конвертирования формата wav в mp3 кодеком lame 4.0 мы сочетали с одновременной обработкой mp3-файла утилитой MP3Gain v.1.2.5. Для этого сначала запускался более длительный процесс конвертирования, и на фоне выполнения этой задачи запускалась более короткая задача обработки mp3-файла. В этом случае время выполнения задачи рассчитывалось как время выполнения более короткой задачи, то есть обработки mp3-файла. Аналогично процесс конвертирования одного видеофайла из формата mpg в DivX (XMPEG 5.2с кодеком DivX 6.0) сочетался с процессом конвертирования другого видеофайла из формата DivX в формат wmv (Windows Media Encoder 9.0). В этом случае фоновым процессом являлся более длительный процесс конвертирования DivX в wmv, а за результат теста принималось время конвертирования формата mpg в формат DivX. Результаты сравнительного тестирования процессоров представлены в таблице.
Тесты | Intel Pentium Extreme Edition 840 | Intel Pentium D 840 | Intel Pentium D 830 | Intel Pentium D 820 |
Business Winstone | 22.56±0.21 | 22.64±0.21 | 22.08±0.32 | 21.06±0.14 |
Mulitasking Test | 2.81±0.02 | 2.95±0.10 | 2.89±0.09 | 2.80±0.07 |
Multimedia Content Creation | 31.90±0.09 | 31.92±0.10 | 30.38±0.06 | 28.58±0.14 |
iTunes 5.0.01.4 (wav->mp3) | 133.60±7.38 | 119.50±0.51 | 126.40±0.68 | 134.60±0.68 |
lame 4.0 a14 (wav->mp3) 128 kbps | 163.40±1.11 | 164.00±1.52 | 174.60±0.68 | 187.00±0.00 |
MP3Gain v.1.2.5 | 72.20±0.56 | 71.80±0.56 | 77.00±0.88 | 83.00±0.88 |
WinRAR 3.0 | 162.40±6.51 | 165.60±1.11 | 170.60±1.42 | 175.60±1.88 |
WinRAR 3.0 (два потока) | 226.20±11.3 | 210.20±4.16 | 213.60±0.68 | 217.40±1.42 |
TMPGEnc 2.5.24 (avi -> m2v) | 238.86±6.68 | 221.20±1.36 | 233.80±2.54 | 250.40±1.88 |
XMPEG 5.2 (кодек DivX 6.0) (MPEG-2->DivX) | 140.60±1.42 | 137.80±2.39 | 146.00±1.96 | 155.00±1.52 |
Windows Media Encoder 9 (avi -> wmv) | 122.20±1.04 | 142.80±2.54 | 153.20±1.84 | 160.60±1.42 |
Adobe After Effects 6.5, с | 417.60±4.35 | 414.00±1.76 | 436.60±1.88 | 464.20±2.04 |
ABBYY FineReader 8.0, с | 111.00±1.52 | 110.80±1.04 | 117.00±1.52 | 125.80±1.04 |
3d Studio Max 7.0 Rendering | 250.59±1.27 | 301.08±0.61 | 320.60±0.54 | 343.26±0.58 |
Все тесты запускались как минимум по пять раз. Для некоторых тестов число прогонов увеличивалось до десяти раз, что позволило обеспечить требуемую точность измерения. В качестве результата тестирования использовалось среднее по выборке от всех прогонов, то есть: Кроме того, рассчитывалась дисперсия выборки среднего и доверительный интервал измерений с коэффициентом надёжности ? = 95%: Кроме того, рассчитывалась и относительная погрешность измерений: Не вникая в подробности этих математических премудростей, отметим лишь, что истинное значение любой измеряемой величины на практике можно определить лишь с заданной степенью точности, поскольку истинное значение определяется лишь при бесконечном числе измерений, что теоретически невозможно реализовать. Поэтому истинное значение измеряемой величины заменяется на некоторое усреднённое значение (среднее по выборке). Сам же доверительный интервал – это интервал, в котором с вероятностью, равной коэффициенту надёжности, будет находиться истинное значение измеряемой величины. Понятно, что чем больше проводится измерений, тем меньше будет и доверительный интервал. Особенно подчеркнём, что доверительный интервал – это не интервал, в который попадает с заданной вероятностью каждое отдельное измерение. То есть, если после определения доверительного интервала произвести измерение искомой величины ещё раз, то совсем не обязательно, что её значение попадёт в доверительный интервал. Доверительный интервал определяет лишь диапазон возможных значений истинного значения измеряемой величины. В наших тестах количество прогонов (измерений) выбиралось исходя из того, чтобы доверительные интервалы с коэффициентом надёжности 95% для одних и тех же измеряемых величин, но для разных процессоров, по возможности бы не перекрывались, а относительная погрешность измерения была бы менее 5%.