Nvidia Tesla

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
Графический процессор Nvidia Tesla A100

Nvidia Tesla — название семейства вычислительных систем NVIDIA на основе графических процессоров с архитектурой CUDA, которые могут быть использованы для научных и технических вычислений общего назначения. Tesla не может полностью заменить обычный универсальный процессор, но позволяет использовать вычислительный ресурс множества своих ядер для решения определенного круга ресурсоёмких задач (вести параллельную обработку данных). Примерами таких задач могут служить симуляция свёртывания молекул белка, секвенирование ДНК, моделирование погоды, анализ финансового риска и т. п.

Системы Tesla впервые появились на рынке с выходом графического чипа NVIDIA восьмого поколения — G80. Tesla строится на базе обычных графических процессоров, но, в отличие от видеоускорителей, не имеет средств вывода изображения на дисплей. Являясь своего рода сопроцессором, Tesla может использоваться для создания вычислительных систем на базе персональных компьютеров, а также в составе серверов и вычислительных кластеров.

Предлагая свой продукт для рынка высокопроизводительных кластеров, NVIDIA заявляет, что преимуществом гетерогенных вычислительных систем с Tesla является большая энергоэффективность и меньшая стоимость (как недостаток можно рассматривать меньшую универсальность).

Спецификации и конфигурации

[править | править код]

Модели Tesla 2007 года на базе GPU G80 (единственная группа карт без поддержки операций над 64-битными числами с плавающей точкой):

  • Tesla C870 — карта для рабочих станции (1 GPU)
  • Tesla D870 — приставной суперкомпьютер (2 GPU)
  • Tesla S870 — сервер (4 GPU)

Модели Tesla на базе GT200 (2008—2009 год):

  • Tesla C1060 — карта для рабочих станции (1 GPU)
  • Tesla S1070 — сервер (4 GPU)
  • Tesla S1075 — сервер (4 GPU)
  • Quadro Plex 2200 D2 (2 GPU)
  • Quadro Plex 2200 S4 (4 GPU)

Модели Tesla на базе GF100 и GF110 (2011 год):

  • Tesla C2050, M2050 — карта для рабочих станции (1 GPU)
  • Tesla C2070, C2075, M2070 — карта для рабочих станции (1 GPU)
  • Tesla M2090 — карта на основе GF110
  • Tesla S2050, S2070 — сервер (4 GPU)

На базе архитектуры Kepler предлагаются модели[1] 2012—2014 годов:

  • Tesla K10 (2× GK104)
  • Tesla K20, K20x (1× GK110)
  • Tesla K40 (1× GK110B)
  • Tesla K80 (2× GK210)

В 2015 году были представлены модели на базе микроархитектуры Maxwell:

  • M4 (1× GM206)
  • M6 (1× GM204)
  • M10 (4× GM107)
  • M40 (1× GM200)
  • M60 (2× GM204)

Чипы Pascal служили основой для карт 2016—2017 годов[2]:

  • P4 (1× GP104), PCIe
  • P6 (1× GP104), MXM
  • P40 (1× GP102), PCIe
  • P100 (1× GP100), NVLink
  • P100 (1× GP100, 16 или 12 ГБ ОЗУ), PCIe

В 2017 году появилась модель на базе Volta — Tesla V100, в виде PCIe и NVLink карт[2].

В 2018 году представлена карта Tesla T4 на базе Turing[2].

Описание Модель Количество GPU Частота ядра, МГц Шейдерные процессоры Память Теоретическая производительность, гигафлопс[3] Вычислительные способности [4] TDP, Вт Примечания/формфактор
Количество Частота, МГц Пропускная способность, ГБ/с Стандарт видеопамяти Шина видеопамяти, бит Объём видеопамяти, МБ Частота (эффективная), МГц Одинарная точность, всего (MUL+ADD+SF) Одинарная точность, MAD (MUL+ADD) Двойная точность, FMA
Вычислительный модуль на основе GPU[5] C870 1 600 128 1350 76,8 GDDR3 384 1536 1600 518,4 345,6 0 1,0 170,9 АТХ видеокарта
Приставной суперкомпьютер[5] D870 2 600 2×128 (256) 1350 153,6 GDDR3 384 3072 1600 1036,8 691,2 0 1,0 Приставная система или в стойку
Вычислительный модуль на основе GPU[5] S870 4 600 4×128 (512) 1350 307,2 GDDR3 384 6144 1600 2073,6 1382,4 0 1,0 1U Rack
2-е поколение Tesla-процессоров[6] C1060 1 602 240 1300 102,4 GDDR3 512 4096 1600 933,12 622,08 77,76 1,3 187,8 ATX видеокарта
IEEE 754-2008 FMA
2-е поколение
Вычислительный модуль на основе GPU[7]
S1070 4 602 4×240 (960) 1440 409,6 GDDR3 512 16384 1600 4147,2 2764,8 345,6 1,3 Одноюнитовая стойка
IEEE 754—2008 FMA
3-е поколение
Tesla-процессор[8]
C2050 1 575 448 1150 144 GDDR5 384 3072[9] 3000 1288 1030,4[10] 515,2 2,0 238 Полноразмерная видеокарта
IEEE 754—2008 FMA
3-е поколение
Tesla-процессор[8]
C2070 1 575 448 1150 144 GDDR5 384 6144[9] 3000 1288 1030,4[10] 515,2 2,0 247 Полноразмерная видеокарта
IEEE 754—2008 FMA
M2050
Вычислительный модуль на основе GPU
M2050 1 575 448 1150 148,4 GDDR5 384 3072[10] 3092 1288 1030,4[10] 515,2 2,0 225 Вычислительный модуль
IEEE 754—2008 FMA
M2070/M2070Q[11]
Вычислительный модуль на основе GPU
M2070/M2070Q 1 575 448 1150 150,336 GDDR5 384 6144[10] 3132 1288 1030,4[10] 515,2 2,0 225 Вычислительный модуль
IEEE 754—2008 FMA
S2050 1U
Вычислительная система на основе GPU
S2050 4 575 4×448 (1792) 1150 4×148,4 (593,6) GDDR5 384 12288[10] 3092 5152 4121,6[10] 2060,8 2,0 900 1U Rack
IEEE 754—2008 FMA

Примечания

[править | править код]
  1. Источник. Дата обращения: 14 ноября 2012. Архивировано 27 января 2013 года.
  2. 1 2 3 NVIDIA Product Overview and Technical Brief. Дата обращения: 2 апреля 2008. Архивировано 18 марта 2015 года.
  3. Nvidia Announces Tesla 20 Series. Дата обращения: 21 апреля 2010. Архивировано из оригинала 21 мая 2010 года.
  4. Какие оборудование и программное обеспечение требуются для PhysX? Дата обращения: 21 апреля 2010. Архивировано 30 марта 2010 года.
  5. 1 2 3 Нет официальных данных; предполагается, что основаны на GeForce 8800 GTX.
  6. Нет официальных данных; предполагается, что основаны на GeForce GTX 280.
  7. Difference between Tesla S1070 and S1075. Дата обращения: 21 апреля 2010. Архивировано 26 февраля 2012 года.
  8. 1 2 Нет официальных данных; предполагается, что основаны на GeForce 400 Series.
  9. 1 2 С активированным ECC доступная для пользователя память составит 2,625 ГБ на GPU для C2050, S2050 и 5,25 ГБ на GPU для C2070.
  10. 1 2 3 4 5 6 7 8 GF100 выполняет новую соединенную инструкцию умножения-сложения FMA(D) (Fused Multiply-Add) для обоих 32-битных чисел одинарной точности с плавающей запятой и 64-битных чисел двойной точности с плавающей запятой (GT200 поддерживает инструкцию FMA только для чисел двойной точности). Разница между инструкциями FMA(D) и MAD (Multiply-Add) при выполнении операции вида A×B+C заключается в том, что FMA(D) не округляет результат произведения перед суммированием, что даёт более точный результат.
  11. NVidia Tesla M2050 & M2070/M2070Q Specs Online. Дата обращения: 31 октября 2010. Архивировано 17 августа 2020 года.