Interested Article - ShenWei

ShenWei ( кит. 申威 ) — семейство микропроцессоров , разработанных китайской компанией ( кит. 江南计算技术研究所 ) из Уси .

Гибридный микропроцессор ShenWei SW26010

Летом 2016 года была опубликована информация о процессорах ShenWei SW26010 , на базе которых был создан наиболее производительный суперкомпьютер в мире (по рейтингу TOP500 ), Sunway TaihuLight . Каждый процессор содержит 4 управляющих RISC-ядра и 256 вычислительных RISC-ядер общего назначения в 4 группах по 64 ядра .

Микропроцессор ShenWei SW1600

ShenWei SW1600 — третье поколение процессоров компании . Работая на тактовой частоте 1,1 ГГц, он достигает производительности на операциях с плавающей запятой в 140,8 Гфлопс . Содержит 16 ядер архитектуры RISC . Создан в рамках совместного проекта Jiāngnán Computing Research Lab и «High Performance Server & Storage Technologies» ( кит. 高效能服务器和存储技术 ). Изготовлен по технологии 65 нм. Производится в Шанхае , предположительно, компанией SMIC , .

Характеристики ядра SW1600:

  • суперскалярный процессор с исполнением до 4 инструкций за такт;
  • исполнительные устройства: два целочисленных, два для обработки чисел с плавающей запятой;
  • целочисленный конвейер имеет 7 стадий, а конвейер чисел с плавающей запятой — 10 стадий;
  • виртуальная адресация 43-битная, физическая адресация 40-битная;
    • Поддерживается виртуальное адресное пространство размером до 8 ТБ, физическое — 1 ТБ;
  • кеш L1: 8 КБ для инструкций, 8 КБ для данных;
  • кеш L2: 96 КБ, универсальный;
  • 128-битная системная шина .

История процессоров ShenWei

Серия процессоров ShenWei разрабатывалась в основном для военных применений в КНР. Есть мнение, что оригинальная архитектура основывалась на некоторых идеях процессоров DEC Alpha . По другой версии, использовались некоторые идеи архитектуры SPARC .

ShenWei SW-1

  • первое поколение ShenWei, 2006 год;
  • кристалл содержит одно ядро;
  • тактовая частота — 900 МГц;
  • техпроцесс — 130 нм, SMIC .

ShenWei SW-2

  • второе поколение ShenWei, 2008 год;
  • кристалл содержит два ядра;
  • тактовая частота — 1,4 ГГц;
  • техпроцесс — 130 нм, SMIC;
  • тепловыделение — до 70-100 Вт.

ShenWei SW-3

  • третье поколение ShenWei, 2010 год;
  • 64-битная архитектура;
  • 16-ядерный чип ;
  • тактовая частота — 975—1200 МГц;
  • техпроцесс — 65 нм;
  • общая [ уточнить ] производительность чипа при вычислениях с плавающей запятой — 140,8 GFLOPS на частоте 1,1 ГГц;
    • производительность одного ядра — 8 операций над числами с плавающей запятой за 1 такт ;
  • контроллер оперативной памяти:
    • максимальный объем — 16 ГБ;
    • пиковая пропускная способность — 68 ГБ/с;
    • четыре канала;
    • 128-битный DDR3 .

Sunway SW26010

см. SW26010

  • Четвёртое поколение, 2016;
  • 64-битная архитектура;
  • тактовая частота — 1,45 ГГц;
  • 260-ядерный чип, состоящий из 4 кластеров, в каждом из которых размещаются по 64 «вычислительно-процессинговых элемента» (Compute-Processing Elements, CPE), расположенных в виде матрицы 8 на 8 элементов, и одного управляющего процессингового элемента» (Management Processing Element, MPE), который обеспечивает наблюдательные функции, соединённые между собой посредством ( )

Суперкомпьютер Sunway BlueLight MPP

Массово-параллельный суперкомпьютер Sunway BlueLight ( кит. 神威蓝光 ) полностью разработан в КНР и использует микропроцессоры SW1600 (SW-3). Является первым китайским суперкомпьютером с производительностью петафлопсного диапазона, изготовленным на базе разработанных в Китае микропроцессоров. Занимает 14 место в рейтинге TOP500 суперкомпьютеров в мире (ноябрь 2011) , 2 место в рейтинге Top100 суперкомпьютеров КНР 2011 года и 39 место в рейтинге (11/2011). Комплекс введен в строй в сентябре 2011 года и установлен в в Цзинане . Разработан в National Parallel Computer Engineering Technology Research Center ( кит. 国家并行计算机工程技术研究中心 ) и эксплуатируется Технологическим департаментом Программы 863 .

Состоит конструктивно из 9 стоек, 8704 процессоров ShenWei SW1600 (975 МГц ), сгруппированных в 34 суперузла (Super Nodes). Каждый суперузел состоит из 256 вычислительных узлов. В стойке — 4 суперузла. В каждом RackUnit установлено 4 процессорные платы, по 2 процессора на каждой.

Общий объём оперативной памяти 150 ТБ, внешней памяти 2 ПБ. Пиковая производительность при использовании 8575 процессоров на частоте 975 МГц составила 1,07016 Пфлопс, производительность на тесте LINPACK - 795,9 Тфлопс (эффективность 74,37 %). Энергопотребление 1074 кВт (1 МВт). Использует исключительно водяное охлаждение.

Сетевая подсистема построена на базе InfiniBand QDR, топология Fat tree . Используются оптические кабели и коммутаторы на 256 и 324 порта. Пропускная способность каждого соединения 80 Гбит/с, суммарная — 8,7 Тбит/с; латентность порядка 2 мкс.

Суперкомпьютер Sunway TaihuLight

SW26010 применяются в суперкомпьютере Sunway TaihuLight, который на ноябрь 2016 года занимал 1 место по производительности в рейтинге TOP500. В Sunway TaihuLight используется 40 960 процессоров SW26010, производительность в тесте LINPACK достигает 93,01 PFLOPS.

Примечания

  1. Jack Dongarra. (англ.) . — University of Tennessee, June 24, 2016. 10 ноября 2018 года.
  2. Hung-Sheng Tsao. . LaoTsao's Weblog (29 октября 2011). Дата обращения: 29 октября 2011. Архивировано из 2 сентября 2012 года.
  3. hswz. . bbs.lemote.com (4 мая 2009). Дата обращения: 31 октября 2011. Архивировано из 31 марта 2012 года.
  4. от 27 сентября 2016 на Wayback Machine page 42
  5. Andreas Stiller, 19 августа 2012 года. // TOP500 whispers, 2012-02-15: "Currently, 8 flops/clock/core – Sandy Bridge, Power7, SPARC, VIII8fx, Bluegene/Q, ShenWei "
  6. от 16 ноября 2011 на Wayback Machine TOP500 List — November 2011 (1-100)
  7. 洪钊峰. . it168 (27 октября 2011). Дата обращения: 30 октября 2011. Архивировано из 25 октября 2012 года.
  8. от 23 ноября 2011 на Wayback Machine The Green500 List — November 2011
  9. JOHN MARKOFF, The New York Times. « от 1 июля 2017 на Wayback Machine .» October 28, 2011. Retrieved November 7, 2011.
  10. Cade Metz, WIRED. « от 29 марта 2014 на Wayback Machine .» October 31, 2011. Retrieved November 7, 2011.
  11. . Дата обращения: 18 ноября 2011. Архивировано из 11 сентября 2012 года. 2011年中国高性能计算机性能TOP100排行榜
  12. . Дата обращения: 18 мая 2022. 12 мая 2022 года.
  13. . Дата обращения: 2 ноября 2011. 4 ноября 2011 года.
  14. xiongxuehui. . pconline (29 октября 2011). Дата обращения: 29 октября 2011. Архивировано из 14 мая 2012 года.

Ссылки

  • // 3DNews, 31.10.2011 (рус.)
  • с описанием микропроцессора SW1600 (кит.)
Источник —

Same as ShenWei