Архитектура современных ЭВМ параллельные вычисления Уровни параллелизма




НазваниеАрхитектура современных ЭВМ параллельные вычисления Уровни параллелизма
Дата конвертации07.02.2013
Размер445 b.
ТипПрезентации


АРХИТЕКТУРА СОВРЕМЕННЫХ ЭВМ Параллельные вычисления


Уровни параллелизма

  • В процессоре

    • Конвейризация
    • Суперскалярность
    • Удлинение длины команд
  • Дополнительные специализированные процессоры

  • Многоядерность

  • Многопроцессорность (Сильносвязанный параллелизм)

  • Кластеры (Слабосвязанный параллелизм)



Архитектуры параллельных компьютеров

(a) На чипе (b) Сопроцессор (c)Мультипроцессор

(d) Мультикомпьютер (e) Грид

Параллелизм на уровне команд

(a) Конвейер (b) Посл-ть VLIW инструкций

(c) Поток команд с отмеченными связками

TriMedia VLIW команда

Типичная команда TriMedia.

Функциональные блоки

  • Операции с константами (5)

  • АЛУ целочисленных операций (5)

  • Сдвиги (2)

  • Загрузка и сохранение из памяти (2)

  • Умножение целых и вещественных чисел (2)

  • АЛУ операций с плавающей точкой (2)

  • Сравнение чисел с плавающей точкой (1)

  • Извлечение квадратного корня (1)

  • Ветвления (3)

  • АЛУ ЦОС (2)

  • Умножитель для ЦОС (2)



Внутрипроцессорная многопоточность (1)

(a) – (c) Три потока. Пустые квадраты означают простой в ожидании данных из памяти (d) Мелкомодульная многопоточность

(e) Крупномодульная многопоточность

Внутрипроцессорная многопоточность (2)

Многопоточность в сдвоенном процессоре

(a) Мелкомодульная многопоточность

(b) Крупномодульная многопоточность

(c) Синхронная многопоточность

Варианты повышения производительности

  • Повышение тактовой частоты

  • Размещение на одной микросхеме двух процессоров

  • Введение новых функциональных блоков

  • Удлинение конвейера

  • Использование многопоточности



Гомогенные однокристальные микропроцессоры

Однокристальные мультипроцессоры.

(a) Два конвейера (b) Два ядра

Гетерогенные однокристальные мультипроцессоры



Архитектура CoreConnect

An example of the IBM CoreConnect architecture.

Мультипроцессоры

(a) Мультипроцессор с 16 ЦПУ, разделяющих общую память

(b) Изображение, разбивается на 16 частей, каждое обрабатывается своим ЦПУ

Мультикомпьютеры (1)



Мультикомпьютеры (2)



Классификация вычислительных систем

  • Систематика Флинна (Flynn)

    • Классификация по способам взаимодействия последовательностей (потоков) выполняемых команд и обрабатываемых данных:
    • SISD (Single Instruction, Single Data)
    • SIMD (Single Instruction, Multiple Data)
    • MISD (Multiple Instruction, Single Data)
    • MIMD (Multiple Instruction, Multiple Data)


Классификация вычислительных систем

  • Детализация систематики Флинна…

    • Дальнейшее разделение типов многопроцессорных систем основывается на используемых способах организации оперативной памяти,
    • Позволяет различать два важных типа многопроцессорных систем:
    • multiprocessors (мультипроцессоры или системы с общей разделяемой памятью),
    • multicomputers (мультикомпьютеры или системы с распределенной памятью).


Классификация вычислительных систем



Классификация вычислительных систем

  • Мультипроцессоры с использованием единой общей памяти (shared memory)…

    • Обеспечивается однородный доступ к памяти (uniform memory access or UMA),
    • Являются основой для построения:
    • векторных параллельных процессоров (parallel vector processor or PVP). Примеры: Cray T90,
    • симметричных мультипроцессоров (symmetric multiprocessor or SMP). Примеры: IBM eServer, Sun StarFire, HP Superdome, SGI Origin.


Классификация вычислительных систем

  • Мультипроцессоры с использованием единой общей памяти…



Классификация вычислительных систем

  • Мультипроцессоры с использованием физически распределенной памяти (distributed shared memory or DSM):

    • Неоднородный доступ к памяти (non-uniform memory access or NUMA),
    • Среди систем такого типа выделяют:
    • cache-only memory architecture or COMA (системы KSR-1 и DDM),
    • cache-coherent NUMA or CC-NUMA (системы SGI Origin 2000, Sun HPC 10000, IBM/Sequent NUMA-Q 2000),
    • non-cache coherent NUMA or NCC-NUMA (система Cray T3E).


Классификация вычислительных систем

  • Мультипроцессоры с использованием физически распределенной памяти…



Мультикомпьютеры…

  • Мультикомпьютеры…

    • Не обеспечивают общий доступ ко всей имеющейся в системах памяти (no-remote memory access or NORMA),
    • Каждый процессор системы может использовать только свою локальную память


Кластеры

  • Преимущества:

    • Могут быть образованы на базе уже существующих у потребителей отдельных компьютеров, либо же сконструированы из типовых компьютерных элементов;
    • Повышение вычислительной мощности отдельных процессоров позволяет строить кластеры из сравнительно небольшого количества отдельных компьютеров (lowly parallel processing),
    • Для параллельного выполнения в алгоритмах достаточно выделять только крупные независимые части расчетов (coarse granularity).


Кластеры

  • Недостатки:

    • Организация взаимодействия вычислительных узлов кластера при помощи передачи сообщений обычно приводит к значительным временным задержкам
    • Дополнительные ограничения на тип разрабатываемых параллельных алгоритмов и программ (низкая интенсивность потоков передачи данных)




Классификация Флинна





















Классификация Хокни



Классификация Хокни



Классификация Хокни



Классификация Хокни















Примеров подобных переключателей можно привести очень много. Так, все матричные процессоры имеют переключатель типа 1-n для связи единственного процессора команд со всеми процессорами данных. В компьютерах семейства Connection Machine каждый процессор данных имеет свою локальную память, следовательно, связь будет описываться как n-n. В тоже время, каждый процессор команд может связаться с любым другим процессором, поэтому данная связь будет описана как n × n.

Примеров подобных переключателей можно привести очень много. Так, все матричные процессоры имеют переключатель типа 1-n для связи единственного процессора команд со всеми процессорами данных. В компьютерах семейства Connection Machine каждый процессор данных имеет свою локальную память, следовательно, связь будет описываться как n-n. В тоже время, каждый процессор команд может связаться с любым другим процессором, поэтому данная связь будет описана как n × n.

Классификация Д.Скилликорна состоит из двух уровней. На первом уровне она проводится на основе восьми характеристик:

Классификация Д.Скилликорна состоит из двух уровней. На первом уровне она проводится на основе восьми характеристик:
  • количество процессоров команд (IP);

  • число запоминающих устройств (модулей памяти) команд (IM);

  • тип переключателя между IP и IM;

  • количество процессоров данных (DP);

  • число запоминающих устройств (модулей памяти) данных (DM);

  • тип переключателя между DP и DM;

  • тип переключателя между IP и DP;

  • тип переключателя между DP и DP.













































Классификация Шнайдера



Классификация Шнайдера



Классификация Шнайдера













Похожие:

Архитектура современных ЭВМ параллельные вычисления Уровни параллелизма iconWww parallel ru Параллельные вычисления Архитектура компьютеров
Московский государственный университет им. М. В. Ломоносова Институт вычислительной математики ран
Архитектура современных ЭВМ параллельные вычисления Уровни параллелизма iconАрхитектура ЭВМ виды памяти информатика Архитектура ЭВМ
Медленная по сравнению с оперативной; в порядке возрастания скоростичтения/записи информации, устройства внешней памяти располагаются...
Архитектура современных ЭВМ параллельные вычисления Уровни параллелизма iconВведение в параллельные вычисления. Технология программирования mpi (день шестой)
Введение в параллельные вычисления. Технология программирования mpi (день шестой) Антонов Александр Сергеевич, к ф м н., н с лаборатории...
Архитектура современных ЭВМ параллельные вычисления Уровни параллелизма iconВведение в параллельные вычисления. Технология программирования mpi (день пятый)
Введение в параллельные вычисления. Технология программирования mpi (день пятый) Антонов Александр Сергеевич, к ф м н., н с лаборатории...
Архитектура современных ЭВМ параллельные вычисления Уровни параллелизма iconВведение в параллельные вычисления. Технология программирования mpi (день первый)
Введение в параллельные вычисления. Технология программирования mpi (день первый) Антонов Александр Сергеевич, к ф м н., н с лаборатории...
Архитектура современных ЭВМ параллельные вычисления Уровни параллелизма iconПонятие архитектуры ЭВМ архитектура ЭВМ как распределение функций, реализуемых системой, между её уровнями
Архитектура ЭВМ как распределение функций, реализуемых системой, между её уровнями
Архитектура современных ЭВМ параллельные вычисления Уровни параллелизма iconЛекция 09: Параллельные вычисления (2)

Архитектура современных ЭВМ параллельные вычисления Уровни параллелизма iconПрименение кластерных вычислений в сумгу параллельные вычисления
Параллельные программы могут физически исполняться либо последовательно на единственном процессоре (псевдопараллелизм, «многозадачная»...
Архитектура современных ЭВМ параллельные вычисления Уровни параллелизма iconОпределенный интеграл и некоторые методы приближенного вычисления определенного интеграла с помощью ЭВМ
И некоторые методы приближенного вычисления определенного интеграла с помощью ЭВМ
Архитектура современных ЭВМ параллельные вычисления Уровни параллелизма iconЛекция 12: Практические вопросы параллельных вычислений
Архитектура современных ЭВМ лекция 12: Практические вопросы параллельных вычислений
Разместите кнопку на своём сайте:
dok.opredelim.com


База данных защищена авторским правом ©dok.opredelim.com 2015
обратиться к администрации
dok.opredelim.com
Главная страница