0
Найти на сайте: параметры поиска

 

 

кабель квсф

14 апреля 2019 - natribamakom

Чтобы скрыть латентность памяти, каждый потоковый процессор имеет анпа- ратно-поддерживаемые потоки. Каждая группа из 32 потоков называется варпом (warp). Варп является блоком диспетчеризации, и активные потоки в варпе, до 32, выполняются в параллельном режиме SIMD-способом. Но многопоточная система справляется с условиями, позволяя потокам расходиться по разным путям условных переходов. Когда потоки варпа идут по расходящимся путям, варп последовательно выполняет код по обоим маршрутам, делая неактивными некоторые потоки, что приводит к более медленному выполнению активных потоков. Как только условная часть завершится, оборудование снова объединяет потоки в полностью активный варп. Для достижения наивысшей производительности все 32 потока варпа нуждаются в совместном параллельном выполнении. Похожим образом оборудование также следит за течением адресов, поступающих от разных потоков, чтобы попытаться объединить отдельные запросы в меньшее количество передач более крупных блоков памяти для увеличения производительности при работе с памятью. Хотите приобрести квсф? Возможно здесь кабель квсф вы сможете найти то, что ищете.

На рис. 6.5 продемонстрирована совокупность всех этих свойств и дано сравнение мультипроцессора Tesla с ядром Sun UltraSPARC Т2, которое рассматривается в разделах 7.5 и 7.11. В обоих реализована аппаратная многопоточность на основе диспетчеризации потоков по времени, показанная на вертикальной оси. Каждый микропроцессор Tesla состоит из восьми потоковых процессоров, которые выполняют восемь параллельных потоков за тактовый цикл, что показано на горизонтальной оси. Как ранее уже упоминалось, наивысшая производительность достигается, когда все 32 принадлежащих варпу потока выполняются вместе в SIMD-подобной манере, что в архитектуре Tesla называется «одна инструкция - несколько потоков (single-instruction multiple-thread, SIMT). SIMT в динамическом режиме обнаруживает, какие принадлежащие варпу потоки могут выполнять вместе одну и ту же инструкцию и какие независимые потоки будут простаивать в данном цикле. Ядро Т2 содержит только один многопоточный процессор. В каждом цикле он выполняет одну инструкцию для одного потока.

Комментарии (0)

Нет комментариев. Ваш будет первым!