Автоматизация распараллеливания программ с блочным размещением данных
В статье рассмотрено несколько автоматизированных приемов ускорения программ. Ускорение до-
стигается за счет распараллеливания и оптимизации обращений к памяти. Оптимизация обращений к
оперативной памяти достигается за счет перехода к блочному коду и блочным размещениям массивов. В
случае распределенной памяти используются автоматизированные распределения массивов и распре-
деления массивов с перекрытиями. Автоматизация реализуется с помощью прагм языка Си в Оптими-
зирующей распараллеливающей системе. Приводятся результаты численных экспериментов для задач
линейной алгебры и математической физики. Некоторые демонстрационные функции этого конвертора
имеют удаленный доступ.
Авторы
Тэги
Тематические рубрики
Предметные рубрики
В этом же номере:
Резюме по документу**
Автоматизация
распараллеливания программ с блочным размещением данных // Сиб. журн.
вычисл. математики / РАН. <...> В статье рассмотрено несколько автоматизированных приемов ускорения программ. <...> Ускорение достигается
за счет распараллеливания и оптимизации обращений к памяти. <...> Оптимизация обращений к
оперативной памяти достигается за счет перехода к блочному коду и блочным размещениям массивов. <...> В случае распределенной памяти используются автоматизированные распределения массивов и распределения
массивов с перекрытиями. <...> Автоматизация реализуется с помощью прагм языка Си в Оптимизирующей
распараллеливающей системе. <...> Ключевые слова: автоматическое распараллеливание, тайлинг, блочное распределение массивов,
оптимизация обращений к памяти, размещение с перекрытиями. <...> Введение
Работа посвящена автоматизации блочных размещений массивов в оперативной и распределенной
памяти. <...> Такие размещения данных способствуют минимизации обращений
к оперативной памяти и минимизации межпроцессорных пересылок. <...> Разрабатываемые
методики реализуются в оптимизирующей распараллеливающей системе (ОРС) Южного
федерального университета [10]. <...> Разбиение пространства итераций методом
пирамид [5, 6] предназначено для распределения вычислений между процессорами без
синхронизаций и пересылок данных в случае распределенной памяти. <...> Для распределенной памяти эти обращения
дольше арифметических операций почти на два порядка [20]. <...> Ускорение программ за счет
параллельного выполнения или за счет использования кэш-памяти могут вступать в
конфликт. <...> В работе рассмотрены три оптимизирующих приема для ускорения программ: блочное
размещение массивов в оперативной памяти, блочно-аффинные размещения массивов <...> Для получения такого результата
исходный алгоритм часто заменяют
эквивалентным ему блочным алгоритмом. <...> Многоуровневая память
вычислениям может быть увеличен,
если массивы размещать в оперативной
памяти не стандартными <...>
** - вычисляется автоматически, возможны погрешности
Похожие документы: