WWW.DOC.KNIGI-X.RU
БЕСПЛАТНАЯ  ИНТЕРНЕТ  БИБЛИОТЕКА - Различные документы
 

«Богачев Кирилл Юрьевич Москва, 2015г. Введение Аннотация Будет рассмотрена постановка задачи фильтрации и ее приложения, ...»

Эффективное решение задачи фильтрации вязкой

сжимаемой многофазной многокомпонентной

смеси на параллельных ЭВМ

(Подземная гидродинамика)

Богачев Кирилл Юрьевич

Москва, 2015г.

Введение

Аннотация

Будет рассмотрена постановка задачи фильтрации и ее приложения,

продемонстрированы основные проблемы при ее решении на параллельных

ЭВМ и возможные методы их преодоления. Будет приведен пример

успешной реализации.

Об авторе

Богачев К.Ю. – доктор физ.-мат. наук, доцент механико-математического факультета МГУ им. М.В. Ломоносова, технический директор ООО "Рок Флоу Динамикс", автор 5 монографий по параллельному программированию и численным методам, руководитель разработки гидродинамического симулятора tNavigator.

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Гидродинамическая модель Это набор данных, описанный на формализованном входном языке конкретной программы моделирования.

Прежде, чем стать моделью, на основании которой можно делать какие-то заключения (прогноз, оптимизацию), надо сделать так, чтобы рассчитанные данные хорошо аппроксимировали исторические.

Пример с прогнозом погоды: у нас есть модель погоды, мы в нее внесли все метеорологические данные за предыдущую неделю. Прежде, чем делать прогноз на завтра, мы по этой модели спрогнозируем погоду на сегодня и сравним с реальностью. Если есть расхождения, то надо править параметры модели, пересчитывать заново, опять сравнивать и т.д. Это и есть адаптация.



Инженер-гидродинамик делает большое количество расчетов, чтобы подобрать нужные параметры. Фактически он решает обратную задачу, в которой огромное количество неизвестных, ведь достоверно известны данные только в отдельных точках (скважинах), а нужны они в каждом блоке сетки.

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Откуда возникает модель Геологическая модель Исследования скважин (каротаж) Сейсмические исследования Результат: карты геометрические, пористости, проницаемости, положение и свойства разломов Свойства пласта и углеводородов в нем Лабораторные исследования керна Корреляции с аналогичными месторождениями Результат: кривые относительной фазовой проницаемости и PVT Данные добычи Режимы работы скважин (добыча, закачка, значения забойного давления и т.д.) Мероприятия на скважинах (пуски, остановы, ремонты, ГРП и т.д.) Результат: динамические свойства Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Основные соотношения Рассмотрим классическую изотермическую модель.

Выделяют три фазы и три или более компонент:

водная фаза (вода)— не смешивается с углеводородными фазами, состоит из одной компоненты – воды;

жидкая углеводородная фаза (нефть) — состоит из смеси углеводородных компонент, находящихся при данном давлении, температуре и концентрациях других компонент в жидком состоянии;

газообразная углеводородная фаза (газ) — состоит из смеси углеводородных компонент, находящихся при данном давлении, температуре и концентрациях других компонент в газообразном состоянии.

Рассматривают также двухфазные системы, получаемые отбрасыванием одной из фаз.

–  –  –

Здесь P = P (pP, N) – молярная плотность фазы P (известная функция).

В общем случае (т.н. композиционная модель) элементы xc,P вычисляются из решения нелинейного уравнения состояния.

–  –  –

и заданная функция mk (p) зависимости его от давления, учитывающая изменение фильтрационных свойств породы при ее сжатии.

Часто рассматривают диагональный тензор k в большинстве точек модели и полный тензор только в области проводящих трещин, например, возникших при гидроразрыве пласта.

При аппроксимации на сетке обычно размеры блока (элементарной ячейки) значительно отличаются по направлениям (обычно в направлении Z в 10... 100 раз меньше, чем по XY ). Это приходиться учитывать при аппроксимации тензора k, вводя в него анизотропию.

–  –  –

Эти соотношения задают систему с памятью (режим водонапорного горизонта зависит от всей предыдущей истории);

задают большое количество связей между точками пласта (например, для водоплавающей залежи к водонапорному горизонту может быть подключена вся подошва пласта и часть вышележащих участков через имеющиеся проводящие разломы).

Другие модели водонапорных горизонтов (Carter-Tracy) также приводят к подобным соотношениям.

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Система уравнений Постановке задачи фильтрации вязкой сжимаемой многофазной многокомпонентной смеси в пористой среде посвящено множество классических книг, ставших фактически учебниками, например (Aziz, Settari

– 1979, Chen, Huan, Ma – 2006) Ниже приведена стандартная трехфазная трехкомпонентная изотермическую модель черной нефти (black-oil) в главных переменных – молярных плотностях.

Система дифференциальных уравнений:

–  –  –

0.80 0.15 0.60 0.10 0.40 0.05 0.20 0.00 0.00 0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1

–  –  –

BCGStab или GMRES алгоритмы с предобуславливателями ILU (или ILU(1), ILUT) для решения системы линейных уравнений с несиметричной матрицей применение предобуславливателя на каждой итерации метода решения линейных уравнений

–  –  –

На сетках, ячейки которой являются квази-кубиками (6-ти вершинниками), далее используется метод конечных объемов. На сетках, ячейки которой являются тетраэдрами, далее используется метод конечных элементов.

–  –  –

Для метода конечных элементов используется его смешанно-гибридная вариация: вводятся пространство функций P1, кусочно-постоянных на блоке, и пространство функций P2, заданных на гранях блоков и удовлетворяющих определенным свойствам, связывающих P1 и P2. В (10) величины, определенные на блоке сетки, аппроксимируются в пространстве P1, а потоки i,j — в пространстве P2.

–  –  –

Если для симметричных матриц победитель среди итерационных методов известен, то для несимметричных матриц вопрос об оптимальном итерационном алгоритме открыт. В настоящее время в-основном применяются 2 алгоритма GMRES (Generalized Minimum Residual Method) — основан на минимизации невязки в пространстве Крылова BCGS (BiConjugate Gradient Stabilized) — основан на методе биортогонализации Ланцоша Для BCGS нет вычисляемой нормы, которую бы он минимизировал. Но практически он зачастую работает быстрее, чем GMRES.

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Предобуславливатели Для системы линейных уравнений Ax = b оказалось, что решение системы B1 Ax = B1 b может быть найдено значительно быстрее, если матрица матрица B похожа на матрицу A по спектральным свойствам матрица B легче обратима, чем B Хороший выбор матрицы B — предобуславливателя является основной проблемой при реализации любого численного алгоритма.

Заметим, что сами итерационные алгоритмы сводятся к вычислению умножения матрицы на вектор и скалярных произведений, и потому идеально распараллеливаются. Построение же большинства алгебраических предобуславливателей существенно последовательное.

Метод Якоби: B = diag(A) Неполное LU разложение: строится LU разложение матрицы разреженной матрицы A, оставляя только элементы в тех позициях A, где они были не равны 0.

Многостадийные предобуславливатели (например, CPR).

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Этапы построения модели Одним из наиболее сложных и трудоемких этапов работы с гидродинамической моделью является адаптация по истории разработки. Модель, не согласующаяся с историей, не может быть использована в качестве инструмента для принятия решений по дальнейшему освоению месторождения. Несмотря на доступность вычислительных ресурсов, задача адаптации модели до сих пор выполняется специалистами вручную, что приводит к огромным временным и финансовым затратам. Применение на высокопроизводительных вычислительных системах современных генетических алгоритмов для оптимизации способно не только кратно сократить время, затрачиваемое на этот этап, но и существенно повысить качество моделей за счет перебора большего количества вариантов и нахождения множества решений при одновременном сокращении стоимости построения модели.





При этом успешность применения оптимизационных алгоритмов все равно зависит от того, сколько времени идет расчет одного варианта.

–  –  –

Оценка остаточных запасов и их локализации.

На сегодняшний день большая часть крупных нефтяных месторождений России находится в поздней стадии разработки. Для поддержания уровня добычи повсеместно проводится уплотняющее бурение. Выбор кандидатов на бурение в лучшем производится на основе одной гидродинамической модели, настроенной на историю разработки. При этом зачастую новые скважины (стоимостью примерно 1-10 млн. долл.

США) дают неудовлетворительные показатели добычи. Как отмечалось выше, задача выявления остаточных запасов нефти не имеет единственного решения и требует вероятностного подхода. Определяя вероятность нахождения остаточных запасов на тех или иных участках за счет многовариантных расчетов гидродинамической модели на высокопроизводительных кластерах, можно существенно повысить эффективность разработки месторождений в поздней стадии за счет увеличения коэффициента нефтеизвлечения и снижения затрат на уплотняющее бурение.

–  –  –

Богачев К.Ю.

Решение задачи фильтрации на параллельных ЭВМ Факторы сложности модели Средний размер секторных и полномасштабных гидродинамических моделей неуклонно увеличивается из года в год, невзирая на нескончаемые жаркие дискуссии о пользе/вреде больших моделей:

50 – 300 тыс. активных блоков сетки — секторная,

РФ:

1 – 5 млн. активных блоков сетки — полномасштабная Ближний 1 – 2 млн. активных блоков сетки — секторная, Восток: 10 – 100 млн. активных блоков сетки — полномасштабная После обработки сейсмических данных возникает детальное описание пласта с высоким разрешением, где нашли свое отражение все выявленные геологические неоднородности (разломы разной природы и геометрии, выклинивания пластов и пр.). Соответствующая этому описанию расчетная сетка обычно слишком велика для настольных компьютеров и даже небольших серверов, поэтому традиционно применяют процедуру ремасштабирования сетки, которая понижает размерность, но приводит к частичной или полной потере информации о реальном геологическом строении пласта. С доступностью вычислительных ресурсов многие компании стремятся перейти к расчетам на исходной геологической сетке, что и ведет к росту размерности задачи.

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Факторы сложности модели Изменение времени прорыва газа в горизонтальную скважину при разном разрешении сетки (справа)

–  –  –

С увеличением разрешения гидродинамических сеток некоторые детали моделей (например трещины годроразрыва пласта, техногенные разрывы пласта на инжекторах, заколонные перетоки и т.д.) вылезают за границы одной ячейки сетки и требуют явного описания и моделирования эффектов их влияния.

Требуется описание все новых эффектов в пласте: закачка нано-полимеров, растворение пластовой соли закачиваемой водой, закачка пара, внутрипластовое горение, описание призабойной зоны и т.д.

Требуется сопряжение задачи фильтрации и расчета упруго-деформированного состояния пласта.

Все это требует все больших и больших вычислительных ресурсов на расчет единичного варианта модели.

–  –  –

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Факторы сложности модели Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Факторы сложности модели Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Особенности системы уравнений Разреженная матрица системы линейных уравнений, возникающей на каждой итерации метода Ньютона, во многом отличается от разреженных матриц, к которым обычно приводят аппроксимации, например, уравнений теплопроводности или Навье-Стокса.

Выделим основные из них:

большой шаблон матрицы (количество ненулевых элементов в строке) из-за геометрических особенностей сетки, аппроксимации скважин и водонапорных горизонтов;

большое количество дополнительных нелинейных алгебраических уравнений, возникающих при аппроксимации скважин и водонапорных горизонтов;

высокая жесткость задачи из-за наличия источников и стоков.

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Матрица и геологические особенности При наличии разломов и выклинивания течение смеси из одного блока возможно в десятки и даже сотни других блоков (например, когда высота столбика из сотни блоков равна высоте стороны одного блока).

–  –  –

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Матрица и скважины Ствол скважины представляет (с точки зрения математической модели) трубу, в которой в некоторых местах сделаны перфорации. Таких перфораций в скважине обычно много и они находятся в разных блоках сетки. С силу возможности течения в стволе скважины получается, что все такие блоки гидродинамически связаны. Другими словами, если скважина проходит и перфорирована в блоках сетки l1,..., lM, то в матрице в строках l1,..., lM, будут ненулевые элементы в столбцах l1,..., lM.

–  –  –

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Матрица и скважины Поверхностное оборудование (например, газосборная сеть) могут диктовать дополнительные ограничения на работу скважин, например, суммарная добыча с группы скважин должна быть равна заданному значению.Это приводит к дополнительным нелинейным алгебраическим уравнениям, связывающим режимы работы разных скважин.

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Матрица и водонапорные горизонты Водонапорные горизонты, часто используемые для моделирования незамкнутости резервуара, приводят к возникновению потоков, зависящих от предыдущей истории и текущего суммарного потока, т.е. к еще одному линейному уравнению, связывающему все блоки, подключенные к водонапорному горизонту. Для этого уравнения (пусть его номер l) число ненулевых элементов в соответствующей строке матрицы будет равно количеству блоков l1,..., lM, к которым подключен водонапорный горизонт.

Также в каждой из строк l1,..., lM добавляется ненулевой элемент в столбце l.

Богачев К.Ю.

Решение задачи фильтрации на параллельных ЭВМ Решение задачи на параллельных ЭВМ Применение параллельных ЭВМ особенно актуально в силу большого объема вычислительной работы, но сталкивается с серьезными проблемами:

Большой шаблон матрицы СЛАУ (количество ненулевых элементов в строке) приводит к большому количеству связей между между частями матрицы (или вычислительной области), распределенными на разные логические процессоры.

Большие объемы обрабатываемых на каждой итерации данных делают невозможным обработку последовательных частей алгоритма (если они есть) одним логическим процессором из-за недостатка оперативной памяти.

Необходимость применения сложных предобуславливателей, многие из которых существенно последовательные по своей природе.

Часто невозможно отнести к одному логическому процессору целиком набор блоков, через которые проходит одна или несколько “пересекающихся” скважин, одна группа скважин, связанная поверхностными трубопроводами, один водонапорный горизонт, одна трещина ГРП при ее моделировании через набор виртуальных перфораций.

Объем входных данных не определяет полностью сложность вычислительной работы.

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Решение задачи на параллельных ЭВМ Указанные причины вызывают быстрое насыщение параллельных алгоритмов, т.е. ситуации, когда добавление новых логических процессоров не приводит к сокращению времени расчета. Например, в лучших западные проектах (по их собственным данным, см.

http://static.og-hpc.org/Rice2010/Slides/

Brazell-Fjerstad-OG-HPC-2010-SLB-Chevron.pdf):

Eclipse (Schlumberger): максимальное ускорение 8–12 раз, насыщение за пределами 16 логических процессоров.

Intersect (Schlumberger): максимальное ускорение 14–16 раз, насыщение за пределами 20 логических процессоров.

–  –  –

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Иерархическое строение современных кластеров Для программирования кластеров де-факто стандартом стал интерфейс MPI. Пока логических процессоров на узле было 2, накладные расходы на обмен сообщениями между процессами, работающими на одном узле, были минимальны. Все изменилось, когда узлы стали состоять из более, чем десятка логических процессоров. Потери в производительности стали составлять уже разы, и это уже нельзя было не замечать. Поэтому возникла идея разработки гибридных приложений: взаимодействие между узлами осуществляется с помощью интерфейса MPI, а внутри узла программа работает, как на системе с общей памятью, используя интерфейс OpenMP или потоки исполнения, предоставляемые непосредственно операционной системой.

Выгоды от такого подхода очевидны. Рассмотрим, например, кластер из 20-ти узлов с 12-ю логическими процессорами в каждом, всего 240 процессоров. При традиционном подходе на этой системе надо было использовать 240 MPI процессов, что обычно уже сталкивается с проблемами масштабируемости задачи. При гибридном подходе надо использовать 20 MPI процессов (по числу узлов) и по 12 потоков исполнения на каждом узле.

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Гибридная 3-х уровневая технология Сформулируем, как же должно выглядеть приложение для современных кластеров.

Это должно быть 3-х уровневое гибридное приложение:

MPI интерфейс для взаимодействия процессов между узлами.

Потоки исполнения для распределения вычислительной нагрузки между логическими процессорами узла.

Учет архитектуры NUMA — минимизация обращения к памяти другого физического процессора (к памяти другого логического процессора, находящегося в одном корпусе с рассматриваемым, обращение идет быстро).

Должно быть обеспечено равномерное распределение вычислительной работы и данных на всех трех уровнях: одинаковая загруженность узлов, потоков исполнения на узле, каждого физического процессора (иногда называемого NUMA-узлом).

Идея использования гибридного подхода к написанию вычислительных приложений для иерархических систем не нова.Но сложность задачи фильтрации многокомпонентной смеси в пористой среде делают такую реализацию крайне тяжелой и ранее не реализованной.

–  –  –

Для построения аппроксимации системы дифференциальных уравнений фильтрации (6) вводится сетка, учитывающая геологическое строение месторождения (разломы, выклинивания). Далее будем называть упомянутую сетку исходной. Для решения задачи используются только данные для ячеек сетки, имеющих поровый объем, больше определенного порогового значения. Такие ячейки сетки называются активными, а их совокупность – расчетной сеткой. Данные в неактивных ячейках во время расчета не хранятся, но используются для построения расчетной сетки.

Стандартный подход к разделению задачи между узлами кластера состоит в геометрическом разрезании области на части по числу вычислительных узлов. Этому разрезанию области соответствуют разделение исходной и расчетной сеток. В каждом MPI-процессе загружаются данные и выполняется вычислительная работа для ячеек сетки, соответствующих его части области. Из-за особенностей геологического строения месторождения часто невозможно разделить область на части так, чтобы в каждой части одинаково было количество ячеек исходной и расчетной сеток.

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Балансировка загруженности узлов кластера Все имеющиеся пакеты расчета задачи фильтрации разделяют исходную сетку на одинаковые по количеству ячеек исходной сетки части, что идеально балансирует загруженность узлов кластера на этапе чтения входных данных. Однако, расчетная сетка при таком геометрическом разделении области оказывается распределена между узлами очень неоднородно. Может даже получится так, что в некоторых частях исходной сетки отсутствуют блоки расчетной сетки, и соответствующему узлу кластера вообще не достается вычислительной работы. В этом случае большинство существующих программных пакетов решения задачи фильтрации останавливают свою работу.

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Балансировка загруженности узлов кластера

Загрузка данных и построение расчетной сетки:

1. Исходная сетка делится равномерно между узлами с перекрытиями (как в традиционном подходе). На каждом узле осуществляется построение части расчетной сетки с вычислением графа связей с ячейками в других MPI-процессах.

2. Осуществляется сборка карты соответствия ячеек расчетной и исходной сеток на каждом узле и на основании этой информации осуществляется вычисление номеров ячеек, которые попадут на каждый из узлов на следующем этапе.

3. Загрузка данных исходной сетки, с сохранением на каждом узле кластера данных только для ячеек расчетной сетки, распределенных на данный узел.

Для построения графа связей разделение осуществляется с перекрытием, чтобы ячейки, между которыми теоретически возможна связь, оказались на одном узле.

–  –  –

Рассмотренное разделение расчетной сетки Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Балансировка загруженности узлов кластера Описанный метод был протестирован на кластере из 20 улов с двумя процессорами Intel Xeon X5650 и 24GB оперативной памяти в каждом, соединение между узлами осуществлялось Inniband QDR. Для тестирования была выбрана гидродинамическая модель Самотлорского месторождения на геологической сетке, содержащая 232 миллиона ячеек исходной сетки. Размер задачи позволяет ее рассчитывать только на 10 узлах и более из-за недостаточного количества оперативной памяти.

Расчет на 10 узлах Расчет на 20 узлах

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Системы с общей неоднородной памятью При использовании на каждом узле потоков с разделением данных между ними (гибридная схема организации вычислительного процесса) для учета разного времени обращения логических процессоров к разным участкам памяти (NUMA архитектура) требуется значительно менять код традиционного многопоточного приложения. В последнее время предложена технология, использующая особенности управления памятью в операционных системах Linux и Windows 7, которая не требует значительного изменения программного кода многопоточного приложения и при этом максимально использует возможности оборудования.

Ключевая идея заключается в реализации двух условий, которые позволят минимизировать число обращений к нелокальным участкам памяти:

каждый из вычислительных потоков работает на фиксированном узле NUMA системы, те части матрицы и вектора, c которыми вычислительный поток оперирует большую часть времени, физически находятся в локальной памяти этого узла.

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Системы с общей неоднородной памятью Для выполнения первого условия в каждом из вычислительных потоков сразу после его создания сделаем системный вызов, который привяжет этот i-тый поток к i-тому логическому процессору.

Для удовлетворения второго условия с минимальным переписыванием программы воспользуемся особенностью механизма выделения памяти в операционных системах, поддерживающих NUMA. В системах Linux и Windows 7 при выделении памяти посредством функции malloc отображение затребованной виртуальной памяти на физическую строится не сразу. Когда поток обращается к блоку виртуальной памяти, для которого еще не построено отображение, происходит страничный промах (page fault), который инициирует создание отображения запрошенного блока виртуальной памяти на локальную память того узла NUMA системы, с которого был произведен запрос.

Будем выполнять операцию выделения памяти в два этапа. На первом этапе главный поток запрашивает у операционной системы память требуемого объема. Затем следует точка синхронизации, после которой указатель на затребованную память можно использовать во всех потоках. На втором этапе выделенная память параллельно инициализируется всеми потоками, причем каждый из потоков инициализирует только «свою» часть памяти.

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Системы с общей неоднородной памятью Описанный метод был протестирован на системе с процессорами Intel Xeon X7560 2.27GHz, число процессоров = 4, число ядер = 8, число логических процессоров = 64. Для тестирования была выбрана модель реального месторождения, содержащая 2.4 миллиона ячеек расчетной сетки (время расчета с использованием одного потока – 26 часов 47 минут).

Предложенный метод позволил достичь ускорения 21 на системе с 32-мя физическими ядрами, в то время, как ускорение неоптимизированной версии равно 11.

2.0 25.0 1.8 20.0 1.6 15.0 1.4 10.0 1.2 5.0 1.0 1.0 Ускорение работы программы от NUMA Масштабируемость параллельного расчета Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Выбор итерационного метода Для гибридной MPI-многопоточной программы нахождения решения задачи фильтрации выбор оптимального итерационного метода для решения систем линейных уравнений с разреженной матрицей является непростой задачей.

Слишком много параметров влияют на суммарную производительность:

количество точек синхронизации (когда все работающие процессы и(или) потоки должны обменяться информацией);

объем пересылаемых данных между процессами;

объем оперативной памяти, требуемый алгоритму (поскольку оперативная память – намного более медленный ресурс, чем процессор);

адаптивность алгоритма – его способность подстраиваться под входную матрицу, поскольку решается много разных систем (на каждом шаге по времени и на каждой итерации метода Ньютона) и выбирать набор параметров, оптимальный для каждой из них, невозможно.

При этом производительность надо измерять при разном количестве использованных узлов и логических процессоров на них, чтобы оценить масштабируемость алгоритмов. При таком количестве влияющих факторов теоретическое сравнение алгоритмов вряд ли возможно.

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Выбор итерационного метода Было проведено практическое сравнение трех основных алгоритмов решения систем линейных уравнений с несимметричной разреженной матрицей: BCGS, ORTHOMIN, GMRES (последний в двух вариантах — QGMRES, DQGMRES) (см. Y.Saad — 2003) по скорости работы и ускорению на параллельных ЭВМ: на SMP-системах, на системах с распределенной памятью и на гибридных системах (системах с распределенной памятью, состоящих из SMP-узлов). Проведено также исследование масштабируемости каждого из алгоритмов (время работы алгоритма сравнивается с временем работы его же на другой конфигурации узлов/потоков) и сравнение алгоритмов между собой (время работы алгоритма сравнивается с временем работы другого алгоритма на той же конфигурации узлов/потоков). Все алгоритмы были реализованы с максимальными оптимизациями для параллельных ЭВМ, включая учет неоднородности доступа к памяти (NUMA). В качестве предобуславливателя использовался параллельный вариант предобуславливателя ILU(0) с «алгебраическим» разбиением матрицы.

Системы решались на кластере из 16 двухпроцессорных узлов, с шестиядерными процессорами Intel Xeon X5650 с частотой 2.67GHz и соединенных InniBand QDR с пропускной способностью 40Gbit/s.

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Выбор итерационного метода Усредненные по матрицам графики ускорения алгоритмов при запуске на одном узле с разным количеством потоков и с одним потоком на разном количестве узлов показаны ниже. Здесь на графиках буквой B обозначается алгоритм BCGS, O — ORTHOMIN, Q — QGMRES, D — DQGMRES.

Один узел, разное количество потоков Один поток, разное количество узлов

–  –  –

Отметим полученное ускорение в 51 раз по сравнению с временем работы последовательной программы, что разительно отличается от результатов аналогичных программ расчета, см. рис. 1.

–  –  –

Отметим полученное ускорение в 41 раз по сравнению с временем работы последовательной программы, что разительно отличается от результатов аналогичных программ расчета, см. рис. 1.

–  –  –

Видим, что использование многоядерных процессоров на узлах вычислительного кластера оправдано и повышает эффективность расчета.

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Численные эксперименты Рассмотрим Самотлорское месторождение в геологическом разрешении.

Кластер из 64 узлов с двумя 10-ти ядерными процессорами Xeon E5-2680 v2 (2.80GHz), всего 1280 ядер, 8Тб оперативной памяти.

–  –  –

Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Содержание I Введение Постановка задачи Гидродинамическая модель Основные соотношения Уравнение сохранения массы Модель скважины Модель водонапорного горизонта Особенности системы уравнений Ход решения задачи Этапы построения модели Применение гидродинамической модели Факторы сложности гидродинамической модели Решение задачи на параллельных ЭВМ Особенности системы уравнений Решение задачи на параллельных ЭВМ Гибридный алгоритм распараллеливания решения задач фильтрации Иерархическое строение современных вычислительных кластеров Гибридная 3-х уровневая технология построения вычислительного процесса решения задачи фильтрации Богачев К.Ю. Решение задачи фильтрации на параллельных ЭВМ Содержание II Балансировка загруженности узлов кластера при расчете задачи фильтрации Оптимизация решения задачи фильтрации для многопроцессорных систем с общей неоднородной памятью Выбор оптимального итерационного метода решения систем линейных уравнений в задачах фильтрации Численные эксперименты



Похожие работы:

«Олег Губарь Функции Одесского строительного комитета в контексте истории градостроительства Одессы* Гостиный (Красный) ряд Выше кратко упоминалось об этом первом элитарном торговом центре Одессы. Основание его началось после первичного устройства...»

«МЕЖГОСУДАРСТВЕННЫЙ СОВЕТ ПО СТАНДАРТИЗАЦИИ, МЕТРОЛОГИИ И СЕРТИФИКАЦИИ (МГС) INTERSTATE COUNCIL FOR STANDARDIZATION, METROLOGY AND CERTIFICATION (ISC) ГОСТ ISO 8083 2011 межгосударственный (ГОСТ P ИСО 8083—2008) стандарт Машины для леса УСТРОЙСТВА ЗАЩИТЫ ОТ ПАДАЮЩИХ ПРЕДМЕТОВ Технические требования и метод...»

«Юридические науки 287 рального агентства по техническому регулированию и метрологии от 15.12.09 № 773-ст). – М.: Стандартинформ, 2010. – 12 с.40. Тюрина И. Выезд российских туристов за рубеж в 2011 году / И. Тюрина [Электронный ресурс] // Еженедельная электронная газета Российского союза туриндустрии....»

«Помогите скачать Охарактеризуйте атмосферу по плану задание заданию 2 страница 67 Охарактеризуйте атмосферу по плану задание заданию 2 страница 67 Охарактеризуйте атмосферу по плану задание заданию 2 страница 67: Числа Фибоначчи технический анализ Министерство о...»

«Промышленные предприятия Курганской области Наименование предприятия, № Номенклатура продукции адрес, тел./факс, e-mail, web МЕТАЛЛУРГИЯ. МАШИНОСТРОЕНИЕ. 1. ЗАО "Курганстальмост" Металлические пролетные строения железнодорожных, автодорожных, 640023, г. Курган, ул. Загородная, 3 совмещенных, пешеходных мосто...»

«ISSN 0131-5226. Сборник научных трудов. ГНУ СЗНИИМЭСХ Россельхозакадемии. 2013. Вып. 84. технических подробностей/ 7. Polimer/net/Сайт http://www.polimer.net/klassifikacija-materialov/item/1710-polijetilen 8. ООО “Компания Экопр...»

«Утверждены Постановлением Госстроя СССР от 29 августа 1985 г. N 135 СТРОИТЕЛЬНЫЕ НОРМЫ И ПРАВИЛА НАГРУЗКИ И ВОЗДЕЙСТВИЯ СНиП 2.01.07-85* (в ред. Изменения N 1, утв. Постановлением Госстроя СССР...»

«Алгебра и геометрия Годовой обязательный курс для студентов 1-го курса бакалавриата департамента математики, механики и компьютерных наук Института математики и компьютерных наук УрФУ (направления подготовки "Фундаментальная информатика и информационные технологии" и "Прикладная информатика").Соде...»








 
2017 www.doc.knigi-x.ru - «Бесплатная электронная библиотека - различные документы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.