All issues
- 2024 Vol. 16
- 2023 Vol. 15
- 2022 Vol. 14
- 2021 Vol. 13
- 2020 Vol. 12
- 2019 Vol. 11
- 2018 Vol. 10
- 2017 Vol. 9
- 2016 Vol. 8
- 2015 Vol. 7
- 2014 Vol. 6
- 2013 Vol. 5
- 2012 Vol. 4
- 2011 Vol. 3
- 2010 Vol. 2
- 2009 Vol. 1
-
Решатель уравнения Больцмана на неструктурированных пространственных сетках
Компьютерные исследования и моделирование, 2019, т. 11, № 3, с. 427-447Целью данной работы является создание достаточно универсальной вычислительной программы (решателя) кинетического уравнения Больцмана для моделирования течений разреженного газа в устройствах сложной формы. Подробно описывается структура решателя, а его эффективность демонстрируется на примере расчета современной конструкции многотрубочного насоса Кнудсена. Решение уравнения Больцмана выполняется на фиксированных пространственной и скоростной сетках с помощью метода расщепления по физическим процессам. Дифференциальный оператор переноса аппроксимируется методом конечных разностей. Вычисление интеграла столкновений производится на основе консервативного проекционного метода.
Пространственная неструктурированная сетка строится с помощью внешнего генератора сеток и может включать в себя призмы, тетраэдры, гексаэдры и пирамиды. Сетка сгущается в областях течения с наибольшими градиентами рассчитываемых величин. Трехмерная скоростная сетка состоит из кубических ячеек равного объема.
Большой объем вычислений требует эффективного распараллеливания алгоритма, что реализовано на основе методики Message Passing Interface (MPI). Передача информации от одного узла MPI к другому осуществляется как разновидность граничного условия — таким образом, каждый MPI узел может хранить только ту часть сетки, которая имеет отношение конкретно к нему.
В результате получен график разности давлений в двух резервуарах, соединенных многотрубочным насосом Кнудсена в зависимости от числа Кнудсена, т. е. получена численными методами характеристика, ответственная за качество работы термомолекулярного микронасоса. Также показаны распределения давления, температуры и концентрации газа в установившемся состоянии внутри резервуаров и самого микронасоса.
Корректность работы солвера проверяется на тестах с распределением температуры газа между двух нагретых до разной температуры пластинок, а также в тесте с сохранением общей массы газа.
Корректность полученных данных для многотрубочного насоса Кнудсена проверяется на более точных скоростной и пространственной сетках, а также при использовании большего количества столкновений в интеграле столкновений за шаг.
Ключевые слова: уравнение Больцмана, эффект Кнудсена, неструктурированная сетка, микронасос, функция распределения, интеграл столкновений, проекционный метод.
The Solver of Boltzmann equation on unstructured spatial grids
Computer Research and Modeling, 2019, v. 11, no. 3, pp. 427-447Views (last year): 13.The purpose of this work is to develop a universal computer program (solver) which solves kinetic Boltzmann equation for simulations of rarefied gas flows in complexly shaped devices. The structure of the solver is described in details. Its efficiency is demonstrated on an example of calculations of a modern many tubes Knudsen pump. The kinetic Boltzmann equation is solved by finite-difference method on discrete grid in spatial and velocity spaces. The differential advection operator is approximated by finite difference method. The calculation of the collision integral is based on the conservative projection method.
In the developed computational program the unstructured spatial mesh is generated using GMSH and may include prisms, tetrahedrons, hexahedrons and pyramids. The mesh is denser in areas of flow with large gradients of gas parameters. A three-dimensional velocity grid consists of cubic cells of equal volume.
A huge amount of calculations requires effective parallelization of the algorithm which is implemented in the program with the use of Message Passing Interface (MPI) technology. An information transfer from one node to another is implemented as a kind of boundary condition. As a result, every MPI node contains the information about only its part of the grid.
The main result of the work is presented in the graph of pressure difference in 2 reservoirs connected by a multitube Knudsen pump from Knudsen number. This characteristic of the Knudsen pump obtained by numerical methods shows the quality of the pump. Distributions of pressure, temperature and gas concentration in a steady state inside the pump and the reservoirs are presented as well.
The correctness of the solver is checked using two special test solutions of more simple boundary problems — test with temperature distribution between 2 planes with different temperatures and test with conservation of total gas mass.
The correctness of the obtained data for multitube Knudsen pump is checked using denser spatial and velocity grids, using more collisions in collision integral per time step.
-
Эффективные генераторы псевдослучайных чисел при молекулярном моделировании на видеокартах
Компьютерные исследования и моделирование, 2011, т. 3, № 3, с. 287-308Динамика Ланжевена, метод Монте-Карло и моделирование молекулярной динамики в неявном растворителе требуют больших массивов случайных чисел на каждом шаге расчета. Мы исследовали два подхода в реализации генераторов на графических процессорах. Первый реализует последовательный алгоритм генератора на каждом потоке в отдельности. Второй основан на возможности взаимодействия между потоками и реализует общий алгоритм на всех потоках в целом. Мы покажем использование этих подходов на примере алгоритмов Ran 2, Hybrid Taus и Lagged Fibonacci. Для проверки случайности полученных чисел мы использовали разработанные генераторы при моделировании динамики Ланжевена N независимых гармонических осцилляторов в термостате. Это позволило нам оценить статистические характеристики генераторов. Мы также исследовали производительность, использование памяти и ускорение, получаемое при переносе алгоритма с центрального на графический процессор.
Ключевые слова: псевдослучайные числа, графический процессор, генератор, молекулярное моделирование.
Efficient Pseudorandom number generators for biomolecular simulations on graphics processors
Computer Research and Modeling, 2011, v. 3, no. 3, pp. 287-308Views (last year): 11. Citations: 2 (RSCI).Langevin Dynamics, Monte Carlo, and all-atom Molecular Dynamics simulations in implicit solvent require a reliable source of pseudorandom numbers generated at each step of calculation. We present the two main approaches for implementation of pseudorandom number generators on a GPU. In the first approach, inherent in CPU-based calculations, one PRNG produces a stream of pseudorandom numbers in each thread of execution, whereas the second approach builds on the ability of different threads to communicate, thus, sharing random seeds across the entire device. We exemplify the use of these approaches through the development of Ran2, Hybrid Taus, and Lagged Fibonacci algorithms. As an application-based test of randomness, we carry out LD simulations of N independent harmonic oscillators coupled to a stochastic thermostat. This model allows us to assess statistical quality of pseudorandom numbers. We also profile performance of these generators in terms of the computational time, memory usage, and the speedup factor (CPU/GPU time).
-
Физический анализ и математическое моделирование параметров области взрыва, произведенного в разреженной ионосфере
Компьютерные исследования и моделирование, 2022, т. 14, № 4, с. 817-833В работе выполнен физический и численный анализ динамики и излучения продуктов взрыва, образующихся при проведении российско-американского эксперимента в ионосфере с использованием взрывного генератора на основе гексогена и тротила. Основное внимание уделяется анализу взаимосвязи излучения возмущенной области с динамикой процессов взрывчатого вещества и плазменной струи на поздней стадии. Проанализирован подробный химический состав продуктов взрыва и определены начальные концентрации наиболее важных молекул, способных излучать в инфракрасном диапазоне спектра, и приведены их излучательные константы. Определены начальная температура продуктов взрыва и показатель адиабаты. Проанализирован характер взаимопроникновения атомов и молекул сильно разреженной ионосферы в сферически расширяющееся облако продуктов. Разработана приближенная математическая модель динамики продуктов взрыва в условиях подмешивания к ним разреженного воздуха ионосферы и рассчитаны основные термодинамические характеристики системы. Показано, что на время 0,3–3 с происходит существенное повышение температуры разлетающейся смеси в результате ее торможения. Для анализа и сравнения на основе лагранжевого подхода разработан численный алгоритм решения двухобластной газодинамической задачи, в которой продукты взрыва и фоновый газ разделены контактной границей. Требовалось выполнение специальных условий на контактной границе при ее движении в покоящемся газе. В данном случае существуют определенные трудности в описании параметров продуктов взрыва вблизи контактной границы, что связано с большим различием в размерах массовых ячеек продуктов взрыва и фона из-за перепада плотности на 13 порядков. Для сокращения времени расчета данной задачи в области продуктов взрыва применялась неравномерная расчетная сетка. Расчеты выполнялись с различными показателями адиабаты. Получены результаты, наиболее важным из которых является температура, хорошо согласуется с результатами, полученными по методике, приближенно учитывающей взаимопроникновение. Получено поведение во времени коэффициентов излучения ИК-активных молекул в широком диапазоне спектра. Данное поведение качественно согласуется с экспериментами по ИК-свечению разлетающихся продуктов взрыва.
Ключевые слова: ионосфера, численное моделирование, активный геофизический эксперимент, взрывной генератор, высокоскоростная плазменная струя, инфракрасное излучение, плазма, ионизация, околоземное пространство, кинетика.
Physical analysis and mathematical modeling of the parameters of explosion region produced in a rarefied ionosphere
Computer Research and Modeling, 2022, v. 14, no. 4, pp. 817-833The paper presents a physical and numerical analysis of the dynamics and radiation of explosion products formed during the Russian-American experiment in the ionosphere using an explosive generator based on hexogen (RDX) and trinitrotoluene (TNT). The main attention is paid to the radiation of the perturbed region and the dynamics of the products of explosion (PE). The detailed chemical composition of the explosion products is analyzed and the initial concentrations of the most important molecules capable of emitting in the infrared range of the spectrum are determined, and their radiative constants are given. The initial temperature of the explosion products and the adiabatic exponent are determined. The nature of the interpenetration of atoms and molecules of a highly rarefied ionosphere into a spherically expanding cloud of products is analyzed. An approximate mathematical model of the dynamics of explosion products under conditions of mixing rarefied ionospheric air with them has been developed and the main thermodynamic characteristics of the system have been calculated. It is shown that for a time of 0,3–3 sec there is a significant increase in the temperature of the scattering mixture as a result of its deceleration. In the problem under consideration the explosion products and the background gas are separated by a contact boundary. To solve this two-region gas dynamic problem a numerical algorithm based on the Lagrangian approach was developed. It was necessary to fulfill special conditions at the contact boundary during its movement in a stationary gas. In this case there are certain difficulties in describing the parameters of the explosion products near the contact boundary which is associated with a large difference in the size of the mass cells of the explosion products and the background due to a density difference of 13 orders of magnitude. To reduce the calculation time of this problem an irregular calculation grid was used in the area of explosion products. Calculations were performed with different adiabatic exponents. The most important result is temperature. It is in good agreement with the results obtained by the method that approximately takes into account interpenetration. The time behavior of the IR emission coefficients of active molecules in a wide range of the spectrum is obtained. This behavior is qualitatively consistent with experiments for the IR glow of flying explosion products.
-
Предсказание производительности избранных типов циклов над одномерными массивами посредством анализа эмбеддингов промежуточных представлений
Компьютерные исследования и моделирование, 2023, т. 15, № 1, с. 211-224Предложен метод отображения промежуточных представлений C-, C++-программ в пространство векторов (эмбеддингов) для оценки производительности программ на этапе компиляции, без необходимости исполнения. Использование эмбеддингов для данной цели позволяет не проводить сравнение графов исследуемых программ непосредственно, что вычислительно упрощает задачу сравнения программ. Метод основан на серии трансформаций исходного промежуточного представления (IR), таких как: инструментирование — добавление фиктивных инструкций в оптимизационном проходе компилятора в зависимости от разности смещений в текущей инструкции обращения к памяти относительно предыдущей, преобразование IR в многомерный вектор с помощью технологии IR2Vec с понижением размерности по алгоритму t-SNE (стохастическое вложение соседей с t-распределением). В качестве метрики производительности предлагается доля кэш-промахов 1-го уровня (D1 cache misses). Приводится эвристический критерий отличия программ с большей долей кэш-промахов от программ с меньшей долей по их образам. Также описан разработанный в ходе работы проход компилятора, генерирующий и добавляющий фиктивные инструкции IR согласно используемой модели памяти. Приведено описание разработанного программного комплекса, реализующего предложенный способ оценивания на базе компиляторной инфраструктуры LLVM. Проведен ряд вычислительных экспериментов на синтетических тестах из наборов программ с идентичными потоками управления, но различным порядком обращений к одномерному массиву, показано, что коэффициент корреляции между метрикой производительности и расстоянием до эмбеддинга худшей программы в наборе отрицателен вне зависимости от инициализации t-SNE, что позволяет сделать заключение о достоверности эвристического критерия. Также в статье рассмотрен способ генерации тестов. По результатам экспериментов, вариативность значений метрики производительности на исследуемых множествах предложена как метрика для улучшения генератора тестов.
Ключевые слова: математическое моделирование, компиляторы, промежуточные представления программ, эмбеддинги, анализ производительности, статический анализ.
Performance prediction for chosen types of loops over one-dimensional arrays with embedding-driven intermediate representations analysis
Computer Research and Modeling, 2023, v. 15, no. 1, pp. 211-224The method for mapping of intermediate representations (IR) set of C, C++ programs to vector embedding space is considered to create an empirical estimation framework for static performance prediction using LLVM compiler infrastructure. The usage of embeddings makes programs easier to compare due to avoiding Control Flow Graphs (CFG) and Data Flow Graphs (DFG) direct comparison. This method is based on transformation series of the initial IR such as: instrumentation — injection of artificial instructions in an instrumentation compiler’s pass depending on load offset delta in the current instruction compared to the previous one, mapping of instrumented IR into multidimensional vector with IR2Vec and dimension reduction with t-SNE (t-distributed stochastic neighbor embedding) method. The D1 cache miss ratio measured with perf stat tool is considered as performance metric. A heuristic criterion of programs having more or less cache miss ratio is given. This criterion is based on embeddings of programs in 2D-space. The instrumentation compiler’s pass developed in this work is described: how it generates and injects artificial instructions into IR within the used memory model. The software pipeline that implements the performance estimation based on LLVM compiler infrastructure is given. Computational experiments are performed on synthetic tests which are the sets of programs with the same CFGs but with different sequences of offsets used when accessing the one-dimensional array of a given size. The correlation coefficient between performance metric and distance to the worst program’s embedding is measured and proved to be negative regardless of t-SNE initialization. This fact proves the heuristic criterion to be true. The process of such synthetic tests generation is also considered. Moreover, the variety of performance metric in programs set in such a test is proposed as a metric to be improved with exploration of more tests generators.
Indexed in Scopus
Full-text version of the journal is also available on the web site of the scientific electronic library eLIBRARY.RU
The journal is included in the Russian Science Citation Index
The journal is included in the RSCI
International Interdisciplinary Conference "Mathematics. Computing. Education"