All issues
- 2025 Vol. 17
- 2024 Vol. 16
- 2023 Vol. 15
- 2022 Vol. 14
- 2021 Vol. 13
- 2020 Vol. 12
- 2019 Vol. 11
- 2018 Vol. 10
- 2017 Vol. 9
- 2016 Vol. 8
- 2015 Vol. 7
- 2014 Vol. 6
- 2013 Vol. 5
- 2012 Vol. 4
- 2011 Vol. 3
- 2010 Vol. 2
- 2009 Vol. 1
-
Обзор выпуклой оптимизации марковских процессов принятия решений
Компьютерные исследования и моделирование, 2023, т. 15, № 2, с. 329-353В данной статье проведен обзор как исторических достижений, так и современных результатов в области марковских процессов принятия решений (Markov Decision Process, MDP) и выпуклой оптимизации. Данный обзор является первой попыткой освещения на русском языке области обучения с подкреплением в контексте выпуклой оптимизации. Рассматриваются фундаментальное уравнение Беллмана и построенные на его основе критерии оптимальности политики — стратегии, принимающие решение по известному состоянию среды на данный момент. Также рассмотрены основные итеративные алгоритмы оптимизации политики, построенные на решении уравнений Беллмана. Важным разделом данной статьи стало рассмотрение альтернативы к подходу $Q$-обучения — метода прямой максимизации средней награды агента для избранной стратегии от взаимодействия со средой. Таким образом, решение данной задачи выпуклой оптимизации представимо в виде задачи линейного программирования. В работе демонстрируется, как аппарат выпуклой оптимизации применяется для решения задачи обучения с подкреплением (Reinforcement Learning, RL). В частности, показано, как понятие сильной двойственности позволяет естественно модифицировать постановку задачи RL, показывая эквивалентность между максимизацией награды агента и поиском его оптимальной стратегии. В работе также рассматривается вопрос сложности оптимизации MDP относительно количества троек «состояние–действие–награда», получаемых в результате взаимодействия со средой. Представлены оптимальные границы сложности решения MDP в случае эргодического процесса с бесконечным горизонтом, а также в случае нестационарного процесса с конечным горизонтом, который можно перезапускать несколько раз подряд или сразу запускать параллельно в нескольких потоках. Также в обзоре рассмотрены последние результаты по уменьшению зазора нижней и верхней оценки сложности оптимизации MDP с усредненным вознаграждением (Averaged MDP, AMDP). В заключение рассматриваются вещественнозначная параметризация политики агента и класс градиентных методов оптимизации через максимизацию $Q$-функции ценности. В частности, представлен специальный класс MDP с ограничениями на ценность политики (Constrained Markov Decision Process, CMDP), для которых предложен общий прямодвойственный подход к оптимизации, обладающий сильной двойственностью.
Ключевые слова: MDP, выпуклая оптимизация, $Q$-обучение, линейное программирование, методы градиента политики.
Survey of convex optimization of Markov decision processes
Computer Research and Modeling, 2023, v. 15, no. 2, pp. 329-353This article reviews both historical achievements and modern results in the field of Markov Decision Process (MDP) and convex optimization. This review is the first attempt to cover the field of reinforcement learning in Russian in the context of convex optimization. The fundamental Bellman equation and the criteria of optimality of policy — strategies based on it, which make decisions based on the known state of the environment at the moment, are considered. The main iterative algorithms of policy optimization based on the solution of the Bellman equations are also considered. An important section of this article was the consideration of an alternative to the $Q$-learning approach — the method of direct maximization of the agent’s average reward for the chosen strategy from interaction with the environment. Thus, the solution of this convex optimization problem can be represented as a linear programming problem. The paper demonstrates how the convex optimization apparatus is used to solve the problem of Reinforcement Learning (RL). In particular, it is shown how the concept of strong duality allows us to naturally modify the formulation of the RL problem, showing the equivalence between maximizing the agent’s reward and finding his optimal strategy. The paper also discusses the complexity of MDP optimization with respect to the number of state–action–reward triples obtained as a result of interaction with the environment. The optimal limits of the MDP solution complexity are presented in the case of an ergodic process with an infinite horizon, as well as in the case of a non-stationary process with a finite horizon, which can be restarted several times in a row or immediately run in parallel in several threads. The review also reviews the latest results on reducing the gap between the lower and upper estimates of the complexity of MDP optimization with average remuneration (Averaged MDP, AMDP). In conclusion, the real-valued parametrization of agent policy and a class of gradient optimization methods through maximizing the $Q$-function of value are considered. In particular, a special class of MDPs with restrictions on the value of policy (Constrained Markov Decision Process, CMDP) is presented, for which a general direct-dual approach to optimization with strong duality is proposed.
-
Определение крупных трещин в геологической среде с использованием сверточных нейронных сетей
Компьютерные исследования и моделирование, 2025, т. 17, № 5, с. 889-901В данной работе рассматривается обратная задача сейсморазведки — определение структуры исследуемой среды по зарегистрированному волновому отклику от нее. В качестве целевого объекта рассматриваются крупные трещины, размеры и положение которых необходимо определить.
Для решения прямой задачи используется численное моделирование сеточно-характеристическим методом. Сеточно-характеристический метод позволяет применять физически обоснованные алгоритмы расчета точек на внешних границах области и контактных границах внутри области интегрирования. Трещина принимается тонкой, для описания трещины используется специальное условие на створках трещины.
Обратная задача решается с помощью сверточных нейронных сетей. Входными данными нейронной сети являются сейсмограммы, интерпретируемые как изображения. Выходными данными являются маски, описывающие среду на структурированной сетке. Каждый элемент такой сетки относится к одному из двух классов: либо элемент сплош- ного геологического массива, либо элемент, через который проходит трещина. Такой подход позволяет рассматривать среду, в которой находится неизвестное наперед количество трещин.
Для обучения нейронной сети использовались исключительно примеры с одной трещиной. Для итогового тестирования обученной сети использовались отдельные примеры с несколькими трещинами, эти примеры никак не были задействованы в ходе обучения. Целью тестирования в таких условиях была проверка, что обученная сеть обладает достаточной общностью, распознает в сигнале признаки наличия трещины и при этомне страдает от переобучения на примерах с единственной трещиной в среде.
В работе показано, что сверточная сеть, обученная на примерах с единичной трещиной, может использоваться для обработки данных с множественными трещинами. Хорошо определяются в том числе небольшие трещины на больших глубинах, если они пространственно разнесены друг от друга на расстояние большее, чемдлина сканирующего импульса. В этом случае на сейсмограмме их волновые отклики хорошо различимы и могут быть интерпретированы нейронной сетью. В случае близко расположенных трещин могут возникать артефакты и ошибки интерпретации. Это связано с тем, что на сейсмограмме волновые отклики близких трещин сливаются, из-за чего нейронная сеть интерпретирует несколько рядом расположенных трещин как одну. Отметим, что подобную ошибку, скорее всего, допустил бы и человек при ручной интерпретации данных. В работе приведены примеры некоторых таких артефактов, искажений и ошибок распознавания.
Ключевые слова: сейсморазведка, сплошная среда, прямая задача, обратная задача, сеточно-характеристический метод, машинное обучение, нейронные сети, сверточные сети.
Detecting large fractures in geological media using convolutional neural networks
Computer Research and Modeling, 2025, v. 17, no. 5, pp. 889-901This paper considers the inverse problem of seismic exploration — determining the structure of the media based on the recorded wave response from it. Large cracks are considered as target objects, whose size and position are to be determined.
he direct problem is solved using the grid-characteristic method. The method allows using physically based algorithms for calculating outer boundaries of the region and contact boundaries inside the region. The crack is assumed to be thin, a special condition on the crack borders is used to describe the crack.
The inverse problem is solved using convolutional neural networks. The input data of the neural network are seismograms interpreted as images. The output data are masks describing the medium on a structured grid. Each element of such a grid belongs to one of two classes — either an element of a continuous geological massif, or an element through which a crack passes. This approach allows us to consider a medium with an unknown number of cracks.
The neural network is trained using only samples with one crack. The final testing of the trained network is performed using additional samples with several cracks. These samples are not involved in the training process. The purpose of testing under such conditions is to verify that the trained network has sufficient generality, recognizes signs of a crack in the signal, and does not suffer from overtraining on samples with a single crack in the media.
The paper shows that a convolutional network trained on samples with a single crack can be used to process data with multiple cracks. The networks detects fairly small cracks at great depths if they are sufficiently spatially separated from each other. In this case their wave responses are clearly distinguishable on the seismogram and can be interpreted by the neural network. If the cracks are close to each other, artifacts and interpretation errors may occur. This is due to the fact that on the seismogram the wave responses of close cracks merge. This cause the network to interpret several cracks located nearby as one. It should be noted that a similar error would most likely be made by a human during manual interpretation of the data. The paper provides examples of some such artifacts, distortions and recognition errors.
-
Сверхмасштабируемое моделирование магнитных состояний и реконструкция типов упорядочения массивов наночастиц
Компьютерные исследования и моделирование, 2011, т. 3, № 3, с. 309-318Рассматриваются два возможных вычислительных метода интерпретации экспериментальных данных, полученных методами магнитно-силовой зондовой микроскопии. Развитие методов моделирования и реконструирования распределения макроспинов проводится с целью изучения процессов перемагничивания наночастиц в упорядоченных двумерных массивах. Предлагаются подходы к разработке сверхмасштабируемых высокопроизводительных алгоритмов, предназначенных для параллельного исполнения на суперкомпьютерных кластерах для решения прямой и обратной задачи моделирования магнитных состояний, типов упорядочения и процессов перемагничивания наносистем с коллективным поведением. Результаты моделирования согласуются с результатами эксперимента.
Ключевые слова: магнито-силовая микроскопия, магнитные состояния, высокопроизводительные параллельные вычисления, сверхмасштабируемость.
Superscale simulation of the magnetic states and reconstruction of the ordering types for nanodots arrays
Computer Research and Modeling, 2011, v. 3, no. 3, pp. 309-318Views (last year): 2.We consider two possible computational methods of the interpretation of experimental data obtained by means of the magnetic force microscopy. These methods of macrospin distribution simulation and reconstruction can be used for research of magnetization reversal processes of nanodots in ordered 2D arrays of nanodots. New approaches to the development of high-performance superscale algorithms for parallel executing on a supercomputer clusters for solving direct and inverse task of the modeling of magnetic states, types of ordering, reversal processes of nanosystems with a collective behavior are proposed. The simulation results are consistent with experimental results.
-
Численное моделирование процесса срабатывания предохранительного клапана
Компьютерные исследования и моделирование, 2018, т. 10, № 4, с. 495-509Рассматриваются вопросы построения математической модели процесса срабатывания пружинного предохранительного клапана прямого действия, в том числе и вопросыоб основания физически корректной величинына чального подъема диска при решении сопряженной задачи о движении диска в рабочем объеме клапана для газовых сред. Проводится обзор существующих подходов и методов решения данного типа задач. Приводятся постановка задачи о срабатывании клапана при повышении давления в резервуаре и математическая модель процесса срабатывания клапана. Особое внимание уделяется вопросам связывания физических подзадач. Описываются используемые методы, численные схемы и алгоритмы. Математическое моделирование проводится на основе фундаментальной системыдиф ференциальных уравнений движения вязкого сжимаемого газа, совместно с уравнением движения диска. В осесимметричной постановке решение рассматриваемой задачи строится численно с использованием метода конечных объемов. Сопоставляются результаты решения задачи о срабатывании предохранительного клапана, полученные с использованием вязкой модели и модели течения идеального газа. В невязкой постановке задача решается с использованием схемы Годунова, реализуемой в рамках авторского кода, а в вязкой постановке — на основе метода Курганова–Тадмора, реализуемого в рамках open source пакета OpenFOAM. Проводится сравнение результатов двух расчетов. В результате выполненных расчетов была получена зависимость высоты подъема диска от времени, которая сопоставляется с экспериментальными данными. Приводятся распределение давления газа по поверхности диска, а также профили скорости в поперечных сечениях зазора для различных высот подъема диска. Показывается, что величина начального подъема диска не влияет на характер течения газа и динамику подвижной части клапана, что может существенно сократить время расчета полного цикла работы клапана с момента его открытия до закрытия при понижении давления ниже установленного уровня. Для проверки адекватности и корректности используемых численных схем проводится моделирование процесса срабатывания клапана в рамках метода Годунова для невязкого газа. Полученные данные хорошо коррелируются между собой, что свидетельствует как о корректности сформулированной математической модели процесса срабатывания клапана, так и о возможности применения для описания динамики предохранительных клапанов модели невязкого газа.
Ключевые слова: математическое моделирование, предохранительный клапан, движение диска, вязкий газ, метод конечных объемов, схема Курганова–Тадмора, схема Годунова.
Numerical simulation of the process of activation of the safety valve
Computer Research and Modeling, 2018, v. 10, no. 4, pp. 495-509Views (last year): 34. Citations: 1 (RSCI).The conjugate problem of disk movement into gas-filled volume of the spring-type safety valve is solved. The questions of determining the physically correct value of the disk initial lift are considered. The review of existing approaches and methods for solving of such type problems is conducted. The formulation of the problem about the valve actuation when the vessel pressure rises and the mathematical model of the actuation processes are given. A special attention to the binding of physical subtasks is paid. Used methods, numerical schemes and algorithms are described. The mathematical modeling is performed on basе the fundamental system of differential equations for viscous gas movement with the equation for displacement of disk valve. The solution of this problem in the axe symmetric statement is carried out numerically using the finite volume method. The results obtained by the viscous and inviscid models are compared. In an inviscid formulation this problem is solved using the Godunov scheme, and in a viscous formulation is solved using the Kurganov – Tadmor method. The dependence of the disk displacement on time was obtained and compared with the experimental data. The pressure distribution on the disk surface, velocity profiles in the cross sections of the gap for different disk heights are given. It is shown that a value of initial drive lift it does not affect on the gas flow and valve movement part dynamic. It can significantly reduce the calculation time of the full cycle of valve work. Immediate isotahs for various elevations of the disk are presented. The comparison of jet flow over critical section is given. The data carried out by two numerical experiments are well correlated with each other. So, the inviscid model can be applied to the numerical modeling of the safety valve dynamic.
-
Быстрый метод анализа возмущения электромагнитного поля малыми сферическими рассеивателями
Компьютерные исследования и моделирование, 2020, т. 12, № 5, с. 1039-1050В данной работе рассматривается особая аппроксимация обобщенной формулы возмущения электромагнитного поля семейством электрически малых сферических неоднородностей. Задача, рассматриваемая в настоящей работе, возникает во множестве приложений технической электродинамики, радиолокации, подповерхностного зондирования и дефектоскопии. В общем случае она формулируются следующим образом: в некоторой точке возмущенного пространства необходимо определить амплитуду электромагнитного поля. Возмущение электромагнитных волн вызывается семейством электрически малых распределенных в пространстве рассеивателей. Источник электромагнитных волн располагается также в возмущенном пространстве. Задача решается введением допущения для дальнего поля рассеяния и через формулировку для эффективной поверхности рассеяния неоднородности. Это, в свою очередь, позволяет существенно убыстрить вычисления возмущенного электромагнитного поля семейством идентичных друг другу сферических неоднородностей с произвольными электрофизическими параметрами. Аппроксимация проверяется путем сравнения получаемых результатов с решением обобщенной формулы для возмущения электромагнитного поля. В данной работе рассматривается только прямая задача рассеяния, тем самым все параметры рассеивателей являются известными. В этом контексте можно утверждать, что формулировка соответствует корректно поставленной задаче и не подразумевает решение интегрального уравнения в обобщенной формуле. Одной из особенностью предложенного алгоритма является выделение характерной плоскости на границе пространства. Все точки наблюдения за состоянием системы принадлежат этой плоскости. Семейство рассеивателей располагается внутри области наблюдения, которая формируется этой поверхностью. Данный подход, кроме всего прочего, позволяет снять ряд ограничений на использование обобщенной формулировки для возмущенного электрического поля, например требование по удаленности неоднородностей друг от друга в пространстве распространения электромагнитных волн. Учет вклада каждого рассеивателя в семействе неоднородностей производится путем перехода к значениям их эффективных поверхностей рассеяния и дальнейшего их суммирования с учетом возникающих волновых эффектов, таких как интерференция и многократное отражение. В статье приводятся и описываются ограничения предложенного метода, а также рассматриваются возможные его модификации и дополнения.
Ключевые слова: малые возмущения, распространения электромагнитных волн, эффективная поверхность рассеяния, аппроксимация дальнего поля, численное интегрирование.
Fast method for analyzing the electromagnetic field perturbation by small spherical scatterer
Computer Research and Modeling, 2020, v. 12, no. 5, pp. 1039-1050In this work, we consider a special approximation of the general perturbation formula for the electromagnetic field by a set of electrically small inhomogeneities located in the domain of interest. The problem considered in this paper arises in many applications of technical electrodynamics, radar technologies and subsurface remote sensing. In the general case, it is formulated as follows: at some point in the perturbed domain, it is necessary to determine the amplitude of the electromagnetic field. The perturbation of electromagnetic waves is caused by a set of electrically small scatterers distributed in space. The source of electromagnetic waves is also located in perturbed domain. The problem is solved by introducing the far field approximation and through the formulation for the scatterer radar cross section value. This, in turn, allows one to significantly speed up the calculation process of the perturbed electromagnetic field by a set of a spherical inhomogeneities identical to each other with arbitrary electrophysical parameters. In this paper, we consider only the direct scattering problem; therefore, all parameters of the scatterers are known. In this context, it may be argued that the formulation corresponds to the well-posed problem and does not imply the solution of the integral equation in the generalized formula. One of the features of the proposed algorithm is the allocation of a characteristic plane at the domain boundary. All points of observation of the state of the system belong to this plane. Set of the scatterers is located inside the observation region, which is formed by this surface. The approximation is tested by comparing the results obtained with the solution of the general formula method for the perturbation of the electromagnetic field. This approach, among other things, allows one to remove a number of restrictions on the general perturbation formula for E-filed analysis.
-
Численное моделирование двумерных магнитных скирмионных структур
Компьютерные исследования и моделирование, 2020, т. 12, № 5, с. 1051-1061В данной работе с помощью алгоритма Метрополиса авторами были изучены магнитные системы, в которых из-за конкуренции между прямым гейзенберговским обменом и взаимодействием Дзялошинского–Мория возникают магнитные вихревые структуры — скирмионы.
В статье рассматриваются условия зарождения и стабильного существования магнитных скирмионов в двумерных магнитных пленках в рамках классической модели Гейзенберга. Изучена термическая стабильность скирмионов в магнитной пленке. Были рассмотрены процессы формирования различных состояний в изучаемой системе при варьировании величины внешнего магнитного поля, выделены различные фазы, в которые переходит система спинов Гейзенберга. Было выделено семь фаз: парамагнитная, спиральная, лабиринтная, спираль-скирмионная, скирмионная, скирмион-ферромагнитная и ферромагнитная фазы, подробный анализ конфигураций которых приводится в статье.
Построены две фазовые диаграммы: на первой показано поведение системы при постоянном $D$ в зависимости от величин внешнего магнитного поля и температуры: $(T, B)$, на второй — изменение кон- фигураций системы при постоянной температуре $T$ в зависимости от величины взаимодействия Дзялошинского–Мории и внешнего магнитного поля: $(D, B)$.
Полученные в ходе численных экспериментов данные будут использованы в дальнейших исследованиях при определении модельных параметров системы для формирования стабильного скирмионного состояния и разработки методов контроля скирмионов в магнитной пленке.
Ключевые слова: магнитный скирмион, модель Гейзенберга, алгоритм Метрополиса, фазовая диаграмма, высокопроизводительные вычисления.
Numerical simulation of two-dimensional magnetic skyrmion structures
Computer Research and Modeling, 2020, v. 12, no. 5, pp. 1051-1061Magnetic systems, in which due to competition between the direct Heisenberg exchange and the Dzyaloshinskii –Moriya interaction, magnetic vortex structures — skyrmions appear, were studied using the Metropolis algorithm.
The conditions for the nucleation and stable existence of magnetic skyrmions in two-dimensional magnetic films in the frame of the classical Heisenberg model were considered in the article. A thermal stability of skyrmions in a magnetic film was studied. The processes of the formation of various states in the system at different values of external magnetic fields were considered, various phases into which the Heisenberg spin system passes were recognized. The authors identified seven phases: paramagnetic, spiral, labyrinth, spiralskyrmion, skyrmion, skyrmion-ferromagnetic and ferromagnetic phases, a detailed analysis of the configurations is given in the article.
Two phase diagrams were plotted: the first diagram shows the behavior of the system at a constant $D$ depending on the values of the external magnetic field and temperature $(T, B)$, the second one shows the change of the system configurations at a constant temperature $T$ depending on the magnitude of the Dzyaloshinskii – Moriya interaction and external magnetic field: $(D, B)$.
The data from these numerical experiments will be used in further studies to determine the model parameters of the system for the formation of a stable skyrmion state and to develop methods for controlling skyrmions in a magnetic film.
-
Тензорные методы для сильно выпуклых сильно вогнутых седловых задач и сильно монотонных вариационных неравенств
Компьютерные исследования и моделирование, 2022, т. 14, № 2, с. 357-376В данной статье предлагаются методы оптимизации высокого порядка (тензорные методы) для решения двух типов седловых задач. Первый тип — это классическая мин-макс-постановка для поиска седловой точки функционала. Второй тип — это поиск стационарной точки функционала седловой задачи путем минимизации нормы градиента этого функционала. Очевидно, что стационарная точка не всегда совпадает с точкой оптимума функции. Однако необходимость в решении подобного типа задач может возникать в случае, если присутствуют линейные ограничения. В данном случае из решения задачи поиска стационарной точки двойственного функционала можно восстановить решение задачи поиска оптимума прямого функционала. В обоих типах задач какие-либо ограничения на область определения целевого функционала отсутствуют. Также мы предполагаем, что целевой функционал является $\mu$-сильно выпуклыми $\mu$-сильно вогнутым, а также что выполняется условие Липшица для его $p$-й производной.
Для задач типа «мин-макс» мы предлагаем два алгоритма. Так как мы рассматриваем сильно выпуклую и сильно вогнутую задачу, первый алгоритмиспо льзует существующий тензорный метод для решения выпуклых вогнутых седловых задач и ускоряет его с помощью техники рестартов. Таким образом удается добиться линейной скорости сходимости. Используя дополнительные предположения о выполнении условий Липшица для первой и второй производных целевого функционала, можно дополнительно ускорить полученный метод. Для этого можно «переключиться» на другой существующий метод для решения подобных задач в зоне его квадратичной локальной сходимости. Так мы получаем второй алгоритм, обладающий глобальной линейной сходимостью и локальной квадратичной сходимостью. Наконец, для решения задач второго типа существует определенная методология для тензорных методов в выпуклой оптимизации. Суть ее заключается в применении специальной «обертки» вокруг оптимального метода высокого порядка. Причем для этого условие сильной выпуклости не является необходимым. Достаточно лишь правильным образом регуляризовать целевой функционал, сделав его таким образом сильно выпуклым и сильно вогнутым. В нашей работе мы переносим эту методологию на выпукло-вогнутые функционалы и используем данную «обертку» на предлагаемом выше алгоритме с глобальной линейной сходимостью и локальной квадратичной сходимостью. Так как седловая задача является частным случаем монотонного вариационного неравенства, предлагаемые методы также подойдут для поиска решения сильно монотонных вариационных неравенств.
Ключевые слова: вариационное неравенство, седловая задача, гладкость высокого порядка, тензорные методы, минимизация нормы градиента.
Tensor methods for strongly convex strongly concave saddle point problems and strongly monotone variational inequalities
Computer Research and Modeling, 2022, v. 14, no. 2, pp. 357-376In this paper we propose high-order (tensor) methods for two types of saddle point problems. Firstly, we consider the classic min-max saddle point problem. Secondly, we consider the search for a stationary point of the saddle point problem objective by its gradient norm minimization. Obviously, the stationary point does not always coincide with the optimal point. However, if we have a linear optimization problem with linear constraints, the algorithm for gradient norm minimization becomes useful. In this case we can reconstruct the solution of the optimization problem of a primal function from the solution of gradient norm minimization of dual function. In this paper we consider both types of problems with no constraints. Additionally, we assume that the objective function is $\mu$-strongly convex by the first argument, $\mu$-strongly concave by the second argument, and that the $p$-th derivative of the objective is Lipschitz-continous.
For min-max problems we propose two algorithms. Since we consider strongly convex a strongly concave problem, the first algorithm uses the existing tensor method for regular convex concave saddle point problems and accelerates it with the restarts technique. The complexity of such an algorithm is linear. If we additionally assume that our objective is first and second order Lipschitz, we can improve its performance even more. To do this, we can switch to another existing algorithm in its area of quadratic convergence. Thus, we get the second algorithm, which has a global linear convergence rate and a local quadratic convergence rate.
Finally, in convex optimization there exists a special methodology to solve gradient norm minimization problems by tensor methods. Its main idea is to use existing (near-)optimal algorithms inside a special framework. I want to emphasize that inside this framework we do not necessarily need the assumptions of strong convexity, because we can regularize the convex objective in a special way to make it strongly convex. In our article we transfer this framework on convex-concave objective functions and use it with our aforementioned algorithm with a global linear convergence and a local quadratic convergence rate.
Since the saddle point problem is a particular case of the monotone variation inequality problem, the proposed methods will also work in solving strongly monotone variational inequality problems.
-
Анализ идентифицируемости математической модели пиролиза пропана
Компьютерные исследования и моделирование, 2021, т. 13, № 5, с. 1045-1057Работа посвящена численному моделированию и исследованию кинетической модели пиролиза пропана. Изучение кинетики реакций является необходимой стадией моделирования динамики газового потока в реакторе.
Кинетическая модель представляет собой нелинейную систему обыкновенных дифференциальных уравнений первого порядка с параметрами, роль которых играют константы скоростей стадий. Математическое моделирование процесса основано на использовании закона сохранения масс. Для решения исходной (прямой) задачи используется неявный метод решения жестких систем обыкновенных дифференциальных уравнений. Модель содержит 60 входных кинетических параметров и 17 выходных параметров, соответствующих веществам реакции, из которых наблюдаемыми являются только 9. В процессе решения задачи по оценке параметров (обратная задача) возникает вопрос неединственности набора параметров, удовлетворяющего имеющимся экспериментальным данным. Поэтому перед решением обратной задачи проводится оценка возможности определения параметров модели — анализ идентифицируемости.
Для анализа идентифицируемости мы используем ортогональный метод, который хорошо себя зарекомендовал для анализа моделей с большим числом параметров. Основу алгоритма составляет анализ матрицы чувствительно- сти методами дифференциальной и линейной алгебры, показывающей степень зависимости неизвестных параметров моделей от заданных измерений. Анализ чувствительности и идентифицируемости показал, что параметры модели устойчиво определяются по заданному набору экспериментальных данных. В статье представлен список параметров модели от наиболее идентифицируемого до наименее идентифицируемого. Учитывая анализ идентифицируемости математической модели, были введены более жесткие ограничения на поиск слабоидентифицируемых параметров при решении обратной задачи.
Обратная задача по оценке параметров была решена с использованием генетического алгоритма. В статье представлены найденные оптимальные значения кинетических параметров. Представлено сравнение экспериментальных и расчетных зависимостей концентраций пропана, основных и побочных продуктов реакции от температуры для разных расходов смеси. На основании соответствия полученных результатов физико-химическим законам и экспериментальным данным сделан вывод об адекватности построенной математической модели.
Ключевые слова: пиролиз пропана, математическая модель, химическая кинетика, анализ чувствительности, анализ идентифицируемости.
Analysis of the identifiability of the mathematical model of propane pyrolysis
Computer Research and Modeling, 2021, v. 13, no. 5, pp. 1045-1057The article presents the numerical modeling and study of the kinetic model of propane pyrolysis. The study of the reaction kinetics is a necessary stage in modeling the dynamics of the gas flow in the reactor.
The kinetic model of propane pyrolysis is a nonlinear system of ordinary differential equations of the first order with parameters, the role of which is played by the reaction rate constants. Math modeling of processes is based on the use of the mass conservation law. To solve an initial (forward) problem, implicit methods for solving stiff ordinary differential equation systems are used. The model contains 60 input kinetic parameters and 17 output parameters corresponding to the reaction substances, of which only 9 are observable. In the process of solving the problem of estimating parameters (inverse problem), there is a question of non-uniqueness of the set of parameters that satisfy the experimental data. Therefore, before solving the inverse problem, the possibility of determining the parameters of the model is analyzed (analysis of identifiability).
To analyze identifiability, we use the orthogonal method, which has proven itself well for analyzing models with a large number of parameters. The algorithm is based on the analysis of the sensitivity matrix by the methods of differential and linear algebra, which shows the degree of dependence of the unknown parameters of the models on the given measurements. The analysis of sensitivity and identifiability showed that the parameters of the model are stably determined from a given set of experimental data. The article presents a list of model parameters from most to least identifiable. Taking into account the analysis of the identifiability of the mathematical model, restrictions were introduced on the search for less identifiable parameters when solving the inverse problem.
The inverse problem of estimating the parameters was solved using a genetic algorithm. The article presents the found optimal values of the kinetic parameters. A comparison of the experimental and calculated dependences of the concentrations of propane, main and by-products of the reaction on temperature for different flow rates of the mixture is presented. The conclusion about the adequacy of the constructed mathematical model is made on the basis of the correspondence of the results obtained to physicochemical laws and experimental data.
-
Об ускоренных методах для седловых задач с композитной структурой
Компьютерные исследования и моделирование, 2023, т. 15, № 2, с. 433-467В данной работе рассматриваются сильно-выпукло сильно-вогнутые не билинейные седловые задачи с разными числами обусловленности по прямым и двойственным переменным. Во-первых, мы рассматриваем задачи с гладкими композитами, один из которых имеет структуру с конечной суммой. Для этой задачи мы предлагаем алгоритм уменьшения дисперсии с оценками сложности, превосходящими существующие ограничения в литературе. Во-вторых, мы рассматриваем седловые задачи конечной суммы с композитами и предлагаем несколько алгоритмов в зависимости от свойств составных членов. Когда составные члены являются гладкими, мы получаем лучшие оценки сложности, чем в литературе, включая оценки недавно предложенных почти оптимальных алгоритмов, которые не учитывают составную структуру задачи. Кроме того, наши алгоритмы позволяют разделить сложность, т. е. оценить для каждой функции в задаче количество вызовов оракула, достаточное для достижения заданной точности. Это важно, так как разные функции могут иметь разную арифметическую сложность оракула, а дорогие оракулы желательно вызывать реже, чем дешевые. Ключевым моментом во всех этих результатах является наша общая схема для седловых задач, которая может представлять самостоятельный интерес. Эта структура, в свою очередь, основана на предложенном нами ускоренном мета-алгоритме для композитной оптимизации с вероятностными неточными оракулами и вероятностной неточностью в проксимальном отображении, которые также могут представлять самостоятельный интерес.
Ключевые слова: седловая задача, минимаксная оптимизация, композитная оптимизация, ускоренные алгоритмы.
On Accelerated Methods for Saddle-Point Problems with Composite Structure
Computer Research and Modeling, 2023, v. 15, no. 2, pp. 433-467We consider strongly-convex-strongly-concave saddle-point problems with general non-bilinear objective and different condition numbers with respect to the primal and dual variables. First, we consider such problems with smooth composite terms, one of which has finite-sum structure. For this setting we propose a variance reduction algorithm with complexity estimates superior to the existing bounds in the literature. Second, we consider finite-sum saddle-point problems with composite terms and propose several algorithms depending on the properties of the composite terms. When the composite terms are smooth we obtain better complexity bounds than the ones in the literature, including the bounds of a recently proposed nearly-optimal algorithms which do not consider the composite structure of the problem. If the composite terms are prox-friendly, we propose a variance reduction algorithm that, on the one hand, is accelerated compared to existing variance reduction algorithms and, on the other hand, provides in the composite setting similar complexity bounds to the nearly-optimal algorithm which is designed for noncomposite setting. Besides, our algorithms allow one to separate the complexity bounds, i. e. estimate, for each part of the objective separately, the number of oracle calls that is sufficient to achieve a given accuracy. This is important since different parts can have different arithmetic complexity of the oracle, and it is desired to call expensive oracles less often than cheap oracles. The key thing to all these results is our general framework for saddle-point problems, which may be of independent interest. This framework, in turn is based on our proposed Accelerated Meta-Algorithm for composite optimization with probabilistic inexact oracles and probabilistic inexactness in the proximal mapping, which may be of independent interest as well.
-
Алгоритмическое построение явных численных схем и визуализация объектов и процессов в вычислительном эксперименте в гидромеханике
Компьютерные исследования и моделирование, 2015, т. 7, № 3, с. 767-774В работе рассматриваются проектные и поверочные этапы, в разработке сложных вычислительных алгоритмов для создания прямых вычислительных экспериментов в гидромеханике. В моделировании физических полей и нестационарных процессов механики сплошных сред желательно опираться на строгие правила конструирования числовых объектов и связанных с ними вычислительных алгоритмов. Синтез адаптивных числовых объектов и эффективных арифметико-логических операций может послужить оптимизации всей вычислительной задачи, при условии строго следования и соблюдения исходных законов гидромеханики. Возможность использования троичной логики позволяет разрешить некоторые противоречия функционального и декларативного программирования в реализации чисто прикладных задач механики. Аналогичные проектные решения приводят к новым численным схемам тензорной математики, которые позволяют оптимизировать эффективность и обосновывать корректность результатов моделирования. Наиболее важным следствием является возможность использования интерактивных графических методов для визуализации промежуточных результатов моделирования, а также для управляемого воздействия на ход вычислительного эксперимента под контролем инженеров аэрогидромехаников–исследователей.
Ключевые слова: тензорная математика, метод крупных частиц, гидромеханика, вычислительный эксперимент, проектное решение, поверочная задача.
Algorithmic construction of explicit numerical schemes and visualization of objects and processes in the computational experiment in fluid mechanics
Computer Research and Modeling, 2015, v. 7, no. 3, pp. 767-774Views (last year): 1.The paper discusses the design and verification stages in the development of complex numerical algorithms to create direct computational experiments in fluid mechanics. The modeling of physical fields and nonstationary processes of continuum mechanics, it is desirable to rely on strict rules of construction the numerical objects and related computational algorithms. Synthesis of adaptive the numerical objects and effective arithmetic- logic operations can serve to optimize the whole computing tasks, provided strict following and compliance with the original of the laws of fluid mechanics. The possibility of using ternary logic enables to resolve some contradictions of functional and declarative programming in the implementation of purely applied problems of mechanics. Similar design decisions lead to new numerical schemes tensor mathematics to help optimize effectiveness and validate correctness the simulation results. The most important consequence is the possibility of using interactive graphical techniques for the visualization of intermediate results of modeling, as well as managed to influence the course of computing experiment under the supervision of engineers aerohydrodynamics– researchers.
Indexed in Scopus
Full-text version of the journal is also available on the web site of the scientific electronic library eLIBRARY.RU
The journal is included in the Russian Science Citation Index
The journal is included in the RSCI
International Interdisciplinary Conference "Mathematics. Computing. Education"




