All issues
- 2024 Vol. 16
- 2023 Vol. 15
- 2022 Vol. 14
- 2021 Vol. 13
- 2020 Vol. 12
- 2019 Vol. 11
- 2018 Vol. 10
- 2017 Vol. 9
- 2016 Vol. 8
- 2015 Vol. 7
- 2014 Vol. 6
- 2013 Vol. 5
- 2012 Vol. 4
- 2011 Vol. 3
- 2010 Vol. 2
- 2009 Vol. 1
-
Обзор выпуклой оптимизации марковских процессов принятия решений
Компьютерные исследования и моделирование, 2023, т. 15, № 2, с. 329-353В данной статье проведен обзор как исторических достижений, так и современных результатов в области марковских процессов принятия решений (Markov Decision Process, MDP) и выпуклой оптимизации. Данный обзор является первой попыткой освещения на русском языке области обучения с подкреплением в контексте выпуклой оптимизации. Рассматриваются фундаментальное уравнение Беллмана и построенные на его основе критерии оптимальности политики — стратегии, принимающие решение по известному состоянию среды на данный момент. Также рассмотрены основные итеративные алгоритмы оптимизации политики, построенные на решении уравнений Беллмана. Важным разделом данной статьи стало рассмотрение альтернативы к подходу $Q$-обучения — метода прямой максимизации средней награды агента для избранной стратегии от взаимодействия со средой. Таким образом, решение данной задачи выпуклой оптимизации представимо в виде задачи линейного программирования. В работе демонстрируется, как аппарат выпуклой оптимизации применяется для решения задачи обучения с подкреплением (Reinforcement Learning, RL). В частности, показано, как понятие сильной двойственности позволяет естественно модифицировать постановку задачи RL, показывая эквивалентность между максимизацией награды агента и поиском его оптимальной стратегии. В работе также рассматривается вопрос сложности оптимизации MDP относительно количества троек «состояние–действие–награда», получаемых в результате взаимодействия со средой. Представлены оптимальные границы сложности решения MDP в случае эргодического процесса с бесконечным горизонтом, а также в случае нестационарного процесса с конечным горизонтом, который можно перезапускать несколько раз подряд или сразу запускать параллельно в нескольких потоках. Также в обзоре рассмотрены последние результаты по уменьшению зазора нижней и верхней оценки сложности оптимизации MDP с усредненным вознаграждением (Averaged MDP, AMDP). В заключение рассматриваются вещественнозначная параметризация политики агента и класс градиентных методов оптимизации через максимизацию $Q$-функции ценности. В частности, представлен специальный класс MDP с ограничениями на ценность политики (Constrained Markov Decision Process, CMDP), для которых предложен общий прямодвойственный подход к оптимизации, обладающий сильной двойственностью.
Ключевые слова: MDP, выпуклая оптимизация, $Q$-обучение, линейное программирование, методы градиента политики.
Survey of convex optimization of Markov decision processes
Computer Research and Modeling, 2023, v. 15, no. 2, pp. 329-353This article reviews both historical achievements and modern results in the field of Markov Decision Process (MDP) and convex optimization. This review is the first attempt to cover the field of reinforcement learning in Russian in the context of convex optimization. The fundamental Bellman equation and the criteria of optimality of policy — strategies based on it, which make decisions based on the known state of the environment at the moment, are considered. The main iterative algorithms of policy optimization based on the solution of the Bellman equations are also considered. An important section of this article was the consideration of an alternative to the $Q$-learning approach — the method of direct maximization of the agent’s average reward for the chosen strategy from interaction with the environment. Thus, the solution of this convex optimization problem can be represented as a linear programming problem. The paper demonstrates how the convex optimization apparatus is used to solve the problem of Reinforcement Learning (RL). In particular, it is shown how the concept of strong duality allows us to naturally modify the formulation of the RL problem, showing the equivalence between maximizing the agent’s reward and finding his optimal strategy. The paper also discusses the complexity of MDP optimization with respect to the number of state–action–reward triples obtained as a result of interaction with the environment. The optimal limits of the MDP solution complexity are presented in the case of an ergodic process with an infinite horizon, as well as in the case of a non-stationary process with a finite horizon, which can be restarted several times in a row or immediately run in parallel in several threads. The review also reviews the latest results on reducing the gap between the lower and upper estimates of the complexity of MDP optimization with average remuneration (Averaged MDP, AMDP). In conclusion, the real-valued parametrization of agent policy and a class of gradient optimization methods through maximizing the $Q$-function of value are considered. In particular, a special class of MDPs with restrictions on the value of policy (Constrained Markov Decision Process, CMDP) is presented, for which a general direct-dual approach to optimization with strong duality is proposed.
-
Модель установившегося течения реки в поперечном сечении изогнутого русла
Компьютерные исследования и моделирование, 2024, т. 16, № 5, с. 1163-1178Моделирование русловых процессов при исследовании береговых деформаций русла требует вычисления параметров гидродинамического потока, учитывающих существование вторичных поперечных течений, формирующихся на закруглении русла. Трехмерное моделирование таких процессов на текущий момент возможно только для небольших модельных каналов, для реальных речных потоков необходимы модели пониженной размерности. При этом редукция задачи от трехмерной модели движения речного потока к двумерной модели потока в плоскости створа канала предполагает, что рассматриваемый гидродинамический поток является квазистационарным, и для него выполнены гипотезы об асимптотическом поведении потока по потоковой координате створа. С учетом данных ограничений в работе сформулирована математическая модель задачи о движении стационарного турбулентного спокойного речного потока в створе канала. Задача сформулирована в смешанной постановке скорости — «вихрь – функция тока». В качестве дополнительных условий для редукции задачи требуется задание граничных условий на свободной поверхности потока для поля скорости, определяемого в нормальном и касательном направлении к оси створа. Предполагается, что значения данных скоростей должны быть определены из решения вспомогательных задач или получены из данных натурных или экспериментальных измерений.
Для решения сформулированной задачи используется метод конечных элементов в формулировке Петрова – Галёркина. Получен дискретный аналог задачи и предложен алгоритм ее решения. Выполненные численные исследования показали в целом хорошую согласованность полученных решений при их сравнении с известными экспериментальными данными.
Полученные погрешности авторы связывают с необходимостью более точного определения циркуляционного поля скоростей в створе потока путем подбора и калибровки более подходящей модели вычисления турбулентной вязкости и граничных условий на свободной границе створа.
Model of steady river flow in the cross section of a curved channel
Computer Research and Modeling, 2024, v. 16, no. 5, pp. 1163-1178Modeling of channel processes in the study of coastal channel deformations requires the calculation of hydrodynamic flow parameters that take into account the existence of secondary transverse currents formed at channel curvature. Three-dimensional modeling of such processes is currently possible only for small model channels; for real river flows, reduced-dimensional models are needed. At the same time, the reduction of the problem from a three-dimensional model of the river flow movement to a two-dimensional flow model in the cross-section assumes that the hydrodynamic flow under consideration is quasi-stationary and the hypotheses about the asymptotic behavior of the flow along the flow coordinate of the cross-section are fulfilled for it. Taking into account these restrictions, a mathematical model of the problem of the a stationary turbulent calm river flow movement in a channel cross-section is formulated. The problem is formulated in a mixed formulation of velocity — “vortex – stream function”. As additional conditions for problem reducing, it is necessary to specify boundary conditions on the flow free surface for the velocity field, determined in the normal and tangential direction to the cross-section axis. It is assumed that the values of these velocities should be determined from the solution of auxiliary problems or obtained from field or experimental measurement data.
To solve the formulated problem, the finite element method in the Petrov – Galerkin formulation is used. Discrete analogue of the problem is obtained and an algorithm for solving it is proposed. Numerical studies have shown that, in general, the results obtained are in good agreement with known experimental data. The authors associate the obtained errors with the need to more accurately determine the circulation velocities field at crosssection of the flow by selecting and calibrating a more appropriate model for calculating turbulent viscosity and boundary conditions at the free boundary of the cross-section.
-
Моделирование предкрахового поведения цен на иерархически организованном финансовом рынке
Компьютерные исследования и моделирование, 2011, т. 3, № 2, с. 215-222Рассматривается иерархическая модель, предложенная Джохансеном и Сорнеттом, описывающая механизм возникновения логопериодических колебаний, предшествующих финансовым крахам, и проводится ее численный анализ. Предлагаются обобщения данной модели на основе введения зависимость степени влияния агентов друг на друга от ультраметрического расстояния между ними. Наибольшее внимание уделяется вопросу об универсальности критической точки, который исследуется с помощью построения распределений точек краха при различном числе агентов.
Ключевые слова: математическое моделирование, логопериодические колебания и степенной рост, ультраметрическое расстояние, иерархические структуры, финансовые крахи.
Modeling the behavior proceeding market crash in a hierarchically organized financial market
Computer Research and Modeling, 2011, v. 3, no. 2, pp. 215-222Views (last year): 1.We consider the hierarchical model of financial crashes introduced by A. Johansen and D. Sornette which reproduces the log-periodic power law behavior of the price before the critical point. In order to build the generalization of this model we introduce the dependence of an influence exponent on an ultrametric distance between agents. Much attention is being paid to a problem of critical point universality which is investigated by comparison of probability density functions of the crash times corresponding to systems with various total numbers of agents.
-
Система хранения профилей физических свойств ДНК на примере промоторов Escherichia coli
Компьютерные исследования и моделирование, 2013, т. 5, № 3, с. 443-450В данной работе нами представлена база данных, спроектированная для хранения профилей физических свойств вдоль двойной спирали ДНК, и продемонстрировано ее использование для хранения, поиска и анализа промоторных последовательностей E. coli. Отличительным свойством предложенной базы данных является то, что весь профиль хранится как единый объект, который с точки зрения СУБД полностью подобен строке или числу. Такие объекты СУБД может сравнивать друг с другом и осуществлять быструю выборку на основании индексов. В базу данных загружена информация о 1227 известных промоторах. Для каждого промотора сохранена нуклеотидная последовательность, а также вычислен и загружен в базу профиль электростатического потенциала промоторной ДНК. Кроме того, каждый промотор связан с генами, транскипцию которых он регулирует, а также с записями о сайтах посадки транскрипционных факторов, влияющих на функционирование промотора. Организован доступ к базе данных через интернет; исходные коды доступны для скачивания, а содержимое базы данных может быть выслано авторами по запросу.
System to store DNA physical properties profiles with application to the promoters of Escherichia coli
Computer Research and Modeling, 2013, v. 5, no. 3, pp. 443-450Views (last year): 3.Database to store, search and retrieve DNA physical properties profiles has been developed and its use for analysis of E. coli promoters has been demonstrated. Unique feature of the database is in its ability to handle whole profile as single internal object type in a way similar to integers or character strings. To demonstrate utility of such database it was populated with data of 1227 known promoters, their nucleotide sequence, profile of electrostatic potential, transcription factor binding sites. Each promoter is also connected to all genes, whose transcription is controlled by that promoter. Content of the database is available for search via web interface. Source code of profile datatype and library to work with it from R/Bioconductor are available from the internet, dump of the database is available from authors by request.
-
Оптимизационный подход к имитационному моделированию микроструктур
Компьютерные исследования и моделирование, 2013, т. 5, № 4, с. 597-606В работе предложен оптимизационный подход к имитационному моделированию микроструктур. Решены задачи оптимизации функции пористости, поиска оптимальной модели гранулометрического состава и введен критерий качества моделирования. Проведена проверка адекватности предложенных методов на примерах и предложена регрессионная модель качества имитационного моделирования микроструктур. Актуальным приложением предложенного подхода является задача 3D-реконструкции микроструктуры керна. Полученные результаты дают основания для продолжения исследований в выбранном направлении.
Ключевые слова: имитационное моделирование микроструктур, плотная упаковка, оптимизация, 3D-реконструкция.
The optimization approach to simulation modeling of microstructures
Computer Research and Modeling, 2013, v. 5, no. 4, pp. 597-606Views (last year): 4. Citations: 7 (RSCI).The paper presents an optimization approach to microstructure simulation. Porosity function was optimized by numerical method, grain-size model was optimized by complex method based on criteria of model quality. Methods have been validated on examples. Presented new regression model of model quality. Actual application of proposed method is 3D reconstruction of core sample microstructure. Presented results suggest to prolongation of investigations.
-
Компьютерное моделирование разгона гироскопического стабилизатора для расточной головки
Компьютерные исследования и моделирование, 2014, т. 6, № 4, с. 569-575В статье приведена конструктивная схема предложенного устройства гироскопической стабилизации расточной головки. Описана компьютерная модель гидрореактивного гироскопа этого устройства, постановка задачи компьютерного моделирования и его результаты.
Ключевые слова: обработка глубоких отверстий, устройство стабилизации расточного инструмента.
Computer Simulation of the Acceleration of the Gyroscopic Device for Boring Head’s Position Stabilization
Computer Research and Modeling, 2014, v. 6, no. 4, pp. 569-575Given paper covers the structure of the introduced device stabilizing the boring tool. The computer model of the hydrojet gyroscopic device is described; problem definition and the results of simulation are given.
Keywords: deep hole boring, tool’s position stabilizing device.Views (last year): 1. Citations: 1 (RSCI). -
Молекулярная модель образования комплекса ОСР с фикобилисомой
Компьютерные исследования и моделирование, 2014, т. 6, № 5, с. 761-774Построена молекулярная модель взаимодействия фикобилисомыс ОСР, белком-тушителем, регулирующим передачу энергии от фикобилисом к фотосистемам в пигментном аппарате цианобактерий. Полученная модель не требует нарушения известной по рентгеноструктурным данным пространственной структуры взаимодействующих белков, а также позволяет удовлетворительно описать процесс переноса энергии к ОСР от фикобилисомы. Методом MM–PBSA рассчитана свободная энергия образования комплекса. Показано, что свободная энергия имеет величину не более нескольких десятков кДж/моль, что хорошо согласуется с наблюдаемой в эксперименте небольшой устойчивостью комплекса. Показано, что удельная свободная энергия взаимодействия рассматриваемых в модели весьма гидрофильных белков друг с другом примерно в два раза превышает удельную энергию их взаимодействия с водой, что свидетельствует о высокой комплементарности контактирующих белковых поверхностей и является сильным аргументом в пользу предложенной модели.
Ключевые слова: фикобилисома, OCP, комплексоообразование, молекулярное моделирование, свободная энергия, MM–PBSA.
Molecular model of OCP-phycobilisome complex formation
Computer Research and Modeling, 2014, v. 6, no. 5, pp. 761-774A molecular model of phicobilisome complex with a quenching protein OCP which regulates the energy transfer from phicobilisome to photosystem in photosynthetic apparatus of cyanobacteria has been developed. In the model obtained a well known spatial structure of interacting proteins remains intact and also the energy transfer from phycobilisome to OCP with reasonable rates is possible. Free energy of complex formation was calculated using MM–PBSA approach. By the order of magnitude this energy is about tens of kJ/mole. This value correlates well with experimental observed low stability of this complex. The specific surface energy of interaction between hydrophylic phicobilisome and OCP is twice larger than specific surface energy of their interaction with water. This reflects a high molecular complementary of interacting protein surfaces and is a strong pro argument for proposed model.
-
Метод расчета электрических свойств насыщенных горных пород, учитывающий поверхностную проводимость
Компьютерные исследования и моделирование, 2015, т. 7, № 5, с. 1081-1088Предложен новый эффективный численный метод расчета электрических свойств горных пород с двухфазным насыщением типа «нефть–вода». Метод позволяет учитывать влияние поверхностной проводимости двойных электрических слоев, возникающих на контакте скелета породы с водным раствором в поровом пространстве. В основе метода лежит задача нахождения распределения электрического потенциала в трехмерной цифровой модели пористой среды высокого разрешения. Цифровая модель воспроизводит пространственную структуру поровых каналов на микроуровне и содержит элементы сетки объемного и поверхностного типов. Результаты расчетов показывают важность учета поверхностной проводимости.
Ключевые слова: цифровая модель, численное моделирование, электромагнитные свойства, объемная проводимость, поверхностная проводимость.
Numerical simulation of electromagnetic properties of the saturated rock media with surface conductivity effects
Computer Research and Modeling, 2015, v. 7, no. 5, pp. 1081-1088Views (last year): 4. Citations: 1 (RSCI).New numerical simulation technique to calculate electrical properties of rocks with two-phase “oil– water” saturation is proposed. This technique takes into account surface conductivity of electrical double layers at the contact between solid rock and aqueous solution inside pore space. The numerical simulation technique is based on acquiring of electrical potential distribution in high-resolution three-dimensional digital model of porous medium. The digital model incorporates the spatial geometry of pore channels and contains bulk and surface grid cells. Numerical simulation results demonstrate the importance of surface conductivity effects.
-
Секционная модель несвободного роста дерева
Компьютерные исследования и моделирование, 2016, т. 8, № 2, с. 307-322Представлена трехмерная секционная модель динамики биомассы дерева, растущего на ограниченной территории. Структура трехмерного дерева состоит из секций, периодически возникающих на макушке дерева и одновременно дающих начало виртуальным «деревьям», последовательно вложенным в своих предшественников. Зеленая биомасса секций есть разность смежных виртуальных деревьев. Секции имеют динамику, отличную от динамики самого дерева, и их биомасса со временем постепенно отмирает (в том числе и в условиях свободного роста дерева), что объясняет оголение ствола снизу. В 3D-модели динамики биомассы несвободно растущего дерева для описания динамики биомассы секций и составляющих их секторов используются уравнения, аналогичные предложенным для 2D-модели дерева. Представлены примеры динамики биомассы секторов, секций и дерева. Динамика годографов азимутального распределения биомассы секции демонстрирует, что нижние секции дерева, растущего на ограниченной территории, находятся в угнетении и отмирают (более быстро по сравнению с моделью свободно растущего дерева), а на макушке дерева появляются и растут свободно новые секции. В результате вверх по стволу двигается волна биомассы дерева.
Ключевые слова: двумерная модель, динамика биомассы, несвободно растущее дерево, секционная модель, конкуренция в сообществе.
Sectional model of non-free tree growth
Computer Research and Modeling, 2016, v. 8, no. 2, pp. 307-322Views (last year): 1. Citations: 1 (RSCI).The three-dimensional model of biomass dynamics of a tree growing on a limited territory presented. The tree consists of structural sections periodically arising on its top. Each section generates a virtual "tree". Adjacent virtual trees are nested each other and their difference is the section. Sections have biomass dynamics which differs from the dynamics of the tree and gradually die off (including in course of the free growth of the tree), giving effect denudation of trunk from bottom. This is observed in nature. The 3D-model of biomass dynamics of a tree, growing in a limited area, for describing the biomass dynamics of sections and their constituent sectors uses equations similar to those proposed earlier for the 2D-tree model. Examples of biomass dynamics of sectors, sections and tree obtained using the developed model are presented. The dynamics of the hodographs of the azimuthal biomass distribution of sections demonstrates that the lower sections of a tree growing in a limited area, are in oppression and die (more quickly compared with the model of freely growing tree), and new sections on top of the tree appear and grow freely. As a result, "wave" of tree biomass runs up the trunk.
-
Использование сверточных нейронных сетей для прогнозирования скоростей транспортного потока на дорожном графе
Компьютерные исследования и моделирование, 2018, т. 10, № 3, с. 359-367Краткосрочное прогнозирование потока трафика является однойиз основных задач моделирования транспортных систем, основное назначение которой — контроль дорожного движения, сообщение об авариях, избежание дорожных пробок за счет знания потока трафика и последующего планирования транспортировки. Существует два типа подходов для решения этой задачи: математическое моделирование трафика и модель с использованием количественных данных трафика. Тем не менее большинство пространственно-временных моделейст радают от высокой математической сложности и низкой эффективности. Искусственные нейронные сети, один из видных подходов второго типа, показывают обещающие результаты в моделировании динамики транспортнойс ети. В данной работе представлена архитектура нейронной сети, используемойдля прогнозирования скоростейт ранспортного потока на графе дорожной сети. Модель основана на объединении рекуррентнойней ронной сети и сверточнойней ронной сети на графе, где рекуррентная нейронная сеть используется для моделирования временных зависимостей, а сверточная нейронная сеть — для извлечения пространственных свойств из трафика. Для получения предсказанийна несколько шагов вперед используется архитектура encoder-decoder, позволяющая уменьшить накопление шума из-за неточных предсказаний. Для моделирования сложных зависимостей мы используем модель, состоящую из нескольких слоев. Нейронные сети с глубокойархитек туройсло жны для тренировки; для ускорения процесса тренировки мы используем skip-соединения между каждым слоем, так что каждыйслой учит только остаточную функцию по отношению к предыдущему слою. Полученная объединенная нейронная сеть тренировалась на необработанных данных с сенсоров транспортного потока из сети шоссе в США с разрешением в 5 минут. 3 метрики — средняя абсолютная ошибка, средняя относительная ошибка, среднеквадратическая ошибка — использовались для оценки качества предсказания. Было установлено, что по всем метрикам предложенная модель имеет более низкую погрешность предсказания по сравнению с ранее опубликованными моделями, такими как Vector Auto Regression, Long Short-Term Memory и Graph Convolution GRU.
Traffic flow speed prediction on transportation graph with convolutional neural networks
Computer Research and Modeling, 2018, v. 10, no. 3, pp. 359-367Views (last year): 36.The short-term prediction of road traffic condition is one of the main tasks of transportation modelling. The main purpose of which are traffic control, reporting of accidents, avoiding traffic jams due to knowledge of traffic flow and subsequent transportation planning. A number of solutions exist — both model-driven and data driven had proven to be successful in capturing the dynamics of traffic flow. Nevertheless, most space-time models suffer from high mathematical complexity and low efficiency. Artificial Neural Networks, one of the prominent datadriven approaches, show promising performance in modelling the complexity of traffic flow. We present a neural network architecture for traffic flow prediction on a real-world road network graph. The model is based on the combination of a recurrent neural network and graph convolutional neural network. Where a recurrent neural network is used to model temporal dependencies, and a convolutional neural network is responsible for extracting spatial features from traffic. To make multiple few steps ahead predictions, the encoder-decoder architecture is used, which allows to reduce noise propagation due to inexact predictions. To model the complexity of traffic flow, we employ multilayered architecture. Deeper neural networks are more difficult to train. To speed up the training process, we use skip-connections between each layer, so that each layer teaches only the residual function with respect to the previous layer outputs. The resulting neural network was trained on raw data from traffic flow detectors from the US highway system with a resolution of 5 minutes. 3 metrics: mean absolute error, mean relative error, mean-square error were used to estimate the quality of the prediction. It was found that for all metrics the proposed model achieved lower prediction error than previously published models, such as Vector Auto Regression, LSTM and Graph Convolution GRU.
Indexed in Scopus
Full-text version of the journal is also available on the web site of the scientific electronic library eLIBRARY.RU
The journal is included in the Russian Science Citation Index
The journal is included in the RSCI
International Interdisciplinary Conference "Mathematics. Computing. Education"