Результаты поиска по 'нестационарная задача':
Найдено статей: 56
  1. Данная работа рассматривает задачу оптимального управления гальваническим процессом в многоанодной ванне. Построена нестационарная математическая модель гальванического процесса, которая учитывает изменения концентрации компонентов электролита. Продемонстрировано обоснование выбора вида управляющих экстремалей на примере гальванического процесса хромирования в стандартном электролите.

    This work considers the problem of optimal control galvanic process in multianode bath. The nonstationary mathematical model of galvanic process, which considers change concentrations of electrolyte components, is developed. Demonstrated rationale for the choice of the form to extremal control on example chrome galvanic process in the standard electrolyte.

    Views (last year): 4. Citations: 4 (RSCI).
  2. Русяк И.Г., Ермолаев М.А.
    К вопросу о решении сопряженной задачи газовой динамики, воспламенения и горения порохов в условиях артиллерийского выстрела
    Компьютерные исследования и моделирование, 2014, т. 6, № 1, с. 99-106

    Рассмотрен численный алгоритм решения задачи воспламенения и нестационарного горения порохов на равномерной расчетной сетке, а также на сетке со сгущением вблизи поверхности горения при постоянной и подстраивающейся под глубину прогретого слоя области расчета. Приведен анализ эффективности рассмотренных расчетных сеток.

    Rusyak I.G., Ermolaev M.A.
    On the solution of the adjoint problem of gas dynamics, ignition and combustion of gunpowder in terms of artillery shot
    Computer Research and Modeling, 2014, v. 6, no. 1, pp. 99-106

    This article is dedicated to numerical algorithms for solving problems of ignition and unsteady combustion of gunpowder on a uniform computational grid, and a grid with concentration near the surface of the combustion at a constant and adapts the depth under the heated layer of computational domain. The analysis of efficiency of a numerical grid.

    Views (last year): 4. Citations: 3 (RSCI).
  3. Гибанов Н.С., Шеремет М.А.
    Влияние формы и размеров локального источника энергии на режимы конвективного теплопереноса в квадратной полости
    Компьютерные исследования и моделирование, 2015, т. 7, № 2, с. 271-280

    Проведен численный анализ влияния формы и размеров локального источника постоянной температуры на нестационарные режимы термогравитационной конвекции в квадратной полости с изотермическими вертикальными стенками. Рассматривался источник энергии прямоугольной, треугольной и трапециевидной формы. Краевая задача, сформулированная в безразмерных преобразованных переменных «функция тока – завихренность скорости – температура» в приближении Буссинеска, была реализована численно методом конечных разностей. Получены распределения изолиний функции тока и температуры, а также временные зависимости для среднего числа Нуссельта на поверхности источника энергии в широком диапазоне изменения определяющих параметров.

    Gibanov N.S., Sheremet M.A.
    Effect of shape and sizes of a local heat source on convective heat transfer in a square cavity
    Computer Research and Modeling, 2015, v. 7, no. 2, pp. 271-280

    Numerical analysis of the effects of the local heat source shape on transient natural convection in a square enclosure has been carried out. The local heat source has rectangular, triangular and trapezoidal shape. The boundary value problem formulated in the dimensionless variables such as stream function, vorticity and temperature by using the Boussinesq approximation has been solved by means of finite difference method. Distributions of streamlines and isotherms and time dependences for the average Nusselt number along the heat source surface in a wide range of governing parameters have been obtained.

    Views (last year): 5. Citations: 7 (RSCI).
  4. Горшков А.В., Просвиряков Е.Ю.
    Слоистая конвекция Бенара–Марангони при теплообмене по закону Ньютона–Рихмана
    Компьютерные исследования и моделирование, 2016, т. 8, № 6, с. 927-940

    В работе осуществлено математическое моделирование нестационарной слоистой конвекции Бенара–Марангони вязкой несжимаемой жидкости. Движение жидкости происходит в бесконечно протяженном слое. Система Обербека–Буссинеска, описывающая слоистую конвекцию Бенара–Марангони, является переопределенной, поскольку вертикальная скорость тождественно равна нулю. Для вычисления двух компонент вектора скорости, температурыи давления имеется система пяти уравнений (три уравнения сохранения импульсов, уравнение несжимаемости и уравнение теплопроводности). Для разрешимости системы Обербека–Буссинеска предложен класс точных решений. Структура предложенного решения такова, что уравнение несжимаемости удовлетворяется тождественно. Таким образом, удается устранить «лишнее» уравнение. Основное внимание уделено исследованию теплообмена на свободной границе слоя, которая считается недеформируемой. При описании термокапиллярного конвективного движения теплообмен задавался согласно закону Ньютона–Рихмана. Использование такого закона распространения тепла приводит к начально-краевой задаче третьего рода. Показано, что переопределенная начально-краевая задача в рамках представленного в статье класса точных решений уравнений Обербека–Буссинеска сводится к проблеме Штурма–Лиувилля. Следовательно, гидродинамические поля выражаются через тригонометрические функции (базис Фурье). Для определения собственных чисел задачи получено трансцендентное уравнение, которое решалось численно. Проведен численный анализ решений системы эволюционных и градиентных уравнений, описывающих течение жидкости. На основании вычислительного эксперимента проведен анализ гидродинамических полей. При исследовании краевой задачи было показано существование противотечений в слое жидкости. Существование противотечений эквивалентно наличию застойных точек в жидкости, что говорит о существовании локального экстремума кинетической энергии жидкости. Установлено, что у каждой компонентыск орости может быть не более одного нулевого значения. Таким образом, поток жидкости расслаивается на две зоны. В этих зонах касательные напряжения разного знака. Причем существует толщина слоя жидкости, при которой на нижней границе слоя жидкости касательные напряжения равны нулю. Данный физический эффект возможен только для классических ньютоновских жидкостей. Для поля температурыи давления справедливы те же свойства, что и для скоростей. Отметим, что в данном случае все нестационарные решения выходят на установившийся режим.

    Gorshkov A.V., Prosviryakov Y.Y.
    Layered Bénard–Marangoni convection during heat transfer according to the Newton’s law of cooling
    Computer Research and Modeling, 2016, v. 8, no. 6, pp. 927-940

    The paper considers mathematical modeling of layered Benard–Marangoni convection of a viscous incompressible fluid. The fluid moves in an infinitely extended layer. The Oberbeck–Boussinesq system describing layered Benard–Marangoni convection is overdetermined, since the vertical velocity is zero identically. We have a system of five equations to calculate two components of the velocity vector, temperature and pressure (three equations of impulse conservation, the incompressibility equation and the heat equation). A class of exact solutions is proposed for the solvability of the Oberbeck–Boussinesq system. The structure of the proposed solution is such that the incompressibility equation is satisfied identically. Thus, it is possible to eliminate the «extra» equation. The emphasis is on the study of heat exchange on the free layer boundary, which is considered rigid. In the description of thermocapillary convective motion, heat exchange is set according to the Newton’s law of cooling. The application of this heat distribution law leads to the third-kind initial-boundary value problem. It is shown that within the presented class of exact solutions to the Oberbeck–Boussinesq equations the overdetermined initial-boundary value problem is reduced to the Sturm–Liouville problem. Consequently, the hydrodynamic fields are expressed using trigonometric functions (the Fourier basis). A transcendental equation is obtained to determine the eigenvalues of the problem. This equation is solved numerically. The numerical analysis of the solutions of the system of evolutionary and gradient equations describing fluid flow is executed. Hydrodynamic fields are analyzed by a computational experiment. The existence of counterflows in the fluid layer is shown in the study of the boundary value problem. The existence of counterflows is equivalent to the presence of stagnation points in the fluid, and this testifies to the existence of a local extremum of the kinetic energy of the fluid. It has been established that each velocity component cannot have more than one zero value. Thus, the fluid flow is separated into two zones. The tangential stresses have different signs in these zones. Moreover, there is a fluid layer thickness at which the tangential stresses at the liquid layer equal to zero on the lower boundary. This physical effect is possible only for Newtonian fluids. The temperature and pressure fields have the same properties as velocities. All the nonstationary solutions approach the steady state in this case.

    Views (last year): 10. Citations: 3 (RSCI).
  5. Сорокин К.Э., Бывальцев П.М., Аксенов А.А., Жлуктов С.В., Савицкий Д.В., Бабулин А.А., Шевяков В.И.
    Численное моделирование обледенения в программном комплексе FlowVision
    Компьютерные исследования и моделирование, 2020, т. 12, № 1, с. 83-96

    Процедура сертификации самолетов транспортной категории для полетов в условиях обледенения требует проведения расчетов форм и размеров ледяных наростов, образующихся на поверхностях самолетов в различные моменты времени. В настоящее время отсутствует программный продукт российской разработки, предназначенный для численного моделирования обледенения, признанный российскими сертификационными органами. В данной работе описывается методика расчета обледенения самолетов IceVision, созданная на базе программного комплекса FlowVision.

    Главное отличие методики IceVision от известных подходов заключается в использовании технологии Volume Of Fluid (VOF — объем жидкости в ячейке) для отслеживания нарастания льда. В этой методике решается нестационарная задача непрерывного нарастания льда в эйлеровой постановке. Лед присутствует в расчетной области явно, в нем решается уравнение теплопереноса. В других (известных из литературы) подходах изменение формы льда учитывается путем модификации аэродинамической поверхности с использованием лагранжевой сетки, а для учета теплоотдачи в лед используется некоторая эмпирическая модель.

    Реализованная во FlowVision математическая модель предполагает возможность моделирования сухого и влажного режимов обледенения. Модель автоматически определяет зоны сухого и влажного льда. В сухой зоне температура контактной поверхности определяется с учетом сублимации льда и теплопереноса во льду. Во влажной зоне учитывается течение водяной пленки по поверхности льда. Пленка замерзает за счет испарения, теплоотдачи в лед и в воздух. Методика IceVision учитывает отрыв пленки. Для моделирования двухфазного течения воздуха и капель используется многоскоростная модель взаимопроникающих континуумов в рамках эйлерова подхода. Методика IceVision учитывает распределение капель по размерам. Численный алгоритм учитывает существенное различие временных масштабов физических процессов, сопровождающих обледенение самолета: двухфазного внешнего течения (воздуха и капель), течения водяной пленки, роста льда. В работе приводятся результаты решения тестовых задач, демонстрирующие эффективность методики IceVision и достоверность результатов FlowVision.

    Sorokin K.E., Byvaltsev P.M., Aksenov A.A., Zhluktov S.V., Savitskiy D.V., Babulin A.A., Shevyakov V.I.
    Numerical simulation of ice accretion in FlowVision software
    Computer Research and Modeling, 2020, v. 12, no. 1, pp. 83-96

    Certifying a transport airplane for the flights under icing conditions requires calculations aimed at definition of the dimensions and shapes of the ice bodies formed on the airplane surfaces. Up to date, software developed in Russia for simulation of ice accretion, which would be authorized by Russian certifying supervisory authority, is absent. This paper describes methodology IceVision recently developed in Russia on the basis of software FlowVision for calculations of ice accretion on airplane surfaces.

    The main difference of methodology IceVision from the other approaches, known from literature, consists in using technology Volume Of Fluid (VOF — volume of fluid in cell) for tracking the surface of growing ice body. The methodology assumes solving a time-depended problem of continuous grows of ice body in the Euler formulation. The ice is explicitly present in the computational domain. The energy equation is integrated inside the ice body. In the other approaches, changing the ice shape is taken into account by means of modifying the aerodynamic surface and using Lagrangian mesh. In doing so, the heat transfer into ice is allowed for by an empirical model.

    The implemented mathematical model provides capability to simulate formation of rime (dry) and glaze (wet) ice. It automatically identifies zones of rime and glaze ice. In a rime (dry) ice zone, the temperature of the contact surface between air and ice is calculated with account of ice sublimation and heat conduction inside the ice. In a glaze (wet) ice zone, the flow of the water film over the ice surface is allowed for. The film freezes due to evaporation and heat transfer inside the air and the ice. Methodology IceVision allows for separation of the film. For simulation of the two-phase flow of the air and droplets, a multi-speed model is used within the Euler approach. Methodology IceVision allows for size distribution of droplets. The computational algorithm takes account of essentially different time scales for the physical processes proceeding in the course of ice accretion, viz., air-droplets flow, water flow, and ice growth. Numerical solutions of validation test problems demonstrate efficiency of methodology IceVision and reliability of FlowVision results.

  6. Назаров В.Г., Прохоров И.В., Яровенко И.П.
    Идентификация неоднородного вещества методами импульсной мультиэнергетической томографии
    Компьютерные исследования и моделирование, 2025, т. 17, № 4, с. 621-639

    В статье рассматриваются математические аспекты проблемы идентификации многокомпонентной рассеивающей среды по данным импульсного мультиэнергетического рентгеновского облучения. Задачи рентгеновской диагностики представляют значительный интерес как с теоретической, так и с практической точки зрения, а радиографические методыне заменимы при неразрушающем контроле изделий.

    В рамках математической модели на основе нестационарного интегро-дифференциального уравнения переноса излучения сформулированы обратная задача нахождения коэффициента ослабления по излучению, известному на границе области, и задача идентификации вещества по найденным значениям коэффициента ослабления на дискретном наборе энергий облучения среды. Проведена предварительная обработка широкого списка веществ, представляющих интерес в компьютерной томографии, на предмет возможности их идентификации по приближенно заданному коэффициенту ослабления излучения, характеризующему среду. При анализе степени близости веществ в некоторой норме установлено, что множество всех возможных веществ, потенциально содержащихся в среде, распадается на конечное число непересекающихся кластеров. При достаточно малой длительности зондирующего сигнала рассеивающая составляющая выходящего из среды излучения асимптотически мала. Это обстоятельство позволяет свести обратную задачу для уравнения переноса излучения к задаче обращения преобразования Радона от коэффициента ослабления. Методами численного моделирования на специально разработанном цифровом фантоме анализируется возможность однозначной или частичной идентификации вещества при варьировании длительности зондирующего импульса и числа энергетических уровней облучения среды.

    Nazarov V.G., Prokhorov I.V., Yarovenko I.P.
    Identification of inhomogeneous matter by pulsed multienergy tomography methods
    Computer Research and Modeling, 2025, v. 17, no. 4, pp. 621-639

    The article considers the mathematical aspects of the problem of identifying a multicomponent scattering medium based on pulsed multienergy X-ray irradiation data. X-ray diagnostics problems are of considerable interest from both theoretical and practical points of view, and radiographic methods are indispensable in non-destructive testing of products.

    Within the framework of a mathematical model based on a non-stationary integro-differential equation of radiation transfer, the inverse problem of finding the attenuation coefficient for radiation known at the boundary of the region and the problem of identifying a substance based on the found values of the attenuation coefficient on a discrete set of irradiation energies of the medium are formulated.

    A preliminary processing of a wide list of substances of interest in computed tomography was carried out to determine the possibility of their identification by an approximately specified radiation attenuation coefficient characterizing the medium. When analyzing the degree of proximity of substances in a certain norm, it was found that the set of all possible substances potentially contained in the medium is divided into a finite number of non-intersecting clusters. For a sufficiently short duration of the probing signal, the scattering component of the radiation leaving the medium is asymptotically small. This circumstance allows us to reduce the inverse problem for the radiation transfer equation to the problem of inverting the Radon transform from the attenuation coefficient. The possibility of unambiguous or partial identification of a substance by varying the duration of the probing pulse and the number of energy levels of irradiation of the medium is analyzed using numerical modeling methods on a specially developed digital phantom.

  7. Фирсов А.А., Яранцев Д.А., Леонов С.Б., Иванов В.В.
    Численное моделирование горения этилена в сверхзвуковом потоке воздуха
    Компьютерные исследования и моделирование, 2017, т. 9, № 1, с. 75-86

    В представленной работе обсуждается возможность упрощенного трехмерного нестационарного моделирования процесса плазменно-стимулированного горения газообразного топлива в сверхзвуковом потоке воздуха. Расчеты проводились в программном комплексе FlowVision. В работе выполнен анализ геометрии эксперимента и сделан вывод о ее существенной трехмерности, связанной как с дискретностью подачи топлива в поток, так и с наличием локализованных плазменных образований. Предложен вариант упрощения расчетной геометрии, основанный на симметрии аэродинамического канала и периодичности пространственных неоднородностей. Выполнено тестирование модифицированной $k–\varepsilon$ модели турбулентности FlowVision (KEFV) в условиях сверхзвукового потока. В этих расчетах в области источников тепла и инжекции топлива использовалась подробная сетка без пристеночных функций, а на удаленных от ключевой области поверхностях пристеночные функции были включены. Это позволило существенно уменьшить количество ячеек расчетной сетки. Сложная задача моделирования воспламенения углеводородного топлива при воздействии плазмы была существенно упрощена путем представления плазменных образований как источников тепла и использования одной брутто-реакции для описания горения топлива. На базе геометрии аэродинамического стенда ИАДТ-50 ОИВТ РАН с помощью моделирования в программном комплексе ПК FlowVision проведены калибровка и параметрическая оптимизация подачи газообразного топлива в сверхзвуковой поток. Продемонстрировано хорошее совпадение экспериментальной и синтетической теневой картины потока при инжекции топлива. Проведено моделирование потока для геометрии камеры сгорания Т131 ЦАГИ с инжекцией топлива и генерацией плазмы. В результате моделирования для заданного набора параметров продемонстрировано воспламенение топлива, что совпало с результатами эксперимента. Отмечена важность адаптации расчетной сетки с повышением пространственного разрешения в области объемных источников тепла, моделирующих зону электрического разряда. Достигнуто удовлетворительное качественное совпадение распределений давления, полученных в моделировании и эксперименте.

    Firsov A.A., Yarantsev D.A., Leonov S.B., Ivanov V.V.
    Numerical simulation of ethylene combustion in supersonic air flow
    Computer Research and Modeling, 2017, v. 9, no. 1, pp. 75-86

    In the present paper, we discuss the possibility of a simplified three-dimensional unsteady simulation of plasma-assisted combustion of gaseous fuel in a supersonic airflow. Simulation was performed by using FlowVision CFD software. Analysis of experimental geometry show that it has essentially 3D nature that conditioned by the discrete fuel injection into the flow as well as by the presence of the localized plasma filaments. Study proposes a variant of modeling geometry simplification based on symmetry of the aerodynamic duct and periodicity of the spatial inhomogeneities. Testing of modified FlowVision $k–\varepsilon$ turbulence model named «KEFV» was performed for supersonic flow conditions. Based on that detailed grid without wall functions was used the field of heat and near fuel injection area and surfaces remote from the key area was modeled with using of wall functions, that allowed us to significantly reduce the number of cells of the computational grid. Two steps significantly simplified a complex problem of the hydrocarbon fuel ignition by means of plasma generation. First, plasma formations were simulated by volumetric heat sources and secondly, fuel combustion is reduced to one brutto reaction. Calibration and parametric optimization of the fuel injection into the supersonic flow for IADT-50 JIHT RAS wind tunnel is made by means of simulation using FlowVision CFD software. Study demonstrates a rather good agreement between the experimental schlieren photo of the flow with fuel injection and synthetical one. Modeling of the flow with fuel injection and plasma generation for the facility T131 TSAGI combustion chamber geometry demonstrates a combustion mode for the set of experimental parameters. Study emphasizes the importance of the computational mesh adaptation and spatial resolution increasing for the volumetric heat sources that model electric discharge area. A reasonable qualitative agreement between experimental pressure distribution and modeling one confirms the possibility of limited application of such simplified modeling for the combustion in high-speed flow.

    Views (last year): 8. Citations: 3 (RSCI).
  8. Ситников С.С., Черемисин Ф.Г., Сазыкина Т.А.
    Моделирование начальной стадии истечения двухкомпонентной разреженной газовой смеси через тонкую щель в вакуум
    Компьютерные исследования и моделирование, 2021, т. 13, № 4, с. 747-759

    В работе рассматривается процесс формирования течения при истечении двухкомпонентной газовой смеси через тонкую щель в вакуум. Предлагается подход к моделированию течений разреженных газовых смесей в переходном режиме на основе прямого решения кинетического уравнения Больцмана, в котором для вычисления интегралов столкновения используется консервативный проекционно-интерполяционный метод. Приводятся расчетные формулы, детально описана методика вычислений применительно к течению бинарной газовой смеси. В качестве потенциала взаимодействия молекул используется потенциал Леннарда–Джонса. Разработана программно-моделирующая среда, позволяющая проводить исследование течений газовых смесей в переходном режиме на системах кластерной архитектуры. За счет использования технологий распараллеливания кода получено ускорение счета в 50–100 раз. Проведено численное моделирование нестационарного двумерного истечения бинарной аргон-неоновой газовой смеси в вакуум через тонкую щель для различных значений числа Кнудсена. Получены графики зависимости выходного потока компонентов газовой смеси от времени в процессе установления течения. Обнаружены нестационарные области сильного разделения компонентов газовой смеси, в которых отношение концентраций достигает 10 и более. Обнаруженный эффект может иметь приложения в задаче разделения газовых смесей.

    Sitnikov S.S., Tcheremissine F.G., Sazykina T.A.
    Simulation of the initial stage of a two-component rarefied gas mixture outflow through a thin slit into vacuum
    Computer Research and Modeling, 2021, v. 13, no. 4, pp. 747-759

    The paper considers the process of flow formation in an outflow of a binary gas mixture through a thin slit into vacuum. An approach to modeling the flows of rarefied gas mixtures in the transient regime is proposed based on the direct solution of the Boltzmann kinetic equation, in which the conservative projection method is used to calculate the collision integrals. Calculation formulas are provided; the calculation procedure is described in detail in relation to the flow of a binary gas mixture. The Lennard–Jones potential is used as an interaction potential of molecules. A software modeling environment has been developed that makes it possible to study the flows of gas mixtures in a transitional regime on systems of cluster architecture. Due to the use of code parallelization technologies, an acceleration of calculations by 50–100 times was obtained. Numerical simulation of a two-dimensional outflow of a binary argon-neon gas mixture from a vessel into vacuum through a thin slit is carried out for various values of the Knudsen number. The graphs of the dependence of gas mixture components output flow on time in the process of establishing the flow are obtained. Non-stationary regions of strong separation of gas mixture components, in which the molecular densities ratio reaches 10 or more, were discovered. The discovered effect can have applications in the problem of gas mixtures separation.

  9. Руденко В.Д., Юдин Н.Е., Васин А.А.
    Обзор выпуклой оптимизации марковских процессов принятия решений
    Компьютерные исследования и моделирование, 2023, т. 15, № 2, с. 329-353

    В данной статье проведен обзор как исторических достижений, так и современных результатов в области марковских процессов принятия решений (Markov Decision Process, MDP) и выпуклой оптимизации. Данный обзор является первой попыткой освещения на русском языке области обучения с подкреплением в контексте выпуклой оптимизации. Рассматриваются фундаментальное уравнение Беллмана и построенные на его основе критерии оптимальности политики — стратегии, принимающие решение по известному состоянию среды на данный момент. Также рассмотрены основные итеративные алгоритмы оптимизации политики, построенные на решении уравнений Беллмана. Важным разделом данной статьи стало рассмотрение альтернативы к подходу $Q$-обучения — метода прямой максимизации средней награды агента для избранной стратегии от взаимодействия со средой. Таким образом, решение данной задачи выпуклой оптимизации представимо в виде задачи линейного программирования. В работе демонстрируется, как аппарат выпуклой оптимизации применяется для решения задачи обучения с подкреплением (Reinforcement Learning, RL). В частности, показано, как понятие сильной двойственности позволяет естественно модифицировать постановку задачи RL, показывая эквивалентность между максимизацией награды агента и поиском его оптимальной стратегии. В работе также рассматривается вопрос сложности оптимизации MDP относительно количества троек «состояние–действие–награда», получаемых в результате взаимодействия со средой. Представлены оптимальные границы сложности решения MDP в случае эргодического процесса с бесконечным горизонтом, а также в случае нестационарного процесса с конечным горизонтом, который можно перезапускать несколько раз подряд или сразу запускать параллельно в нескольких потоках. Также в обзоре рассмотрены последние результаты по уменьшению зазора нижней и верхней оценки сложности оптимизации MDP с усредненным вознаграждением (Averaged MDP, AMDP). В заключение рассматриваются вещественнозначная параметризация политики агента и класс градиентных методов оптимизации через максимизацию $Q$-функции ценности. В частности, представлен специальный класс MDP с ограничениями на ценность политики (Constrained Markov Decision Process, CMDP), для которых предложен общий прямодвойственный подход к оптимизации, обладающий сильной двойственностью.

    Rudenko V.D., Yudin N.E., Vasin A.A.
    Survey of convex optimization of Markov decision processes
    Computer Research and Modeling, 2023, v. 15, no. 2, pp. 329-353

    This article reviews both historical achievements and modern results in the field of Markov Decision Process (MDP) and convex optimization. This review is the first attempt to cover the field of reinforcement learning in Russian in the context of convex optimization. The fundamental Bellman equation and the criteria of optimality of policy — strategies based on it, which make decisions based on the known state of the environment at the moment, are considered. The main iterative algorithms of policy optimization based on the solution of the Bellman equations are also considered. An important section of this article was the consideration of an alternative to the $Q$-learning approach — the method of direct maximization of the agent’s average reward for the chosen strategy from interaction with the environment. Thus, the solution of this convex optimization problem can be represented as a linear programming problem. The paper demonstrates how the convex optimization apparatus is used to solve the problem of Reinforcement Learning (RL). In particular, it is shown how the concept of strong duality allows us to naturally modify the formulation of the RL problem, showing the equivalence between maximizing the agent’s reward and finding his optimal strategy. The paper also discusses the complexity of MDP optimization with respect to the number of state–action–reward triples obtained as a result of interaction with the environment. The optimal limits of the MDP solution complexity are presented in the case of an ergodic process with an infinite horizon, as well as in the case of a non-stationary process with a finite horizon, which can be restarted several times in a row or immediately run in parallel in several threads. The review also reviews the latest results on reducing the gap between the lower and upper estimates of the complexity of MDP optimization with average remuneration (Averaged MDP, AMDP). In conclusion, the real-valued parametrization of agent policy and a class of gradient optimization methods through maximizing the $Q$-function of value are considered. In particular, a special class of MDPs with restrictions on the value of policy (Constrained Markov Decision Process, CMDP) is presented, for which a general direct-dual approach to optimization with strong duality is proposed.

  10. Большинство биологических задач находятся в области температур, где квантовые и классические эффекты равноценны или в классической области, где квантовые эффекты проступают как незначительные добавки или модуляции. Степень проявления квантового и классического режимов рассмотрена в работе на примере одной из важнейших задач биологической активности молекул - задачи о переходах частиц через барьеры. Подходя к задаче о переходе частицы через нестационарный барьер (с параметрами, характерными для биологических проблем) с различных позиций (квантовой и классической), мы получили одинаковый результат: динамика частицы характеризуется релаксацией за время, сравнимое с диффузионным.

    Shuvalova E.V.
    Quantum and classical approaches to a biological problem of particle transition through non-stationary barriers
    Computer Research and Modeling, 2009, v. 1, no. 3, pp. 337-351

    The most part of biological tasks coincide with temperature areas, where quantum and classical effects are equivalent, or the classical one is dominating. The extent of influence of quantum or classical effect was considered in the work in application to one of the most significant problems of biological activity: particle transition through non-stationary barriers. It is interesting that the results obtained using different approaches, quantum and classical, are the same. It seems that the particle dynamics is characterized by non-coherent relaxation with rate of diffusion.

    Citations: 1 (RSCI).
Pages: « first previous next last »

Indexed in Scopus

Full-text version of the journal is also available on the web site of the scientific electronic library eLIBRARY.RU

The journal is included in the Russian Science Citation Index

The journal is included in the RSCI

International Interdisciplinary Conference "Mathematics. Computing. Education"