Результаты поиска по 'система управления':
Найдено статей: 87
  1. От редакции
    Компьютерные исследования и моделирование, 2023, т. 15, № 5, с. 1099-1101
    Editor’s note
    Computer Research and Modeling, 2023, v. 15, no. 5, pp. 1099-1101
  2. От редакции
    Компьютерные исследования и моделирование, 2024, т. 16, № 1, с. 5-10
    Editor’s note
    Computer Research and Modeling, 2024, v. 16, no. 1, pp. 5-10
  3. Холодов Я.А.
    Разработка сетевых вычислительных моделей для исследования нелинейных волновых процессов на графах
    Компьютерные исследования и моделирование, 2019, т. 11, № 5, с. 777-814

    В различных приложениях возникают задачи, моделируемые уравнениями в частных производных на графах (сетях, деревьях). Для исследования данных проблем и возникающих различных экстремальных ситуаций, для задач проектирования и оптимизации сетей различных типов в данной работе построена вычислительная модель, основанная на решении соответствующих краевых задач для нелинейных уравнений в частных производных гиперболического типа на графах (сетях, деревьях). В качестве приложений были выбраны три различные задачи, решаемые в рамках общего подхода сетевых вычислительных моделей. Первая — это моделирование движения транспортных потоков. При решении данной задачи использовался макроскопический подход, при котором транспортный поток описывается нелинейной системой гиперболических уравнений второго порядка. Проведенные расчеты и полученные результаты показали, что разработанная в рамках предложенного подхода модель хорошо воспроизводит реальную ситуацию на различных участках транспортной сети г. Москвы на значительных временных интервалах, а также может быть использована для выбора наиболее оптимальной стратегии организации дорожного движения в городе. Вторая — моделирование потоков данных в компьютерных сетях. В этой задаче потоки данных различных соединений в пакетной сети передачи данных моделировались в виде несмешивающихся потоков сплошной среды. Предложены концептуальная и математическая модели сети. Проведено численное моделирование в сравнении с системой имитационного моделирования сети NS-2. Полученные результаты показали, что в сравнении с пакетной моделью NS-2 разработанная нами потоковая модель демонстрирует значительную экономию вычислительных ресурсов, обеспечивая при этом хорошую степень подобия, и позволяет моделировать поведение сложных глобально распределенных IP-сетей передачи данных. Третья — моделирование распространения газовых примесей в вентиляционных сетях. Была разработана вычислительная математическая модель распространения мелкодисперсных или газовых примесей в вентиляционных сетях с использованием уравнений газовой динамики путем численного сопряжения областей разной размерности. Проведенные расчеты показали, что модель с хорошей точностью позволяет определять распределение газодинамических параметров в трубопроводной сети и решать задачи динамического управления вентиляцией.

    Kholodov Y.A.
    Development of network computational models for the study of nonlinear wave processes on graphs
    Computer Research and Modeling, 2019, v. 11, no. 5, pp. 777-814

    In various applications arise problems modeled by nonlinear partial differential equations on graphs (networks, trees). In order to study such problems and various extreme situations arose in the problems of designing and optimizing networks developed the computational model based on solving the corresponding boundary problems for partial differential equations of hyperbolic type on graphs (networks, trees). As applications, three different problems were chosen solved in the framework of the general approach of network computational models. The first was modeling of traffic flow. In solving this problem, a macroscopic approach was used in which the transport flow is described by a nonlinear system of second-order hyperbolic equations. The results of numerical simulations showed that the model developed as part of the proposed approach well reproduces the real situation various sections of the Moscow transport network on significant time intervals and can also be used to select the most optimal traffic management strategy in the city. The second was modeling of data flows in computer networks. In this problem data flows of various connections in packet data network were simulated as some continuous medium flows. Conceptual and mathematical network models are proposed. The numerical simulation was carried out in comparison with the NS-2 network simulation system. The results showed that in comparison with the NS-2 packet model the developed streaming model demonstrates significant savings in computing resources while ensuring a good level of similarity and allows us to simulate the behavior of complex globally distributed IP networks. The third was simulation of the distribution of gas impurities in ventilation networks. It was developed the computational mathematical model for the propagation of finely dispersed or gas impurities in ventilation networks using the gas dynamics equations by numerical linking of regions of different sizes. The calculations shown that the model with good accuracy allows to determine the distribution of gas-dynamic parameters in the pipeline network and solve the problems of dynamic ventilation management.

  4. Гайко В.А., Савин С.И., Климчик А.С.
    Глобальные бифуркации предельных циклов полиномиальной системы Эйлера–Лагранжа–Льенара
    Компьютерные исследования и моделирование, 2020, т. 12, № 4, с. 693-705

    В данной статье, используя наш бифуркационно-геометрический подход, мы изучаем глобальную динамику и решаем проблему о максимальном числе и распределении предельных циклов (автоколебательных режимов, соответствующих состояниям динамического равновесия) в планарной полиномиальной механической системе типа Эйлера–Лагранжа–Льенара. Такие системы используются также для моделирования электротехнических, экологических, биомедицинских и других систем, что значительно облегчает исследование соответствующих реальных процессов и систем со сложной внутренней динамикой. Они используется, в частности, в механических системах с демпфированием и жесткостью. Существует ряд примеров технических систем, которые описываются с помощью квадратичного демпфирования в динамических моделях второго порядка. В робототехнике, например, квадратичное демпфирование появляется при управлении с прямой связью и в нелинейных устройствах, таких как приводы с переменным импедансом (сопротивлением). Приводы с переменным сопротивлением представляют особый интерес для совместной робототехники. Для исследования характера и расположения особых точек в фазовой плоскости полиномиальной системы Эйлера–Лагранжа–Льенара используется разработанный нами метод, смысл которого состоит в том, чтобы получить простейшую (хорошо известную) систему путем обращения в нуль некоторых параметров (обычно параметров, поворачивающих поле) исходной системы, а затем последовательно вводить эти параметры, изучая динамику особых точек в фазовой плоскости. Для исследования особых точек системы мы используем классические теоремы Пуанкаре об индексе, а также наш оригинальный геометрический подход, основанный на применении метода двух изоклин Еругина, что особенно эффективно при исследовании бесконечно удаленных особых точек. Используя полученную информацию об особых точках и применяя канонические системы с параметрами, поворачивающими векторное поле, а также используя геометрические свойства спиралей, заполняющих внутренние и внешние области предельных циклов, и применяя наш геометрический подход к качественному анализу, мы изучаем бифуркации предельных циклов рассматриваемой системы.

    Gaiko V.A., Savin S.I., Klimchik A.S.
    Global limit cycle bifurcations of a polynomial Euler–Lagrange–Liénard system
    Computer Research and Modeling, 2020, v. 12, no. 4, pp. 693-705

    In this paper, using our bifurcation-geometric approach, we study global dynamics and solve the problem of the maximum number and distribution of limit cycles (self-oscillating regimes corresponding to states of dynamical equilibrium) in a planar polynomial mechanical system of the Euler–Lagrange–Liйnard type. Such systems are also used to model electrical, ecological, biomedical and other systems, which greatly facilitates the study of the corresponding real processes and systems with complex internal dynamics. They are used, in particular, in mechanical systems with damping and stiffness. There are a number of examples of technical systems that are described using quadratic damping in second-order dynamical models. In robotics, for example, quadratic damping appears in direct-coupled control and in nonlinear devices, such as variable impedance (resistance) actuators. Variable impedance actuators are of particular interest to collaborative robotics. To study the character and location of singular points in the phase plane of the Euler–Lagrange–Liйnard polynomial system, we use our method the meaning of which is to obtain the simplest (well-known) system by vanishing some parameters (usually, field rotation parameters) of the original system and then to enter sequentially these parameters studying the dynamics of singular points in the phase plane. To study the singular points of the system, we use the classical Poincarй index theorems, as well as our original geometric approach based on the application of the Erugin twoisocline method which is especially effective in the study of infinite singularities. Using the obtained information on the singular points and applying canonical systems with field rotation parameters, as well as using the geometric properties of the spirals filling the internal and external regions of the limit cycles and applying our geometric approach to qualitative analysis, we study limit cycle bifurcations of the system under consideration.

  5. Веричев Н.Н., Веричев С.Н., Ерофеев В.И.
    Стационарные состояния и бифуркации в одномерной активной среде осцилляторов
    Компьютерные исследования и моделирование, 2023, т. 15, № 3, с. 491-512

    В предлагаемой статье приводятся результаты аналитического и компьютерного исследования коллективных динамических свойств цепочки автоколебательных систем (условно — осцилляторов). Предполагается, что связи отдельных элементов цепочки являются невзаимными, однонаправленными. Точнее, предполагается, что каждый элемент цепочки находится под воздействием предыдущего, в то время как обратная реакция отсутствует (физически несущественна). В этом состоит главная особенность цепочки. Данную систему можно интерпретировать как активную дискретную среду с однонаправленным переносом, в частности переносом вещества. Подобные цепочки могут являться математическими моделями реальных систем с решеточной структурой, имеющих место в самых различных областях естествознания и техники: в физике, химии, биологии, радиотехнике, экономике и др. Также они могут быть моделями технологических и вычислительных процессов. В качестве элементов решетки выбраны нелинейные автоколебательные системы (условно — осцилляторы) с широким спектром потенциально возможных индивидуальных автоколебаний: от периодических до хаотических. Это позволяет исследовать различные динамические режимы цепочки от регулярных до хаотических, меняя параметры элементов и не меняя природу самих элементов. Совместное применение качественных методов теории динамических систем и качественно-численных методов позволяет получить обозримую картину всевозможных динамических режимов цепочки. Исследуются условия существования и устойчивости пространственно однородных динамических режимов (детерминированных и хаотических) цепочки. Аналитические результаты иллюстрированы численным экспериментом. Исследуются динамические режимы цепочки при возмущениях параметров на ее границе. Показывается возможность управления динамическими режимами цепочки путем включения необходимого возмущения на границе. Рассматриваются различные случаи динамики цепочек, составленных из неоднородных (различных по своим параметрам) элементов. Аналитически и численно исследуется глобальная (всех осцилляторов цепочки) хаотическая синхронизация.

    Verichev N.N., Verichev S.N., Erofeev V.I.
    Stationary states and bifurcations in a one-dimensional active medium of oscillators
    Computer Research and Modeling, 2023, v. 15, no. 3, pp. 491-512

    This article presents the results of an analytical and computer study of the collective dynamic properties of a chain of self-oscillating systems (conditionally — oscillators). It is assumed that the couplings of individual elements of the chain are non-reciprocal, unidirectional. More precisely, it is assumed that each element of the chain is under the influence of the previous one, while the reverse reaction is absent (physically insignificant). This is the main feature of the chain. This system can be interpreted as an active discrete medium with unidirectional transfer, in particular, the transfer of a matter. Such chains can represent mathematical models of real systems having a lattice structure that occur in various fields of natural science and technology: physics, chemistry, biology, radio engineering, economics, etc. They can also represent models of technological and computational processes. Nonlinear self-oscillating systems (conditionally, oscillators) with a wide “spectrum” of potentially possible individual self-oscillations, from periodic to chaotic, were chosen as the “elements” of the lattice. This allows one to explore various dynamic modes of the chain from regular to chaotic, changing the parameters of the elements and not changing the nature of the elements themselves. The joint application of qualitative methods of the theory of dynamical systems and qualitative-numerical methods allows one to obtain a clear picture of all possible dynamic regimes of the chain. The conditions for the existence and stability of spatially-homogeneous dynamic regimes (deterministic and chaotic) of the chain are studied. The analytical results are illustrated by a numerical experiment. The dynamical regimes of the chain are studied under perturbations of parameters at its boundary. The possibility of controlling the dynamic regimes of the chain by turning on the necessary perturbation at the boundary is shown. Various cases of the dynamics of chains comprised of inhomogeneous (different in their parameters) elements are considered. The global chaotic synchronization (of all oscillators in the chain) is studied analytically and numerically.

  6. Корчак А.Б.
    Контроль точности при ускоренном схемотехническом моделировании
    Компьютерные исследования и моделирование, 2011, т. 3, № 4, с. 365-370

    Разработан алгоритм ускоренного моделирования КМОП СБИС (Сверх Больших Интегральных Схем с Комплементарной логикой на транзисторах Металл-Окисел-Проводник) под управлением точности. Алгоритм обеспечивает возможность проведения параллельного числительного эксперимента в много процессорной вычислительной среде. Ускорение расчета осуществляется за счет применения блочно-матричной и структурной (DCCC) декомпозиций. Особенность подхода состоит в выборе моментов и способов обмена параметрами и в применении многоскоростных методов интегрирования в процессе расчета подсистем. Благодаря этому имеется возможность оценивать и контролировать погрешность по требуемым характеристикам.

    Korchak A.B.
    Accuracy control for fast circuit simulation
    Computer Research and Modeling, 2011, v. 3, no. 4, pp. 365-370

    We developed an algorithm for fast simulation of VLSI CMOS (Very Large Scale Integration with Complementary Metal-Oxide-Semiconductors) with an accuracy control. The algorithm provides an ability of parallel numerical experiments in multiprocessor computational environment. There is computation speed up by means of block-matrix and structural (DCCC) decompositions application. A feature of the approach is both in a choice of moments and ways of parameters synchronization and application of multi-rate integration methods. Due to this fact we have ability to estimate and control error of given characteristics.

    Citations: 1 (RSCI).
  7. Чуканов С.Н., Першина Е.Л.
    Формирование оптимального управления нелинейным динамическим объектом на основе модели Такаги–Сугено
    Компьютерные исследования и моделирование, 2015, т. 7, № 1, с. 51-59

    В работе рассмотрен алгоритм нечеткой системы управления существенно нелинейным динамическим объектом. Для решения нелинейной задачи оптимального управления предлагается использовать линейно-квадратичное регулирование (LQR — linear quadratic regulator) с моделью Такаги–Сугено (Takagi–Sugeno). Алгоритм может быть использован для проектирования систем оптимального управления детерминированными нелинейными объектами. Предложено использование алгоритма функционирования оптимальной системы управления для управления вращательным движением летательного аппарата.

    Chukanov S.N., Pershina E.L.
    Formation of optimal control of nonlinear dynamic object based on Takagi–Sugeno model
    Computer Research and Modeling, 2015, v. 7, no. 1, pp. 51-59

    The algorithm of fuzzy control system essentially nonlinear dynamic object is considered in this article. For solving nonlinear optimal control problem is proposed to use the method of linear quadratic regulation (LQR) with fuzzy Takagi–Sugeno model. The algorithm can be used for the design of deterministic optimal control of nonlinear objects. The algorithm of optimal control for controlling the rotational motion of a space vehicle is proposed.

    Views (last year): 2.
  8. Чуканов С.Н.
    Моделирование структуры сложной системы на основе оценивания меры взаимодействия подсистем
    Компьютерные исследования и моделирование, 2020, т. 12, № 4, с. 707-719

    В работе рассматривается использование определения меры взаимодействия между каналами при выборе конфигурации структуры системы управления сложными динамическими объектами. Приведены основные методы определения меры взаимодействия подсистем сложных систем управления на основе методов RGA (Relative Gain Array), Dynamic RGA, HIIA (Hankel Interaction Index Array), PM (Participation matrix). Задача проектирования структуры управления традиционно делится на выбор каналов ввода-вывода и выбор конфигурации управления. При выборе конфигурации управления простые конфигурации более предпочтительны, так как просты при проектировании, обслуживании и более устойчивы к сбоям в работе. Однако сложные конфигурации обеспечивают создание системы управления с более высокой эффективностью. Процессы в больших динамических объектах характеризуются высокой степенью взаимодействия между переменными процесса. Выбор структуры управления заключается в определении того, какие динамические соединения следует использовать для разработки системы управления. Когда структура выбрана, соединения могут быть использованы для конфигурирования системы управления. Для больших систем предлагается для выбора структуры управления предварительно группировать компоненты векторов входных и выходных сигналов исполнительных органов и чувствительных элементов в наборы, в которых количество переменных существенно уменьшается. Приводится количественная оценка децентрализации системы управления на основе минимизации суммы недиагональных элементов матрицы PM. Приведен пример оценки меры взаимодействия компонент сильно связанных подсистем и меры взаимодействия компонент слабосвязанных подсистем. Дана количественная оценка последствий пренебрежения взаимодействием компонент слабосвязанных подсистем. Рассмотрено построение взвешенного графа для визуализации взаимодействия подсистем сложной системы. В работе предложен метод формирования грамиана управляемости вектором выходных сигналов, инвариантный к преобразованиям вектора состояния. Приведен пример декомпозиции системы стабилизации компонент вектора угловой скорости летательного аппарата. Оценивание мер взаимного влияния процессов в каналах систем управления позволяет повысить надежность функционирования систем при учете использования аналитической избыточности информации с различных приборов, что позволяет снизить массовые и габаритные характеристики систем, а также потребление энергии. Методы оценивания меры взаимодействия процессов в подсистемах систем управления могут быть использованы при проектировании сложных систем, например систем управления движением, систем ориентации и стабилизации летательных аппаратов.

    Chukanov S.N.
    Modeling the structure of a complex system based on estimation of the measure of interaction of subsystems
    Computer Research and Modeling, 2020, v. 12, no. 4, pp. 707-719

    The using of determining the measure of interaction between channels when choosing the configuration structure of a control system for complex dynamic objects is considered in the work. The main methods for determining the measure of interaction between subsystems of complex control systems based on the methods RGA (Relative Gain Array), Dynamic RGA, HIIA (Hankel Interaction Index Array), PM (Participation matrix) are presented. When choosing a control configuration, simple configurations are preferable, as they are simple in design, maintenance and more resistant to failures. However, complex configurations provide higher performance control systems. Processes in large dynamic objects are characterized by a high degree of interaction between process variables. For the design of the control structure interaction measures are used, namely, the selection of the control structure and the decision on the configuration of the controller. The choice of control structure is to determine which dynamic connections should be used to design the controller. When a structure is selected, connections can be used to configure the controller. For large systems, it is proposed to pre-group the components of the vectors of input and output signals of the actuators and sensitive elements into sets in which the number of variables decreases significantly in order to select a control structure. A quantitative estimation of the decentralization of the control system based on minimizing the sum of the off-diagonal elements of the PM matrix is given. An example of estimation the measure of interaction between components of strong coupled subsystems and the measure of interaction between components of weak coupled subsystems is given. A quantitative estimation is given of neglecting the interaction of components of weak coupled subsystems. The construction of a weighted graph for visualizing the interaction of the subsystems of a complex system is considered. A method for the formation of the controllability gramian on the vector of output signals that is invariant to state vector transformations is proposed in the paper. An example of the decomposition of the stabilization system of the components of the flying vehicle angular velocity vector is given. The estimation of measures of the mutual influence of processes in the channels of control systems makes it possible to increase the reliability of the systems when accounting for the use of analytical redundancy of information from various devices, which reduces the mass and energy consumption. Methods for assessing measures of the interaction of processes in subsystems of control systems can be used in the design of complex systems, for example, motion control systems, orientation and stabilization systems of vehicles.

  9. Власов А.А., Пильгейкина И.А., Скорикова И.А.
    Методика формирования многопрограммного управления изолированным перекрестком
    Компьютерные исследования и моделирование, 2021, т. 13, № 2, с. 295-303

    Наиболее простым и востребованным практикой методом управления светофорной сигнализацией является предрассчитанное регулирование, когда параметры работы светофорного объекта рассчитываются заранее и затем активируются согласно расписанию. В работе предложена методика формирования сигнального плана, позволяющая рассчитать программы регулирования и установить период их активности. Подготовка исходных данных для проведения расчета включает формирование временного ряда суточной интенсивности движения с интервалом 15 минут. При проведении полевых обследований возможно отсутствие части измерений интенсивности движения. Для восполнения недостающих значений предложено использование кубической сплайн-интерполяции временного ряда. Следующем шагом методики является расчет суточного набора сигнальных планов. В работе приведены зависимости, позволяющие рассчитать оптимальную длительность цикла регулирования и разрешающих движение фаз и установить период их активности. Существующие системы управления движением имеют ограничения на количество используемых программ регулирования. Для сокращения количества сигнальных планов и определения периода их активности используется кластеризация методом $k$-средних в пространстве длительности транспортных фаз. В новом суточном сигнальном плане длительность фаз определяется координатами полученных центров кластеров, а периоды активности устанавливаются элементами, вошедшими в кластер. Апробация на числовом примере показала, что при количестве кластеров 10 отклонение оптимальной длительности фаз от центров кластеров не превышает 2 с. Для проведения оценки эффективности разработанной методики на примере реального пересечения со светофорным регулированием. На основе натурных обследований схемы движения и транспортного спроса разработана микроскопическая модель для программы SUMO (Simulation of Urban Mobility). Оценка эффективности произведена на основе потерь транспорта, оцениваемых затратами времени на передвижение. Имитационное моделирование многопрограммного управления сигналами светофора показало снижение времени задержки (в сравнении с однопрограммным управлением) на 20 %. Предложенная методика позволяет автоматизировать процесс расчета суточных сигнальных планов и установки времени их активности.

    Vlasov A.A., Pilgeikina I.A., Skorikova I.A.
    Method of forming multiprogram control of an isolated intersection
    Computer Research and Modeling, 2021, v. 13, no. 2, pp. 295-303

    The simplest and most desirable method of traffic signal control is precalculated regulation, when the parameters of the traffic light object operation are calculated in advance and activated in accordance to a schedule. This work proposes a method of forming a signal plan that allows one to calculate the control programs and set the period of their activity. Preparation of initial data for the calculation includes the formation of a time series of daily traffic intensity with an interval of 15 minutes. When carrying out field studies, it is possible that part of the traffic intensity measurements is missing. To fill up the missing traffic intensity measurements, the spline interpolation method is used. The next step of the method is to calculate the daily set of signal plans. The work presents the interdependencies, which allow one to calculate the optimal durations of the control cycle and the permitting phase movement and to set the period of their activity. The present movement control systems have a limit on the number of control programs. To reduce the signal plans' number and to determine their activity period, the clusterization using the $k$-means method in the transport phase space is introduced In the new daily signal plan, the duration of the phases is determined by the coordinates of the received cluster centers, and the activity periods are set by the elements included in the cluster. Testing on a numerical illustration showed that, when the number of clusters is 10, the deviation of the optimal phase duration from the cluster centers does not exceed 2 seconds. To evaluate the effectiveness of the developed methodology, a real intersection with traffic light regulation was considered as an example. Based on field studies of traffic patterns and traffic demand, a microscopic model for the SUMO (Simulation of Urban Mobility) program was developed. The efficiency assessment is based on the transport losses estimated by the time spent on movement. Simulation modeling of the multiprogram control of traffic lights showed a 20% reduction in the delay time at the traffic light object in comparison with the single-program control. The proposed method allows automation of the process of calculating daily signal plans and setting the time of their activity.

  10. Решитько М.А., Усов А.Б.
    Нейросетевой подход к исследованию задач оптимального управления
    Компьютерные исследования и моделирование, 2022, т. 14, № 3, с. 539-557

    В статье предлагается метод исследования задач оптимального управления с использованием нейронных сетей. Рассмотрение проводится на примере задачи контроля качества поверхностных вод. При моделировании системы контроля качества поверхностных вод используются теоретико-игровой и иерархический подходы. Исследуется случай динамической двухуровневой системы управления качеством поверхностных вод, включающий ведущего и нескольких ведомых. Рассмотрение ведется с точки зрения ведомых. В этом случае между ними возникает неантагонистическая игра, в которой строится равновесие Нэша. С математической точки зрения при этом решается задача оптимального управления при наличии фазовых ограничений. Для ее аналитического исследования в работе используется принцип максимума Понтрягина, на основе которого формулируются условия оптимальности. Для решения возникающих при этом систем дифференциальных уравнений используется обучаемая нейронная сеть прямого распространения (feedforward). Приводится обзор существующих методов решения подобных задач с помощью нейронных сетей и методов обучения нейронных сетей. Для оценки ошибки решения, получаемого с помощью нейронной сети, предлагается использовать метод анализа дефекта решения, адаптированный для нейронных сетей. Это позволяет получить количественную оценку ошибки численного решения. Приведены примеры использования нейросетевого подхода для решения модельной задачи оптимального управления и задачи контроля качества поверхностных вод. Полученные в этих примерах результаты сравниваются с точным решением и с результатами, полученными методом стрельбы. Во всех случаях величина ошибки оценивается методом анализа дефекта решения. Нейросетевым методом проводится также исследование системы контроля качества поверхностных вод для случаев, когда решение задачи другими методами получить не удалось (большой временной промежуток моделирования и случай нескольких агентов). В статье иллюстрируются возможность использования нейросетевого подхода для решения различных задач оптимального управления и дифференциальных игр, а также возможность количественной оценки точности решения. Полученные результаты численных экспериментов позволяют говорить о необходимости введения регулирующего органа для достижения устойчивого развития системы.

    Reshitko M.A., Usov A.B.
    Neural network methods for optimal control problems
    Computer Research and Modeling, 2022, v. 14, no. 3, pp. 539-557

    In this study we discuss methods to solve optimal control problems based on neural network techniques. We study hierarchical dynamical two-level system for surface water quality control. The system consists of a supervisor (government) and a few agents (enterprises). We consider this problem from the point of agents. In this case we solve optimal control problem with constraints. To solve this problem, we use Pontryagin’s maximum principle, with which we obtain optimality conditions. To solve emerging ODEs, we use feedforward neural network. We provide a review of existing techniques to study such problems and a review of neural network’s training methods. To estimate the error of numerical solution, we propose to use defect analysis method, adapted for neural networks. This allows one to get quantitative error estimations of numerical solution. We provide examples of our method’s usage for solving synthetic problem and a surface water quality control model. We compare the results of this examples with known solution (when provided) and the results of shooting method. In all cases the errors, estimated by our method are of the same order as the errors compared with known solution. Moreover, we study surface water quality control problem when no solutions is provided by other methods. This happens because of relatively large time interval and/or the case of several agents. In the latter case we seek Nash equilibrium between agents. Thus, in this study we show the ability of neural networks to solve various problems including optimal control problems and differential games and we show the ability of quantitative estimation of an error. From the numerical results we conclude that the presence of the supervisor is necessary for achieving the sustainable development.

Pages: « first previous next last »

Indexed in Scopus

Full-text version of the journal is also available on the web site of the scientific electronic library eLIBRARY.RU

The journal is included in the Russian Science Citation Index

The journal is included in the RSCI

International Interdisciplinary Conference "Mathematics. Computing. Education"