All issues
- 2024 Vol. 16
- 2023 Vol. 15
- 2022 Vol. 14
- 2021 Vol. 13
- 2020 Vol. 12
- 2019 Vol. 11
- 2018 Vol. 10
- 2017 Vol. 9
- 2016 Vol. 8
- 2015 Vol. 7
- 2014 Vol. 6
- 2013 Vol. 5
- 2012 Vol. 4
- 2011 Vol. 3
- 2010 Vol. 2
- 2009 Vol. 1
-
Обоснование связи модели Бэкмана с вырождающимися функциями затрат с моделью стабильной динамики
Компьютерные исследования и моделирование, 2022, т. 14, № 2, с. 335-342С 50-х годов XX века транспортное моделирование крупных мегаполисов стало усиленно развиваться. Появились первые модели равновесного распределения потоков по путям. Наиболее популярной (и использующейся до сих пор) моделью была модель Бэкмана и др. 1955 г. В основу этой модели положены два принципа Вардропа. На современном теоретико-игровом языке можно кратко описать суть модели как поиск равновесия Нэша в популяционной игре загрузки, в которой потери игроков (водителей) рассчитываются исходя из выбранного пути и загрузках на этом пути, при фиксированных корреспонденциях. Загрузки (затраты) на пути рассчитываются как сумма затрат на различных участках дороги (ребрах графа транспортной сети). Затраты на ребре (время проезда по ребру) определяется величиной потока автомобилей на этом ребре. Поток на ребре, в свою очередь, определяется суммой потоков по всем путям, проходящим через заданное ребро. Таким образом, затраты на проезд по пути определяются не только выбором пути, но и тем, какие пути выбрали остальные водители. Таким образом, мы находимся в стандартной теоретико-игровой постановке. Специфика формирования функций затрат позволяет сводить поиск равновесия к решению задачи оптимизации (игра потенциальная). Эта задача оптимизации будет выпуклой, если функции затрат монотонно неубывающие. Собственно, различные предположения о функциях затрат формируют различные модели. Наиболее популярной моделью является модель с функцией затрат BPR. Такие функции используются при расчетах реальных городов повсеместно. Однако в начале XXI века Ю. Е. Нестеровым и А. де Пальмой было показано, что модели типа Бэкмана имеют серьезные недостатки. Эти недостатки можно исправить, используя модель, которую авторы назвали моделью стабильной динамики. Поиск равновесия в такой модели также сводится к задаче оптимизации. Точнее, даже задаче линейного программирования. В 2013 г. А. В. Гасниковым было обнаружено, что модель стабильной ди- намики может быть получена предельным переходом, связанным с поведением функции затрат, из модели Бэкмана. Однако обоснование упомянутого предельного перехода было сделано в нескольких важных (для практики), но все- таки частных случаях. В общем случае вопрос о возможности такого предельного перехода, насколько нам известно, остается открытым. Данная работа закрывает данный зазор. В статье в общем случае приводится обоснование возможности отмеченного предельного перехода (когда функция затрат на проезд по ребру как функция потока по ребру вырождается в функцию, равную постоянным затратам до достижения пропускной способности, и равна плюс бесконечности, при превышении пропускной способности).
Ключевые слова: модель равновесного распределения потоков по путям, модель Бэкмана, модель стабильной динамики.
Proof of the connection between the Backman model with degenerate cost functions and the model of stable dynamics
Computer Research and Modeling, 2022, v. 14, no. 2, pp. 335-342Since 1950s the field of city transport modelling has progressed rapidly. The first equilibrium distribution models of traffic flow appeared. The most popular model (which is still being widely used) was the Beckmann model, based on the two Wardrop principles. The core of the model could be briefly described as the search for the Nash equilibrium in a population demand game, in which losses of agents (drivers) are calculated based on the chosen path and demands of this path with correspondences being fixed. The demands (costs) of a path are calculated as the sum of the demands of different path segments (graph edges), that are included in the path. The costs of an edge (edge travel time) are determined by the amount of traffic on this edge (more traffic means larger travel time). The flow on a graph edge is determined by the sum of flows over all paths passing through the given edge. Thus, the cost of traveling along a path is determined not only by the choice of the path, but also by the paths other drivers have chosen. Thus, it is a standard game theory task. The way cost functions are constructed allows us to narrow the search for equilibrium to solving an optimization problem (game is potential in this case). If the cost functions are monotone and non-decreasing, the optimization problem is convex. Actually, different assumptions about the cost functions form different models. The most popular model is based on the BPR cost function. Such functions are massively used in calculations of real cities. However, in the beginning of the XXI century, Yu. E. Nesterov and A. de Palma showed that Beckmann-type models have serious weak points. Those could be fixed using the stable dynamics model, as it was called by the authors. The search for equilibrium here could be also reduced to an optimization problem, moreover, the problem of linear programming. In 2013, A.V.Gasnikov discovered that the stable dynamics model can be obtained by a passage to the limit in the Beckmann model. However, it was made only for several practically important, but still special cases. Generally, the question if this passage to the limit is possible remains open. In this paper, we provide the justification of the possibility of the above-mentioned passage to the limit in the general case, when the cost function for traveling along the edge as a function of the flow along the edge degenerates into a function equal to fixed costs until the capacity is reached and it is equal to plus infinity when the capacity is exceeded.
-
Математическое моделирование кинетики и расчет дозиметрических характеристик остеотропных радиофармацевтических лекарственных препаратов
Компьютерные исследования и моделирование, 2022, т. 14, № 3, с. 647-660В отечественной медицине для радионуклидной терапии костных метастазов сегодня применяются два радиофармпрепарата: 89Sr-хлорид и 153Sm-оксабифор. Первый изних имеет много побочных эффектов, поэтому его применение ограничено. Второй доступен только в клиниках, транспортировка его в которые не занимает много времени. В настоящее время клинические исследования проходит третий радиофармпрепарат — 188Re-золерен. В связи с генераторным способом получения 188Re данный радиофармпрепарат должен стать доступным для применения во многих регионах нашей страны. Поэтому возникает необходимость в сравнительном анализе характеристик этих радиофармпрепаратов, в том числе на основе математического моделирования.
В статье рассмотрены особенности математического моделирования кинетики остеотропных радиофармацевтических лекарственных препаратов в организме человека с костными метастазами. На основе четырехкамерной модели разработан и апробирован комплекс моделирования и расчета фармакокинетических и дозиметрических характеристик радиофармпрепаратов для радионуклидной терапии костных метастазов. С использованием клинических данных идентифицированы транспортные константы модели и рассчитаны индивидуальные характеристики отечественных радиофармпрепаратов, меченных 89Sr, 153Sm и 188Re (эффективные периоды полувыведения, максимальные активности в камерах и времена их достижения, поглощенные дозы на костные ткани и метастазы, эндостальный слой кости, красный костный мозг, кровь, почки и мочевой пузырь). Получены и проанализированы зависимости «активность–время» для всех камер модели. Проведен сравнительный анализфар макокинетики и дозиметрии трех радиофармпрепаратов (89Sr-хлорид, 153Sm-оксабифор, 188Re-золерен).
Из сравнительного анализа фармакокинетических и дозиметрических характеристик этих радиофармацевтических лекарственных препаратов следует, что наилучшим изних для широкого применения во многих регионах нашей страны должен стать 188Re-золерен с учетом генераторного способа получения 188Re в условиях стационара.
Ключевые слова: математическое моделирование, ядерная медицина, дозиметрия, кинетика, радиофармпрепарат, камерная модель.
Mathematical modeling the kinetics and calculation of dosimetric characteristics of osteotropic radiopharmaceutical drugs
Computer Research and Modeling, 2022, v. 14, no. 3, pp. 647-660In Russian medicine two radiopharmaceuticals are currently used for radionuclide therapy of bone metastases: 89Sr-chloride and 153Sm-oxabifor. The first one has many side effects, so its use is limited. The second one is available only in clinics, its transportation to which does not take much time. Currently, the third radiopharmaceutical 188Re-solerene is undergoing clinical trials. Due to the generator method of obtaining 188Re, this radiopharmaceutical should become available for use in many regions of our country. Therefore, there is a need for a comparative analysis of the characteristics of these radiopharmaceuticals, including on the basis of mathematical modeling.
The article discusses the features of mathematical modeling the kinetics of osteotropic radiopharmaceutical drugs in the human body with bone metastases. Based on the four-compartment model, a complex of modeling and calculation of pharmacokinetic and dosimetric characteristics of radiopharmaceuticals for radionuclide therapy of bone metastases was developed and tested. Using clinical data, the transport constants of the model were identified and the individual characteristics of Russian radiopharmaceuticals labeled 89Sr, 153Sm and 188Re were calculated (effective half-lives, maximum activity in the compartments and the times of their achievement, absorbed doses to bone tissue and metastases, endosteal bone layer, red bone marrow, blood, kidneys and bladder). The time activity dependencies for all compartments of the model are obtained and analyzed. A comparative analysis of the pharmacokinetics and dosimetry of three radiopharmaceuticals (89Sr-chloride, 153Sm-oxabiphore, 188Re-solerene) was carried out.
From a comparative analysis of the pharmacokinetic and dosimetric characteristics of these radiopharmaceutical drugs, it follows that the best of them for widespread use in many regions of our country should be 188Re-solerene, taking into account the generator method of obtaining 188Re in a hospital.
-
Моделирование инициации молнии на базе динамического графа
Компьютерные исследования и моделирование, 2021, т. 13, № 1, с. 125-147Несмотря на многочисленные достижения современной науки, до сих пор остается нераскрытой проблема зарождения молниевого разряда в безэлектродном грозовом облаке, максимальная напряженность электрического поля в котором примерно на порядок меньше диэлектрической прочности воздуха. Хотя не вызывает сомнений тот факт, что развитие разряда начинается с появления в облаке положительных стримеров, развитие которых становится возможным при примерно вдвое меньших значениях электрического поля по сравнению с отрицательными, на настоящий момент остается неизученным вопрос о том, каким образом холодные слабопроводящие стримерные системы объединяются в горячий хорошо проводящий лидерный канал, способный к самостоятельному распространению за счет эффективной поляризации в относительно слабом внешнем поле. В данной работе представлена самоорганизующаяся транспортная модель, реализованная на примере формирования фрактального древа электрического разряда в грозовом облаке и направленная на численное моделирование процесса начальной стадии развития молниевого разряда. Среди инновационных особенностей нашего подхода, отсутствующих в других численных моделях развития молнии, можно выделитьот сутствие привязки элементов проводящей структуры графа к узлам пространственной решетки, высокое пространственно-временное разрешение и учет временной эволюции электрических параметров транспортных каналов. Кроме того, модельучи тывает известную из многочисленных экспериментов асимметрию полей развития положительных и отрицательных стримеров. В рамках используемого подхода результирующий хорошо проводящий лидерный канал формируется за счет коллективного эффекта объединения токов десятков тысяч взаимодействующих между собой стримеров, каждый из которых изначально обладает пренебрежимо малой проводимостью и температурой, не отличающейся от температуры окружающей среды. Модельное биполярное древо представляет собой направленный граф (имеет положительную и отрицательную части) и имеет морфологические и электро-динамические характеристики, промежуточные между лабораторной длинной искрой и развитой молнией. Модель имеет универсальный характер, что при необходимости позволяет использовать ее в рамках других задач, связанных с исследованием транспортных (в широком смысле слова) сетей.
Ключевые слова: коллективная динамика, дискретная транспортная модель, прикладная теория графов, фракталы, электрический разряд, молния.
Simulation of lightning initiation on the basis of dynamical grap
Computer Research and Modeling, 2021, v. 13, no. 1, pp. 125-147Despite numerous achievements of modern science the problem of lightning initiation in an electrodeless thundercloud, the maximum electric field strength inside which is approximately an order of magnitude lower than the dielectric strength of air, remains unsolved. Although there is no doubt that discharge activity begins with the appearance of positive streamers, which can develop under approximately half the threshold electric field as compared to negative ones, it remains unexplored how cold weakly conducting streamer systems unite in a joint hot well-conducting leader channel capable of self-propagation due to effective polarization in a relatively small external field. In this study, we present a self-organizing transport model which is applied to the case of electric discharge tree formation in a thundercloud. So, the model is aimed at numerical simulation of the initial stage of lightning discharge development. Among the innovative features of the model are the absence of grid spacing, high spatiotemporal resolution, and consideration of temporal evolution of electrical parameters of transport channels. The model takes into account the widely known asymmetry between threshold fields needed for positive and negative streamers development. In our model, the resulting well-conducting leader channel forms due to collective effect of combining the currents of tens of thousands of interacting streamer channels each of which initially has negligible conductivity and temperature that does not differ from the ambient one. The model bipolar tree is a directed graph (it has both positive and negative parts). It has morphological and electrodynamic characteristics which are intermediate between laboratory long spark and developed lightning. The model has universal character which allows to use it in other tasks related to the study of transport (in the broad sense of the word) networks.
-
Применение модели кинетического типа для изучения пространственного распространения COVID-19
Компьютерные исследования и моделирование, 2021, т. 13, № 3, с. 611-627Предлагается простая модель на основе уравнения кинетического типа для описания распространения вируса в пространстве посредством миграции носителей вируса из выделенного центра. Рассматриваются страны, для которых применима одномерная модель: Россия, Италия, Чили. Одномерный подход возможен из-за географического расположения этих стран и их протяженности в направлениях от центров заражения (Москвы, Ломбардии и Сантьяго соответственно). Определяется изменение плотности зараженных во времени и пространстве. Применяется двухпараметрическая модель. Первый параметр — величина средней скорости распространения, соответствующий переносу инфицированных транспортными средствами. Второй параметр — частота уменьшения количества инфицированных элементов по мере продвижения по территории страны, что связано с прибытием пассажиров в места назначения, а также с карантинными мерами, препятствующими их перемещению по стране. Параметры модели определяются по фактически известным данным. Строится аналитическое решение, для получения серии расчетов применяются также простые численные методы. В модели рассматривается пространственное распространение заболевания, при этом заражения на местах не учитываются. Поэтому вычисленные значения на начальном этапе хорошо соответствуют экспериментальным данным, а затем плотность заболевших начинает быстрее возрастать из-за заражений на местах. Тем не менее модельные расчеты позволяют делать некоторые предсказания. Помимо скорости заражения, возможна аналогичная «скорость выздоровления». По моменту времени достижения охвата большей части населения страны при движении фронта выздоровления делается вывод о начале глобального выздоровления, что соответствует реальным данным.
Application of the kinetic type model for study of a spatial spread of COVID-19
Computer Research and Modeling, 2021, v. 13, no. 3, pp. 611-627A simple model based on a kinetic-type equation is proposed to describe the spread of a virus in space through the migration of virus carriers from a certain center. The consideration is carried out on the example of three countries for which such a one-dimensional model is applicable: Russia, Italy and Chile. The geographical location of these countries and their elongation in the direction from the centers of infection (Moscow, Milan and Lombardia in general, as well as Santiago, respectively) makes it possible to use such an approximation. The aim is to determine the dynamic density of the infected in time and space. The model is two-parameter. The first parameter is the value of the average spreading rate associated with the transfer of infected moving by transport vehicles. The second parameter is the frequency of the decrease of the infected as they move through the country, which is associated with the passengers reaching their destination, as well as with quarantine measures. The parameters are determined from the actual known data for the first days of the spatial spread of the epidemic. An analytical solution is being built; simple numerical methods are also used to obtain a series of calculations. The geographical spread of the disease is a factor taken into account in the model, the second important factor is that contact infection in the field is not taken into account. Therefore, the comparison of the calculated values with the actual data in the initial period of infection coincides with the real data, then these data become higher than the model data. Those no less model calculations allow us to make some predictions. In addition to the speed of infection, a similar “speed of recovery” is possible. When such a speed is found for the majority of the country's population, a conclusion is made about the beginning of a global recovery, which coincides with real data.
-
Ускорение работы двухстадийной модели равновесного распределения потоков по сети
Компьютерные исследования и моделирование, 2022, т. 14, № 2, с. 343-355В работе приведены возможные улучшения двухстадийной модели равновесного распределения транспортных потоков, повышающие качество детализации моделирования и скорость вычисления алгоритмов. Модель состоит из двух блоков, первый блок — модель расчета матрицы корреспонденций, второй блок — модель равновесного распределения транспортных потоков по путям. Равновесием в двухстадийной модели транспортных потоков называют неподвижную точку цепочки из этих двух моделей. Более подробно теория и эксперименты по данной модели были описаны в предыдущих работах авторов. В этой статье в первую очередь рассмотрена возможность сокращения вычислительного времени алгоритма расчета кратчайших путей (в модели стабильной динамики, равновесно распределяющей потоки). В исходном варианте эта задача была выполнена с помощью алгоритма Дийкстры, но, так как после каждой итерации блока распределения транспортных потоков, время, требующееся для прохода по ребру, изменяется не на всех ребрах (и если изменяется, то очень незначительно), во многом этот алгоритм был избыточен. Поэтому были проведены эксперименты с более новым методом, учитывающим подобные особенности, и приведен краткий обзор других ускоряющих подходов для будущих исследований. Эксперименты показали, что в некоторых случаях использование выбранного T-SWSF-алгоритма действительно сокращает вычислительное время. Во вторую очередь в блоке восстановления матрицы корреспонденций алгоритм Синхорна был заменен на алгоритм ускоренного Синхорна (или AAM-алгоритм), что, к сожалению, не показало ожидаемых результатов, расчетное время не изменилось. Инак онец, в третьем и финальном разделе приведена визуализация результатов экспериментов по добавлению платных дорог в двухстадийную модель, что помогло сократить количество перегруженных ребер в сети. Также во введении кратко описана мотивация данных исследований, приведено описание работы двухстадийной модели, а также на маленьком примере с двумя городами разобрано, как с ее помощью выполняется поиск равновесия.
Ключевые слова: модель расчета матрицы корреспонденций, многостадийная модель, модель равновесного распределения потоков по путям.
Speeding up the two-stage simultaneous traffic assignment model
Computer Research and Modeling, 2022, v. 14, no. 2, pp. 343-355This article describes possible improvements for the simultaneous multi-stage transport model code for speeding up computations and improving the model detailing. The model consists of two blocks, where the first block is intended to calculate the correspondence matrix, and the second block computes the equilibrium distribution of traffic flows along the routes. The first block uses a matrix of transport costs that calculates a matrix of correspondences. It describes the costs (time in our case) of travel from one area to another. The second block presents how exactly the drivers (agents) are distributed along the possible paths. So, knowing the distribution of the flows along the paths, it is possible to calculate the cost matrix. Equilibrium in a two-stage traffic flow model is a fixed point of a sequence of the two described models. Thus, in this paper we report an attempt to influence the calculation speed of Dijkstra’s algorithm part of the model. It is used to calculate the shortest path from one point to another, which should be re-calculated after each iteration of the flow distribution part. We also study and implement the road pricing in the model code, as well as we replace the Sinkhorn algorithm in the calculation of the correspondence matrix part with its faster implementation. In the beginning of the paper, we provide a short theoretical overview of the transport modelling motivation; we discuss current approaches to the modelling and provide an example for demonstration of how the whole cycle of multi-stage transport modelling works.
-
Дискретная математическая модель системы «власть–общество–экономика» на основе клеточного автомата
Компьютерные исследования и моделирование, 2016, т. 8, № 3, с. 561-572Данная работа посвящена модификации ранее предлагавшегося автором дискретного варианта модели А. П. Михайлова «власть–общество». Эта модификация учитывает социально-экономическое развитие системы и коррупцию в ней по аналогии с непрерывной моделью «власть–общество–экономика–коррупция», но имеет в своей основе стохастический клеточный автомат, описывающий динамику распределения власти в иерархии. Новая версия модели построена путем введения в пространство состояний клетки ранее предлагавшегося клеточного автомата переменных, соответствующих численности населения, объему экономического производства, объему основных производственных фондов и уровню коррупции. Структура социально-экономических зависимостей в системе заимствована из модели Солоу и непрерывной детерминированной модели «власть–общество–экономика–коррупция», однако особенностью новой модели является ее гибкость, позволяющая рассматривать в ее рамках региональные различия во всех параметрах социально-экономического развития, различные модели производства и динамики народонаселения, а также транспортные связи между регионами. Построена имитационная система, включающая три уровня властной иерархии, пять регионов и 100 муниципалитетов, при помощи которой проведен ряд вычислительных экспериментов. В ходе этого исследования получены результаты, указывающие на изменение характера динамики распределения власти при повышении уровня коррупции. Если в отсутствие коррупции (аналогично предыдущей версии модели) распределение власти в иерархии асимптотически стремится к одному из стационарных состояний, то при наличии высокого уровня коррупции объем власти в системе испытывает нерегулярные колебательные изменения и лишь в дальнейшем также сходится к стационарному состоянию. Данные результаты можно содержательно интерпретировать как снижение стабильности властной иерархии при усилении коррупции.
Ключевые слова: система «власть–общество», клеточные автоматы, вычислительный эксперимент, имитационное моделирование, экономика, коррупция.
A discreet ‘power–society–economics’ model based on cellular automaton
Computer Research and Modeling, 2016, v. 8, no. 3, pp. 561-572Views (last year): 8. Citations: 1 (RSCI).In this paper we consider a new modification of the discrete version of Mikhailov’s ‘power–society’ model, previously proposed by the author. This modification includes social-economical dynamics and corruption of the system similarly to continuous ‘power–society–economics–corruption’ model but is based on a stochastic cellular automaton describing the dynamics of power distribution in a hierarchy. This new version is founded on previously proposed ‘power–society’ system modeling cellular automaton, its cell state space enriched with variables corresponding to population, economic production, production assets volume and corruption level. The social-economical structure of the model is inherited from Solow and deterministic continuous ‘power–society–economics–corruption’ models. At the same time the new model is flexible, allowing to consider regional differentiation in all social and economical dynamics parameters, to use various production and demography models and to account for goods transit between the regions. A simulation system was built, including three power hierarchy levels, five regions and 100 municipalities. and a number of numerical experiments were carried out. This research yielded results showing specific changes of the dynamics in power distribution in hierarchy when corruption level increases. While corruption is zero (similar to the previous version of the model) the power distribution in hierarchy asymptotically tends to one of stationary states. If the corruption level increases substantially, volume of power in the system is subjected to irregular oscillations, and only much later tends to a stationary value. The meaning of these results can be interpreted as the fact that the stability of power hierarchy decreases when corruption level goes up.
-
Управление высокоманевренным мобильным роботом в задаче следования за объектом
Компьютерные исследования и моделирование, 2023, т. 15, № 5, с. 1301-1321Данная статья посвящена разработке алгоритма траекторного управления высокоманевренной транспортной четырехколесной роботехнической платформой, оснащенной mecanum-колесами, с целью организации ее движения за некоторым подвижным объектом. Представлен расчет кинематических соотношений данной платформы в фиксированной системе координат, необходимый для определения угловых скоростей колес робота в зависимости от заданного вектора скорости. Разработан алгоритм движения робота за мобильным объектом на плоскости без препятствий на основе использования модифицированного метода погони с использованием разных видов управляющих функций. Метод погони заключается в том, что вектор скорости геометрического центра платформы сонаправлен с вектором, соединяющим геометрический центр платформы и движущийся объект. Реализовано два вида управляющих функций: кусочная и постоянная. Под кусочной функцией имеется в виду управление с режимами переключения в зависимости от расстояния от робота до цели. Главной особенностью кусочной функции является плавное изменение скорости робота. Также управляющие функции разделяются по характеру поведения при приближении робота к цели. При применении одной из кусочных функций движение робота замедляется при достижении определенного расстояние между роботом и целью и полностью останавливается при критичном расстоянии. Другой вид поведения при приближении к цели заключается в изменении направления вектора скорости на противоположный, если расстояние между платформой и объектом будет минимально допустимым, что позволяет избегать столкновения при движении цели в направления робота. Данный вид поведения при приближении к цели реализован для кусочной и постоянной функции. Выполнено численное моделирование алгоритма управления роботом для различных управляющих функций в задаче преследования цели, где цель движется по окружности. Представлен псевдокод алгоритма управления и управляющих функций. Показаны графики траектории робота при движении за целью, изменения скорости, изменения угловых скоростей колес от времени для различных управляющих функций.
Motion control by a highly maneuverable mobile robot in the task of following an object
Computer Research and Modeling, 2023, v. 15, no. 5, pp. 1301-1321This article is devoted to the development of an algorithm for trajectory control of a highly maneuverable four-wheeled robotic transport platform equipped with mecanum wheels, in order to organize its movement behind some moving object. The calculation of the kinematic ratios of this platform in a fixed coordinate system is presented, which is necessary to determine the angular velocities of the robot wheels depending on a given velocity vector. An algorithm has been developed for the robot to follow a mobile object on a plane without obstacles based on the use of a modified chase method using different types of control functions. The chase method consists in the fact that the velocity vector of the geometric center of the platform is co-directed with the vector connecting the geometric center of the platform and the moving object. Two types of control functions are implemented: piecewise and constant. The piecewise function means control with switching modes depending on the distance from the robot to the target. The main feature of the piecewise function is a smooth change in the robot’s speed. Also, the control functions are divided according to the nature of behavior when the robot approaches the target. When using one of the piecewise functions, the robot’s movement slows down when a certain distance between the robot and the target is reached and stops completely at a critical distance. Another type of behavior when approaching the target is to change the direction of the velocity vector to the opposite, if the distance between the platform and the object is the minimum allowable, which avoids collisions when the target moves in the direction of the robot. This type of behavior when approaching the goal is implemented for a piecewise and constant function. Numerical simulation of the robot control algorithm for various control functions in the task of chasing a target, where the target moves in a circle, is performed. The pseudocode of the control algorithm and control functions is presented. Graphs of the robot’s trajectory when moving behind the target, speed changes, changes in the angular velocities of the wheels from time to time for various control functions are shown.
-
Повышение качества генерации маршрутов в SUMO на основе данных с детекторов с использованием обучения с подкреплением
Компьютерные исследования и моделирование, 2024, т. 16, № 1, с. 137-146Данная работа предлагает новый подход к построению высокоточных маршрутов на основе данных от транспортных детекторов в пакете моделирования трафика SUMO. Существующие инструменты, такие как flowrouter и routeSampler, имеют ряд недостатков, таких как отсутствие взаимодействия с сетью в процессе построения маршрутов. Наш rlRouter использует мультиагентное обучение с подкреплением (MARL), где агенты — это входящие полосы движения, а окружающая среда — дорожная сеть. Добавляя в сеть транспортные средства с определенными маршрутами, агенты получают вознаграждение за сопоставление данных с детекторами транспорта. В качестве алгоритма мультиагентного обучения с подкреплением использовался DQN с разделением параметров между агентами и LSTM-слоем для обработки последовательных данных.
Поскольку rlRouter обучается внутри симуляции SUMO, он может лучше восстанавливать маршруты, принимая во внимание взаимодействие транспортных средств внутри сети друг с другом и с сетевой инфраструктурой. Мы смоделировали различные дорожные ситуации на трех разных перекрестках, чтобы сравнить производительность маршрутизаторов SUMO с rlRouter. Мы использовали среднюю абсолютную ошибку (MAE) в качестве меры отклонения кумулятивных данных детекторов и от данных маршрутов. rlRouter позволил добиться высокого соответствия данным с детекторов. Мы также обнаружили, что, максимизируя вознаграждение за соответствие детекторам, результирующие маршруты также становятся ближе к реальным. Несмотря на то, что маршруты, восстановленные с помощью rlRouter, превосходят маршруты, полученные с помощью инструментов SUMO, они не полностью соответствуют реальным из-за естественных ограничений петлевых детекторов. Чтобы обеспечить более правдоподобные маршруты, необходимо оборудовать перекрестки другими видами транспортных счетчиков, например, детекторами-камерами.
Ключевые слова: транспортное моделирование, мультиагентное обучение с подкреплением, интеллектуальные транспортные системы.
Improving the quality of route generation in SUMO based on data from detectors using reinforcement learning
Computer Research and Modeling, 2024, v. 16, no. 1, pp. 137-146This work provides a new approach for constructing high-precision routes based on data from transport detectors inside the SUMO traffic modeling package. Existing tools such as flowrouter and routeSampler have a number of disadvantages, such as the lack of interaction with the network in the process of building routes. Our rlRouter uses multi-agent reinforcement learning (MARL), where the agents are incoming lanes and the environment is the road network. By performing actions to launch vehicles, agents receive a reward for matching data from transport detectors. Parameter Sharing DQN with the LSTM backbone of the Q-function was used as an algorithm for multi-agent reinforcement learning.
Since the rlRouter is trained inside the SUMO simulation, it can restore routes better by taking into account the interaction of vehicles within the network with each other and with the network infrastructure. We have modeled diverse traffic situations on three different junctions in order to compare the performance of SUMO’s routers with the rlRouter. We used Mean Absoluter Error (MAE) as the measure of the deviation from both cumulative detectors and routes data. The rlRouter achieved the highest compliance with the data from the detectors. We also found that by maximizing the reward for matching detectors, the resulting routes also get closer to the real ones. Despite the fact that the routes recovered using rlRouter are superior to the routes obtained using SUMO tools, they do not fully correspond to the real ones, due to the natural limitations of induction-loop detectors. To achieve more plausible routes, it is necessary to equip junctions with other types of transport counters, for example, camera detectors.
-
Использование реальных данных из нескольких источников для оптимизации транспортных потоков в пакете CTraf
Компьютерные исследования и моделирование, 2024, т. 16, № 1, с. 147-159Рассмотрена задача оптимального управления транспортным потоком в сети городских дорог. Управление осуществляется изменением длительностей рабочих фаз светофоров на регулируемых перекрестках. Приведено описание разработанной системы управления. В системе управления предусмотрено использование трех видов управлений: программного, с обратной связью и ручного. При управлении с обратной связью для определения количественных характеристик транспортного потока используются детекторы дорожной инфраструктуры, видеокамеры, индуктивные петлевые и радиолокационные датчики. Обработка сигналов с детекторов позволяет определить состояние транспортного потока в каждый текущий момент времени. Для определения моментов переключения рабочих фаз светофоров количественные характеристики транспортных потоков поступают в математическую модель транспортного потока, реализованную в вычислительной среде системы автоматического управления транспортными потоками. Модель представляет собой систему конечно-разностных рекуррентных уравнений и описывает изменение транспортного потока на каждом участке дороги в каждый такт времени на основе рассчитанных данных по характеристикам транспортного потока в сети, пропускным способностям маневров и распределению потока на перекрестках с альтернативными направлениями движения. Модель обладает свойствами масштабирования и агрегирования. Структура модели зависит от структуры графа управляемой сети дорог, а количество узлов в графе равно количеству рассматриваемых участков дорог сети. Моделирование изменений транспортного потока в режиме реального времени позволяет оптимально определять длительности рабочих фаз светофоров и обеспечивать управление транспортным потоком с обратной связью по его текущему состоянию. В работе рассмотрена система автоматического сбора и обработки данных, поступающих в модель. Для моделирования состояний транспортного потока в сети и решения задачи оптимального управления транспортным потоком разработан программный комплекс CTraf, краткое описание которого представлено в работе. Приведен пример решения задачи оптимального управления транспортным потокам в сети дорог города Москва на основе реальных данных.
Ключевые слова: управление транспортными потоками, оптимальное управление, моделирование транспортных потоков, эволюционные вычисления, обработка гетерогенных данных.
Utilizing multi-source real data for traffic flow optimization in CTraf
Computer Research and Modeling, 2024, v. 16, no. 1, pp. 147-159The problem of optimal control of traffic flow in an urban road network is considered. The control is carried out by varying the duration of the working phases of traffic lights at controlled intersections. A description of the control system developed is given. The control system enables the use of three types of control: open-loop, feedback and manual. In feedback control, road infrastructure detectors, video cameras, inductive loop and radar detectors are used to determine the quantitative characteristics of current traffic flow state. The quantitative characteristics of the traffic flows are fed into a mathematical model of the traffic flow, implemented in the computer environment of an automatic traffic flow control system, in order to determine the moments for switching the working phases of the traffic lights. The model is a system of finite-difference recurrent equations and describes the change in traffic flow on each road section at each time step, based on retrived data on traffic flow characteristics in the network, capacity of maneuvers and flow distribution through alternative maneuvers at intersections. The model has scaling and aggregation properties. The structure of the model depends on the structure of the graph of the controlled road network. The number of nodes in the graph is equal to the number of road sections in the considered network. The simulation of traffic flow changes in real time makes it possible to optimally determine the duration of traffic light operating phases and to provide traffic flow control with feedback based on its current state. The system of automatic collection and processing of input data for the model is presented. In order to model the states of traffic flow in the network and to solve the problem of optimal traffic flow control, the CTraf software package has been developed, a brief description of which is given in the paper. An example of the solution of the optimal control problem of traffic flows on the basis of real data in the road network of Moscow is given.
-
Математические особенности индивидуального дозиметрического планирования радиойодтерапии на основе фармакокинетического моделирования
Компьютерные исследования и моделирование, 2024, т. 16, № 3, с. 773-784При определении лечебных поглощенных доз в процессе радиойодтерапии в отечественной медицине все чаще используется метод индивидуального дозиметрического планирования (ИДП). Однако для успешной реализации данного метода необходимо наличие соответствующего программного обеспечения, позволяющего произвести моделирование фармакокинетики радиойода в организме пациента и рассчитать необходимую терапевтическую активность радиофармацевтического лекарственного препарата (РФЛП) для достижения в щитовидной железе запланированной лечебной поглощенной дозы.
Цель работы — разработка программного комплекса фармакокинетического моделирования и расчета индивидуальных поглощенных доз при радиойодтерапии на основе пятикамерной модели кинетики радиойода с применением двух математических методов оптимизации. Работа основана на принципах и методах фармакокинетики РФЛП (камерное моделирование). Для нахождения минимума функционала невязки при идентификации значений транспортных констант модели были использованы метод Хука – Дживса и метод имитации отжига. Расчет дозиметрических характеристик и вводимой терапевтической активности основан на методике расчета поглощенных доз через найденные в процессе моделирования функции активностей радиойода в камерах. Для идентификации параметров модели использованы результаты радиометрии щитовидной железы и мочи пациентов с введенным в организм радиойодом.
Разработан программный комплекс моделирования кинетики радиойода при его пероральном поступлении в организм. Для пациентов с диффузным токсическим зобом идентифицированы транспортные константы модели и рассчитаны индивидуальные фармакокинетические и дозиметрические характеристики (периоды полувыведения, максимальная активность в щитовидной железе и время ее достижения, поглощенные дозы на критические органы и ткани, вводимая терапевтическая активность). Получены и проанализированы зависимости «активность – время» для всех камер модели. Проведен сравнительный анализ фармакокинетических и дозиметрических характеристик, рассчитанных в рамках двух математических методов оптимизации. Осуществлена оценка stunning-эффекта и его вклад в погрешности расчета поглощенных доз. Из сравнительного анализа рассчитанных в рамках двух методов оптимизации фармакокинетических и дозиметрических характеристик следует, что использование более сложного математического метода имитации отжига в программном комплексе не приводит к существенным изменениям в значениях характеристик по сравнению с простым методом Хука – Дживса. Погрешности расчета поглощенных доз в рамках этих математических методов оптимизации не превышают вариации значений поглощенных доз от stunning-эффекта.
Ключевые слова: математическое моделирование, диффузный токсический зоб, индивидуальное дозиметрическое планирование, щитовидная железа, радиойод.
Mathematical features of individual dosimetric planning of radioiodotherapy based on pharmacokinetic modeling
Computer Research and Modeling, 2024, v. 16, no. 3, pp. 773-784When determining therapeutic absorbed doses in the process of radioiodine therapy, the method of individual dosimetric planning is increasingly used in Russian medicine. However, for the successful implementation of this method, it is necessary to have appropriate software that allows modeling the pharmacokinetics of radioiodine in the patient’s body and calculate the necessary therapeutic activity of a radiopharmaceutical drug to achieve the planned therapeutic absorbed dose in the thyroid gland.
Purpose of the work: development of a software package for pharmacokinetic modeling and calculation of individual absorbed doses in radioiodine therapy based on a five-chamber model of radioiodine kinetics using two mathematical optimization methods. The work is based on the principles and methods of RFLP pharmacokinetics (chamber modeling). To find the minimum of the residual functional in identifying the values of the transport constants of the model, the Hook – Jeeves method and the simulated annealing method were used. Calculation of dosimetric characteristics and administered therapeutic activity is based on the method of calculating absorbed doses using the functions of radioiodine activity in the chambers found during modeling. To identify the parameters of the model, the results of radiometry of the thyroid gland and urine of patients with radioiodine introduced into the body were used.
A software package for modeling the kinetics of radioiodine during its oral intake has been developed. For patients with diffuse toxic goiter, the transport constants of the model were identified and individual pharmacokinetic and dosimetric characteristics (elimination half-lives, maximum thyroid activity and time to reach it, absorbed doses to critical organs and tissues, administered therapeutic activity) were calculated. The activity-time relationships for all cameras in the model are obtained and analyzed. A comparative analysis of the calculated pharmacokinetic and dosimetric characteristics calculated using two mathematical optimization methods was performed. Evaluation completed the stunning-effect and its contribution to the errors in calculating absorbed doses. From a comparative analysis of the pharmacokinetic and dosimetric characteristics calculated in the framework of two optimization methods, it follows that the use of a more complex mathematical method for simulating annealing in a software package does not lead to significant changes in the values of the characteristics compared to the simple Hook – Jeeves method. Errors in calculating absorbed doses in the framework of these mathematical optimization methods do not exceed the spread of absorbed dose values from the stunning-effect.
Indexed in Scopus
Full-text version of the journal is also available on the web site of the scientific electronic library eLIBRARY.RU
The journal is included in the Russian Science Citation Index
The journal is included in the RSCI
International Interdisciplinary Conference "Mathematics. Computing. Education"