Результаты поиска по 'методы первого порядка':
Найдено статей: 68
  1. Двуреченский П.Е.
    Градиентный метод с неточным оракулом для задач композитной невыпуклой оптимизации
    Компьютерные исследования и моделирование, 2022, т. 14, № 2, с. 321-334

    В этой статье мы предлагаем новый метод первого порядка для композитных невыпуклых задач минимизации с простыми ограничениями и неточным оракулом. Целевая функция задается как сумма «сложной», возможно, невыпуклой части с неточным оракулом и «простой» выпуклой части. Мы обобщаем понятие неточного оракула для выпуклых функций на случай невыпуклых функций. Неформально говоря, неточность оракула означает, что для «сложной» части в любой точке можно приближенно вычислить значение функции и построить квадратичную функцию, которая приближенно ограничивает эту функцию сверху. Рассматривается два возможных типа ошибки: контролируемая, которая может быть сде- лана сколь угодно маленькой, например, за счет решения вспомогательной задачи, и неконтролируемая. Примерами такой неточности являются: гладкие невыпуклые функции с неточным и непрерывным по Гёльдеру градиентом, функции, заданные вспомогательной равномерно вогнутой задачей максимизации, которая может быть решена лишь приближенно. Для введенного класса задачм ы предлагаем метод типа проекции градиента / зеркального спуска, который позволяет использовать различные прокс-функции для задания неевклидовой проекции на допустимое множество и более гибкой адаптации к геометрии допустимого множества; адаптивно выбирает контролируемую ошибку оракула и ошибку неевклидового проектирования; допускает неточное проксимальное отображение с двумя типами ошибки: контролируемой и неконтролируемой. Мы доказываем скорость сходимости нашего метода в терминах нормы обобщенного градиентного отображения и показываем, что в случае неточного непрерывного по Гёльдеру градиента наш метод является универсальным по отношению к параметру и константе Гёльдера. Это означает, что методу не нужно знание этих параметров для работы. При этом полученная оценка сложности является равномерно наилучшей при всех параметрах Гёльдера. Наконец, в частном случае показано, что малое значение нормы обобщенного градиентного отображения в точке означает, что в этой точке приближенно выполняется необходимое условие локального минимума.

    Dvurechensky P.E.
    A gradient method with inexact oracle for composite nonconvex optimization
    Computer Research and Modeling, 2022, v. 14, no. 2, pp. 321-334

    In this paper, we develop a new first-order method for composite nonconvex minimization problems with simple constraints and inexact oracle. The objective function is given as a sum of «hard», possibly nonconvex part, and «simple» convex part. Informally speaking, oracle inexactness means that, for the «hard» part, at any point we can approximately calculate the value of the function and construct a quadratic function, which approximately bounds this function from above. We give several examples of such inexactness: smooth nonconvex functions with inexact H¨older-continuous gradient, functions given by the auxiliary uniformly concave maximization problem, which can be solved only approximately. For the introduced class of problems, we propose a gradient-type method, which allows one to use a different proximal setup to adapt to the geometry of the feasible set, adaptively chooses controlled oracle error, allows for inexact proximal mapping. We provide a convergence rate for our method in terms of the norm of generalized gradient mapping and show that, in the case of an inexact Hölder-continuous gradient, our method is universal with respect to Hölder parameters of the problem. Finally, in a particular case, we show that the small value of the norm of generalized gradient mapping at a point means that a necessary condition of local minimum approximately holds at that point.

  2. Белобородова Е.И., Тамм М.В.
    О некоторых свойствах коротковолновой статистики временных рядов FOREX
    Компьютерные исследования и моделирование, 2017, т. 9, № 4, с. 657-669

    Финансовая математика является одним из наиболее естественных приложений для статистического анализа временных рядов. Действительно, финансовые временные ряды являются порождением одновременной деятельности большого числа различных экономических агентов, что дает основания ожидать, что к ним могут быть применимы методы статистической физики и теории случайных процессов.

    В настоящей работе проведен статистический анализ временных рядов для пар валют на рынке FOREX. Особый интерес представляет сравнение поведения временного ряда как функции, с одной стороны, физического времени и, с другой стороны, условного торгового времени, измеряемого в числе элементарных актов изменения цены (тиков). Экспериментально наблюдаемая статистика рассмотренных временных рядов (пар валют «евро–доллар» для первых половин 2007 и 2009 годов и «британский фунт–доллар» для 2007 года) радикально отличается в зависимости от выбора способа измерения времени. Так, при измерении времени в единицах тиков распределение приращений цены может быть хорошо описано нормальным распределением уже на масштабе порядка десяти тиков. При этом при измерении приращений цены как функции реального физического времени распределение приращений продолжает радикально отличаться от нормального, вплоть до масштабов порядка минут и даже часов.

    Для объяснения этого явления нами исследованы статистические свойства элементарных приращений по цене и по времени. В частности, показано, что распределение времени между тиками для всех трех рассмотренных временных рядов имеет длинные (1-2 порядка по времени) степенные хвосты с экспоненциальным обрезанием на больших временах. Получены приближенные выражения для распределений времен ожидания для всех трех рассмотренных случаев. Другие статистические характеристики временного ряда (распределение элементарных изменений цены, парные корреляционные функции для приращений цены и для времен ожидания) демонстрируют достаточно простое поведение. Таким образом, именно аномально широкое распределение времен ожидания играет наиболее важную роль в наблюдаемом отклонении распределения приращений от нормального. В связи с этим результатом мы обсуждаем возможность применения модели случайного процесса с непрерывным временем (continuous time random walk, CTRW) для описания временных рядов FOREX.

    Beloborodova E.I., Tamm M.V.
    On some properties of short-wave statistics of FOREX time series
    Computer Research and Modeling, 2017, v. 9, no. 4, pp. 657-669

    Financial mathematics is one of the most natural applications for the statistical analysis of time series. Financial time series reflect simultaneous activity of a large number of different economic agents. Consequently, one expects that methods of statistical physics and the theory of random processes can be applied to them.

    In this paper, we provide a statistical analysis of time series of the FOREX currency market. Of particular interest is the comparison of the time series behavior depending on the way time is measured: physical time versus trading time measured in the number of elementary price changes (ticks). The experimentally observed statistics of the time series under consideration (euro–dollar for the first half of 2007 and for 2009 and British pound – dollar for 2007) radically differs depending on the choice of the method of time measurement. When measuring time in ticks, the distribution of price increments can be well described by the normal distribution already on a scale of the order of ten ticks. At the same time, when price increments are measured in real physical time, the distribution of increments continues to differ radically from the normal up to scales of the order of minutes and even hours.

    To explain this phenomenon, we investigate the statistical properties of elementary increments in price and time. In particular, we show that the distribution of time between ticks for all three time series has a long (1-2 orders of magnitude) power-law tails with exponential cutoff at large times. We obtained approximate expressions for the distributions of waiting times for all three cases. Other statistical characteristics of the time series (the distribution of elementary price changes, pair correlation functions for price increments and for waiting times) demonstrate fairly simple behavior. Thus, it is the anomalously wide distribution of the waiting times that plays the most important role in the deviation of the distribution of increments from the normal. As a result, we discuss the possibility of applying a continuous time random walk (CTRW) model to describe the FOREX time series.

    Views (last year): 10.
  3. Брацун Д.А., Бузмаков М.Д.
    Репрессилятор с запаздывающей экспрессией генов. Часть II. Стохастическое описание
    Компьютерные исследования и моделирование, 2021, т. 13, № 3, с. 587-609

    Репрессилятором называют первую в синтетической биологии генную регуляторную сеть, искусственно сконструированную в 2000 году. Он представляет собой замкнутую малоразмерную цепь из трех генов: $lacI$, $\lambda cI$ и $tetR$, которые в такой комбинации в природе не встречаются. Промотор каждого гена контролирует следующий за ним цистрон по принципу отрицательной обратной связи, подавляя экспрессию соседнего гена. Ранее в работе [Брацун и др., 2018] была предложена математическая модель запаздывающего репрессилятора и изучены ее свойства в рамках детерминистского описания. Предполагается, что запаздывание может быть как естественным, т. е. возникать во время процессов транскрипции/трансляции в силу многоступенчатого характера этих процессов, так и искусственным, т. е. специально вноситься в работу регуляторной сети с помощью методов генной инженерии. Данная работа посвящена стохастическому описанию динамических процессов в запаздывающем репрессиляторе, которое является важным дополнением детерминистского анализа из-за сильных флуктуаций и небольшого числа молекул, принимающих обычно участие в генной регуляции. Стохастическое исследование было проведено численно с помощью алгоритма Гиллеспи, модифицированного для систем с запаздыванием. Приводятся описание алгоритма, его программная реализация и результаты тестовых расчетов для одногенного авторепрессора с запаздыванием. При исследовании репрессилятора обнаружено, что стохастическое описание в ряде случаев дает новую информацию о поведении системы, которая не сводится к детерминистской динамике даже при усреднении по большому числу реализаций. В подкритической области, где детерминистский анализ предсказывает абсолютную устойчивость системы, было обнаружено возбуждение квазирегулярных колебаний, вызываемых нелинейным взаимодействием шума и запаздывания. Выше порога возникновения неустойчивости обнаружено спонтанное изменение фазы колебаний из-за внезапной временной деградации этих колебаний. Ранее в детерминистском анализе был обнаружен долгоживущий переходный режим, который отвечает движению фазовой траектории по медленному многообразию и отражает процесс длительной синхронизации пульсаций в работе отдельных генов. Показано, что в стохастическом случае переход к кооперативному режиму работы генов репрессилятора происходит в среднем на два порядка быстрее. Построено распределение вероятности соскока фазовой траектории с медленного многообразия и определено наиболее вероятное время такого перехода. Обсуждается влияние внутреннего шума химических реакций на динамические свойства репрессилятора.

    Bratsun D.A., Buzmakov M.D.
    Repressilator with time-delayed gene expression. Part II. Stochastic description
    Computer Research and Modeling, 2021, v. 13, no. 3, pp. 587-609

    The repressilator is the first genetic regulatory network in synthetic biology, which was artificially constructed in 2000. It is a closed network of three genetic elements $lacI$, $\lambda cI$ and $tetR$, which have a natural origin, but are not found in nature in such a combination. The promoter of each of the three genes controls the next cistron via the negative feedback, suppressing the expression of the neighboring gene. In our previous paper [Bratsun et al., 2018], we proposed a mathematical model of a delayed repressillator and studied its properties within the framework of a deterministic description. We assume that delay can be both natural, i.e. arises during the transcription / translation of genes due to the multistage nature of these processes, and artificial, i.e. specially to be introduced into the work of the regulatory network using gene engineering technologies. In this work, we apply the stochastic description of dynamic processes in a delayed repressilator, which is an important addition to deterministic analysis due to the small number of molecules involved in gene regulation. The stochastic study is carried out numerically using the Gillespie algorithm, which is modified for time delay systems. We present the description of the algorithm, its software implementation, and the results of benchmark simulations for a onegene delayed autorepressor. When studying the behavior of a repressilator, we show that a stochastic description in a number of cases gives new information about the behavior of a system, which does not reduce to deterministic dynamics even when averaged over a large number of realizations. We show that in the subcritical range of parameters, where deterministic analysis predicts the absolute stability of the system, quasi-regular oscillations may be excited due to the nonlinear interaction of noise and delay. Earlier, we have discovered within the framework of the deterministic description, that there exists a long-lived transient regime, which is represented in the phase space by a slow manifold. This mode reflects the process of long-term synchronization of protein pulsations in the work of the repressilator genes. In this work, we show that the transition to the cooperative mode of gene operation occurs a two order of magnitude faster, when the effect of the intrinsic noise is taken into account. We have obtained the probability distribution of moment when the phase trajectory leaves the slow manifold and have determined the most probable time for such a transition. The influence of the intrinsic noise of chemical reactions on the dynamic properties of the repressilator is discussed.

  4. Савин С.И., Ворочаева Л.Ю., Куренков В.В.
    Математическое моделирование тенсегрити-роботов с жесткими стержнями
    Компьютерные исследования и моделирование, 2020, т. 12, № 4, с. 821-830

    В работе рассматривается вопрос математического моделирования робототехнических структур на основе напряженно-связных конструкций, известных в англоязычных источниках как tensegrity structures (тенсегрити-структуры). Определяющим свойством таких конструкций является то, что образующие их элементы работают только на сжатие или растяжение, что позволяет использовать материалы и конструктивные решения для выполнения этих элементов, минимизирующие вес структуры, сохраняя ее прочность.

    Тенсегрити-структуры отличаются рядом свойств, важных для коллаборативной робототехники, задач разведывания и движения в недетерминированных средах: естественной податливостью, компактностью при транспортировке, малым весом при значительной удароустойчивости и жесткости. При этом открытыми остаются многие вопросы управления такими структурами, что в свою очередь связано со сложностью описания их динамики.

    В работе предложен подход к описанию и составлению динамических уравнений для таких конструкций, основанный на описании динамики второго порядка декартовых координат элементов структуры (стержней), динамики первого порядка для угловых скоростей стержней и динамики первого порядка для кватернионов, используемых для описания ориентации стержней. Предложен подход к численному решению составленных динамических уравнений. Предложенные методы реализованы в виде свободно распространяемого математического пакета с открытым исходным кодом.

    В работе продемонстрировано, как разработанный программный комплекс может использоваться для моделирования динамики и определения режимов работы тенсегрити-структур. Рассмотрен пример тенсегрити-структуры с тремя жесткими стержнями и девятью упругими элементами, работающими на растяжение (тросами), движущейся в невесомости. Показаны особенности динамики структуры в процессе достижения положения равновесия, определены области начальных значений параметров ориентации стержней, при которых структура работает в штатном режиме, и значения, при которых растяжение тросов превышает выбранное критическое значение или происходит провисание тросов. Полученные результаты могут непосредственно использоваться при анализе характера пассивных динамических движений роботов, основанных на трехзвенной тенсегрити-структуре, рассмотренный в работе; предложенные методы моделирования и разработанное программное обеспечение пригодны для моделирования значительного многообразия тенсегрити-роботов.

    Savin S.I., Vorochaeva L.I., Kurenkov V.V.
    Mathematical modelling of tensegrity robots with rigid rods
    Computer Research and Modeling, 2020, v. 12, no. 4, pp. 821-830

    In this paper, we address the mathematical modeling of robots based on tensegrity structures. The pivotal property of such structures is the forming elements working only for compression or tension, which allows the use of materials and structural solutions that minimize the weight of the structure while maintaining its strength.

    Tensegrity structures hold several properties important for collaborative robotics, exploration and motion tasks in non-deterministic environments: natural compliance, compactness for transportation, low weight with significant impact resistance and rigidity. The control of such structures remains an open research problem, which is associated with the complexity of describing the dynamics of such structures.

    We formulate an approach for describing the dynamics of such structures, based on second-order dynamics of the Cartesian coordinates of structure elements (rods), first-order dynamics for angular velocities of rods, and first-order dynamics for quaternions that are used to describe the orientation of rods. We propose a numerical method for solving these dynamic equations. The proposed methods are implemented in the form of a freely distributed mathematical package with open source code.

    Further, we show how the provided software package can be used for modeling the dynamics and determining the operating modes of tensegrity structures. We present an example of a tensegrity structure moving in zero gravity with three rigid rods and nine elastic elements working in tension (cables), showing the features of the dynamics of the structure in reaching the equilibrium position. The range of initial conditions for which the structure operates in the normal mode is determined. The results can be directly used to analyze the nature of passive dynamic movements of the robots based on a three-link tensegrity structure, considered in the paper; the proposed modeling methods and the developed software are suitable for modeling a significant variety of tensegrity robots.

  5. Кольцов Ю.В., Бобошко Е.В.
    Сравнительный анализ методов оптимизации для решения задачи интервальной оценки потерь электроэнергии
    Компьютерные исследования и моделирование, 2013, т. 5, № 2, с. 231-239

    Данная работа посвящена сравнительному анализу оптимизационных методов и алгоритмов для проведения интервальной оценки технических потерь электроэнергии в распределительных сетях напряжением 6–20 кВ. Задача интервальной оценки потерь сформулирована в виде задачи многомерной условной минимизации/максимизации с неявной целевой функцией. Рассмотрен ряд методов численной оптимизации первого и нулевого порядков, с целью определения наиболее подходящего для решения рассмотренной проблемы. Таким является алгоритм BOBYQA, в котором целевая функция заменяется ее квадратичной аппроксимацией в пределах доверительной области.

    Koltsov Y.V., Boboshko E.V.
    Comparative analysis of optimization methods for electrical energy losses interval evaluation problem
    Computer Research and Modeling, 2013, v. 5, no. 2, pp. 231-239

    This article is dedicated to a comparison analysis of optimization methods, in order to perform an interval estimation of electrical energy technical losses in distribution networks of voltage 6–20 kV. The issue of interval evaluation is represented as a multi-dimensional conditional minimization/maximization problem with implicit target function. A number of numerical optimization methods of first and zero orders is observed, with the aim of determining the most suitable for the problem of interest. The desired algorithm is BOBYQA, in which the target function is replaced with its quadratic approximation in some trusted region.

    Views (last year): 2. Citations: 1 (RSCI).
  6. Ворновских П.А., Ким А., Прохоров И.В.
    Применимость приближения однократного рассеяния при импульсном зондировании неоднородной среды
    Компьютерные исследования и моделирование, 2020, т. 12, № 5, с. 1063-1079

    В работе рассмотрена математическая модель, основанная на линейном интегро-дифференциальном уравнении Больцмана, описывающая перенос излучения в рассеивающей среде, подвергающейся импульсному облучению точечным источником. Сформулирована обратная задача для уравнения переноса, заключающаяся в определении коэффициента рассеяния по временно-угловому распределению плотности потока излучения в заданной точке пространства. При исследовании обратной задачи анализируется представление решения уравнения в виде ряда Неймана. Нулевой член ряда описывает нерассеянное излучение, первый член ряда — однократно рассеянное поле, остальные члены — многократно рассеянное поле. Для областей с небольшой оптической толщиной и невысоким уровнем рассеяния при нахождении приближенного решения уравнения переноса излучения широкое распространение получило приближение однократного рассеяния. При использовании этого подхода к задаче с дополнительными ограничениями на исходные данные получена аналитическая формула для нахождения коэффициента рассеяния. Для проверки адекватности полученной формулы построен и программно реализован весовой метод Монте-Карло решения уравнения переноса, учитывающий многократное рассеяние в среде и пространственно-временную сингулярность источника излучения. Применительно к проблемам высокочастотного акустического зондирования в океане проведены вычислительные эксперименты. Показано, что применение приближения однократного рассеяния оправдано по крайней мере на дальности зондирования порядка ста метров, причем основное влияние на погрешность формулы вносят двукратно и трехкратно рассеянные поля. Для областей большего размера приближение однократного рассеяния в лучшем случае дает лишь качественное представление о структуре среды, иногда не позволяя определить даже порядок количественных характеристик параметров взаимодействия излучения с веществом.

    Vornovskikh P.A., Kim A., Prokhorov I.V.
    The applicability of the approximation of single scattering in pulsed sensing of an inhomogeneous medium
    Computer Research and Modeling, 2020, v. 12, no. 5, pp. 1063-1079

    The mathematical model based on the linear integro-differential Boltzmann equation is considered in this article. The model describes the radiation transfer in the scattering medium irradiated by a point source. The inverse problem for the transfer equation is defined. This problem consists of determining the scattering coefficient from the time-angular distribution of the radiation flux density at a given point in space. The Neumann series representation for solving the radiation transfer equation is analyzed in the study of the inverse problem. The zero member of the series describes the unscattered radiation, the first member of the series describes a single-scattered field, the remaining members of the series describe a multiple-scattered field. When calculating the approximate solution of the radiation transfer equation, the single scattering approximation is widespread to calculated an approximate solution of the equation for regions with a small optical thickness and a low level of scattering. An analytical formula is obtained for finding the scattering coefficient by using this approximation for problem with additional restrictions on the initial data. To verify the adequacy of the obtained formula the Monte Carlo weighted method for solving the transfer equation is constructed and software implemented taking into account multiple scattering in the medium and the space-time singularity of the radiation source. As applied to the problems of high-frequency acoustic sensing in the ocean, computational experiments were carried out. The application of the single scattering approximation is justified, at least, at a sensing range of about one hundred meters and the double and triple scattered fields make the main impact on the formula error. For larger regions, the single scattering approximation gives at the best only a qualitative evaluation of the medium structure, sometimes it even does not allow to determine the order of the parameters quantitative characteristics of the interaction of radiation with matter.

  7. Остроухов П.А., Камалов Р.А., Двуреченский П.Е., Гасников А.В.
    Тензорные методы для сильно выпуклых сильно вогнутых седловых задач и сильно монотонных вариационных неравенств
    Компьютерные исследования и моделирование, 2022, т. 14, № 2, с. 357-376

    В данной статье предлагаются методы оптимизации высокого порядка (тензорные методы) для решения двух типов седловых задач. Первый тип — это классическая мин-макс-постановка для поиска седловой точки функционала. Второй тип — это поиск стационарной точки функционала седловой задачи путем минимизации нормы градиента этого функционала. Очевидно, что стационарная точка не всегда совпадает с точкой оптимума функции. Однако необходимость в решении подобного типа задач может возникать в случае, если присутствуют линейные ограничения. В данном случае из решения задачи поиска стационарной точки двойственного функционала можно восстановить решение задачи поиска оптимума прямого функционала. В обоих типах задач какие-либо ограничения на область определения целевого функционала отсутствуют. Также мы предполагаем, что целевой функционал является $\mu$-сильно выпуклыми $\mu$-сильно вогнутым, а также что выполняется условие Липшица для его $p$-й производной.

    Для задач типа «мин-макс» мы предлагаем два алгоритма. Так как мы рассматриваем сильно выпуклую и сильно вогнутую задачу, первый алгоритмиспо льзует существующий тензорный метод для решения выпуклых вогнутых седловых задач и ускоряет его с помощью техники рестартов. Таким образом удается добиться линейной скорости сходимости. Используя дополнительные предположения о выполнении условий Липшица для первой и второй производных целевого функционала, можно дополнительно ускорить полученный метод. Для этого можно «переключиться» на другой существующий метод для решения подобных задач в зоне его квадратичной локальной сходимости. Так мы получаем второй алгоритм, обладающий глобальной линейной сходимостью и локальной квадратичной сходимостью. Наконец, для решения задач второго типа существует определенная методология для тензорных методов в выпуклой оптимизации. Суть ее заключается в применении специальной «обертки» вокруг оптимального метода высокого порядка. Причем для этого условие сильной выпуклости не является необходимым. Достаточно лишь правильным образом регуляризовать целевой функционал, сделав его таким образом сильно выпуклым и сильно вогнутым. В нашей работе мы переносим эту методологию на выпукло-вогнутые функционалы и используем данную «обертку» на предлагаемом выше алгоритме с глобальной линейной сходимостью и локальной квадратичной сходимостью. Так как седловая задача является частным случаем монотонного вариационного неравенства, предлагаемые методы также подойдут для поиска решения сильно монотонных вариационных неравенств.

    Ostroukhov P.A., Kamalov R.A., Dvurechensky P.E., Gasnikov A.V.
    Tensor methods for strongly convex strongly concave saddle point problems and strongly monotone variational inequalities
    Computer Research and Modeling, 2022, v. 14, no. 2, pp. 357-376

    In this paper we propose high-order (tensor) methods for two types of saddle point problems. Firstly, we consider the classic min-max saddle point problem. Secondly, we consider the search for a stationary point of the saddle point problem objective by its gradient norm minimization. Obviously, the stationary point does not always coincide with the optimal point. However, if we have a linear optimization problem with linear constraints, the algorithm for gradient norm minimization becomes useful. In this case we can reconstruct the solution of the optimization problem of a primal function from the solution of gradient norm minimization of dual function. In this paper we consider both types of problems with no constraints. Additionally, we assume that the objective function is $\mu$-strongly convex by the first argument, $\mu$-strongly concave by the second argument, and that the $p$-th derivative of the objective is Lipschitz-continous.

    For min-max problems we propose two algorithms. Since we consider strongly convex a strongly concave problem, the first algorithm uses the existing tensor method for regular convex concave saddle point problems and accelerates it with the restarts technique. The complexity of such an algorithm is linear. If we additionally assume that our objective is first and second order Lipschitz, we can improve its performance even more. To do this, we can switch to another existing algorithm in its area of quadratic convergence. Thus, we get the second algorithm, which has a global linear convergence rate and a local quadratic convergence rate.

    Finally, in convex optimization there exists a special methodology to solve gradient norm minimization problems by tensor methods. Its main idea is to use existing (near-)optimal algorithms inside a special framework. I want to emphasize that inside this framework we do not necessarily need the assumptions of strong convexity, because we can regularize the convex objective in a special way to make it strongly convex. In our article we transfer this framework on convex-concave objective functions and use it with our aforementioned algorithm with a global linear convergence and a local quadratic convergence rate.

    Since the saddle point problem is a particular case of the monotone variation inequality problem, the proposed methods will also work in solving strongly monotone variational inequality problems.

  8. Лукьянцев Д.С., Афанасьев Н.Т., Танаев А.Б., Чудаев С.О.
    Численно-аналитическое моделирование гравитационного линзирования электромагнитных волн в случайно-неоднородной космической плазме
    Компьютерные исследования и моделирование, 2024, т. 16, № 2, с. 433-443

    Для интерпретации данных измерений астрофизических прецизионных инструментов нового поколения разработан аппарат численно-аналитического моделирования характеристик распространения электромагнитных волн в хаотической космической плазме с учетом эффектов гравитации. Задача распространения волн в искривленном (римановом) пространстве решена в евклидовом пространстве путем введения эффективного показателя преломления вакуума, выраженного через потенциал тяготения. Задавая различные модели плотности распределения массы астрофизических объектов и решая уравнение Пуассона, можно рассчитать гравитационный потенциал и вычислить эффективный показатель преломления вакуума. В предположении аддитивности вкладов различных объектов в общее гравитационное поле предложена приближенная модель эффективного показателя преломления. Считая пространственные масштабы показателя преломления много больше длины волны, расчет характеристик электромагнитных волн в поле тяготения астрофизических объектов проводится в приближении геометрической оптики. В основу численно-аналитического аппарата моделирования траекторных характеристик волн положены лучевые дифференциальные уравнения в форме Эйлера. Хаотические неоднородности космической плазмы заданы моделью пространственной корреляционной функции показателя преломления. Расчеты рефракционного рассеяния волн выполнены в приближении метода возмущений. Получены интегральные выражения для статистических моментов боковых отклонений лучей в картинной плоскости наблюдателя. С помощью аналитических преобразований интегралы для моментов сведены к системе обыкновенных дифференциальных уравнений первого порядка для совместного численного расчета средних и среднеквадратичных отклонений лучей. Приведены результаты численно-аналитического моделирования траекторной картины распространения электромагнитных волн в межзвездной среде с учетом воздействий полей тяготения космических объектов и рефракционного рассеяния волн на неоднородностях показателя преломления окружающей плазмы. На основе результатов моделирования сделана количественная оценка условий стохастического замывания эффектов гравитационного линзирования электромагнитных волн в различных частотных диапазонах. Показано, что рабочие частоты метрового диапазона длин волн представляют собой условную низкочастотную границу для наблюдений эффекта гравитационного линзирования в стохастической космической плазме. Предложенный аппарат численно-аналитического моделирования можно использовать для анализа структуры электромагнитного излучения квазаров, прошедшего группу галактик.

    Lukyantsev D.S., Afanasiev N.T., Tanaev A.B., Chudaev S.O.
    Numerical-analytical modeling of gravitational lensing of the electromagnetic waves in random-inhomogeneous space plasma
    Computer Research and Modeling, 2024, v. 16, no. 2, pp. 433-443

    Instrument of numerical-analytical modeling of characteristics of propagation of electromagnetic waves in chaotic space plasma with taking into account effects of gravitation is developed for interpretation of data of measurements of astrophysical precision instruments of new education. The task of propagation of waves in curved (Riemann’s) space is solved in Euclid’s space by introducing of the effective index of refraction of vacuum. The gravitational potential can be calculated for various model of distribution of mass of astrophysical objects and at solution of Poisson’s equation. As a result the effective index of refraction of vacuum can be evaluated. Approximate model of the effective index of refraction is suggested with condition that various objects additively contribute in total gravitational field. Calculation of the characteristics of electromagnetic waves in the gravitational field of astrophysical objects is performed by the approximation of geometrical optics with condition that spatial scales of index of refraction a lot more wavelength. Light differential equations in Euler’s form are formed the basis of numerical-analytical instrument of modeling of trajectory characteristic of waves. Chaotic inhomogeneities of space plasma are introduced by model of spatial correlation function of index of refraction. Calculations of refraction scattering of waves are performed by the approximation of geometrical optics. Integral equations for statistic moments of lateral deviations of beams in picture plane of observer are obtained. Integrals for moments are reduced to system of ordinary differential equations the firsts order with using analytical transformations for cooperative numerical calculation of arrange and meansquare deviations of light. Results of numerical-analytical modeling of trajectory picture of propagation of electromagnetic waves in interstellar space with taking into account impact of gravitational fields of space objects and refractive scattering of waves on inhomogeneities of index of refraction of surrounding plasma are shown. Based on the results of modeling quantitative estimation of conditions of stochastic blurring of the effect of gravitational lensing of electromagnetic waves at various frequency ranges is performed. It’s shown that operating frequencies of meter range of wavelengths represent conditional low-frequency limit for observational of the effect of gravitational lensing in stochastic space plasma. The offered instrument of numerical-analytical modeling can be used for analyze of structure of electromagnetic radiation of quasar propagating through group of galactic.

  9. Сафиуллина Л.Ф., Губайдуллин И.М.
    Анализ идентифицируемости математической модели пиролиза пропана
    Компьютерные исследования и моделирование, 2021, т. 13, № 5, с. 1045-1057

    Работа посвящена численному моделированию и исследованию кинетической модели пиролиза пропана. Изучение кинетики реакций является необходимой стадией моделирования динамики газового потока в реакторе.

    Кинетическая модель представляет собой нелинейную систему обыкновенных дифференциальных уравнений первого порядка с параметрами, роль которых играют константы скоростей стадий. Математическое моделирование процесса основано на использовании закона сохранения масс. Для решения исходной (прямой) задачи используется неявный метод решения жестких систем обыкновенных дифференциальных уравнений. Модель содержит 60 входных кинетических параметров и 17 выходных параметров, соответствующих веществам реакции, из которых наблюдаемыми являются только 9. В процессе решения задачи по оценке параметров (обратная задача) возникает вопрос неединственности набора параметров, удовлетворяющего имеющимся экспериментальным данным. Поэтому перед решением обратной задачи проводится оценка возможности определения параметров модели — анализ идентифицируемости.

    Для анализа идентифицируемости мы используем ортогональный метод, который хорошо себя зарекомендовал для анализа моделей с большим числом параметров. Основу алгоритма составляет анализ матрицы чувствительно- сти методами дифференциальной и линейной алгебры, показывающей степень зависимости неизвестных параметров моделей от заданных измерений. Анализ чувствительности и идентифицируемости показал, что параметры модели устойчиво определяются по заданному набору экспериментальных данных. В статье представлен список параметров модели от наиболее идентифицируемого до наименее идентифицируемого. Учитывая анализ идентифицируемости математической модели, были введены более жесткие ограничения на поиск слабоидентифицируемых параметров при решении обратной задачи.

    Обратная задача по оценке параметров была решена с использованием генетического алгоритма. В статье представлены найденные оптимальные значения кинетических параметров. Представлено сравнение экспериментальных и расчетных зависимостей концентраций пропана, основных и побочных продуктов реакции от температуры для разных расходов смеси. На основании соответствия полученных результатов физико-химическим законам и экспериментальным данным сделан вывод об адекватности построенной математической модели.

    Safiullina L.F., Gubaydullin I.M.
    Analysis of the identifiability of the mathematical model of propane pyrolysis
    Computer Research and Modeling, 2021, v. 13, no. 5, pp. 1045-1057

    The article presents the numerical modeling and study of the kinetic model of propane pyrolysis. The study of the reaction kinetics is a necessary stage in modeling the dynamics of the gas flow in the reactor.

    The kinetic model of propane pyrolysis is a nonlinear system of ordinary differential equations of the first order with parameters, the role of which is played by the reaction rate constants. Math modeling of processes is based on the use of the mass conservation law. To solve an initial (forward) problem, implicit methods for solving stiff ordinary differential equation systems are used. The model contains 60 input kinetic parameters and 17 output parameters corresponding to the reaction substances, of which only 9 are observable. In the process of solving the problem of estimating parameters (inverse problem), there is a question of non-uniqueness of the set of parameters that satisfy the experimental data. Therefore, before solving the inverse problem, the possibility of determining the parameters of the model is analyzed (analysis of identifiability).

    To analyze identifiability, we use the orthogonal method, which has proven itself well for analyzing models with a large number of parameters. The algorithm is based on the analysis of the sensitivity matrix by the methods of differential and linear algebra, which shows the degree of dependence of the unknown parameters of the models on the given measurements. The analysis of sensitivity and identifiability showed that the parameters of the model are stably determined from a given set of experimental data. The article presents a list of model parameters from most to least identifiable. Taking into account the analysis of the identifiability of the mathematical model, restrictions were introduced on the search for less identifiable parameters when solving the inverse problem.

    The inverse problem of estimating the parameters was solved using a genetic algorithm. The article presents the found optimal values of the kinetic parameters. A comparison of the experimental and calculated dependences of the concentrations of propane, main and by-products of the reaction on temperature for different flow rates of the mixture is presented. The conclusion about the adequacy of the constructed mathematical model is made on the basis of the correspondence of the results obtained to physicochemical laws and experimental data.

  10. Остроухов П.А.
    Тензорные методы внутри смешанного оракула для решения задач типа min-min
    Компьютерные исследования и моделирование, 2022, т. 14, № 2, с. 377-398

    В данной статье рассматривается задача типа min-min: минимизация по двум группам переменных. Данная задача в чем-то похожа на седловую (min-max), однако лишена некоторых сложностей, присущих седловым задачам. Такого рода постановки могут возникать, если в задаче выпуклой оптимизации присутствуют переменные разных размерностей или если какие-то группы переменных определены на разных множествах. Подобная структурная особенность проблемы дает возможность разбивать ее на подзадачи, что позволяет решать всю задачу с помощью различных смешанных оракулов. Ранее в качестве возможных методов для решения внутренней или внешней задачи использовались только методы первого порядка или методы типа эллипсоидов. В нашей работе мы рассматриваем данный подход с точки зрения возможности применения алгоритмов высокого порядка (тензорных методов) для решения внутренней подзадачи. Для решения внешней подзадачи мы используем быстрый градиентный метод.

    Мы предполагаем, что внешняя подзадача определена на выпуклом компакте, в то время как для внутренней задачи мы отдельно рассматриваем задачу без ограничений и определенную на выпуклом компакте. В связи с тем, что тензорные методы по определению используют производные высокого порядка, время на выполнение одной итерации сильно зависит от размерности решаемой проблемы. Поэтому мы накладываем еще одно условие на внутреннюю подзадачу: ее размерность не должна превышать 1000. Для возможности использования смешанного оракула намнео бходимы некоторые дополнительные предположения. Во-первых, нужно, чтобы целевой функционал был выпуклымпо совокупности переменных и чтобы его градиент удовлетворял условию Липшица также по совокупности переменных. Во-вторых, нам необходимо, чтобы целевой функционал был сильно выпуклый по внутренней переменной и его градиент по внутренней переменной удовлетворял условию Липшица. Также для применения тензорного метода нам необходимо выполнение условия Липшица p-го порядка ($p > 1$). Наконец, мы предполагаем сильную выпуклость целевого функционала по внешней переменной, чтобы иметь возможность использовать быстрый градиентный метод для сильно выпуклых функций.

    Стоит отметить, что в качестве метода для решения внутренней подзадачи при отсутствии ограничений мы используем супербыстрый тензорный метод. При решении внутренней подзадачи на компакте используется ускоренный проксимальный тензорный метод для задачи с композитом.

    В конце статьи мы также сравниваем теоретические оценки сложности полученных алгоритмов с быстрым градиентным методом, который не учитывает структуру задачи и решает ее как обычную задачу выпуклой оптимизации (замечания 1 и 2).

    Ostroukhov P.A.
    Tensor methods inside mixed oracle for min-min problems
    Computer Research and Modeling, 2022, v. 14, no. 2, pp. 377-398

    In this article we consider min-min type of problems or minimization by two groups of variables. In some way it is similar to classic min-max saddle point problem. Although, saddle point problems are usually more difficult in some way. Min-min problems may occur in case if some groups of variables in convex optimization have different dimensions or if these groups have different domains. Such problem structure gives us an ability to split the main task to subproblems, and allows to tackle it with mixed oracles. However existing articles on this topic cover only zeroth and first order oracles, in our work we consider high-order tensor methods to solve inner problem and fast gradient method to solve outer problem.

    We assume, that outer problem is constrained to some convex compact set, and for the inner problem we consider both unconstrained case and being constrained to some convex compact set. By definition, tensor methods use high-order derivatives, so the time per single iteration of the method depends a lot on the dimensionality of the problem it solves. Therefore, we suggest, that the dimension of the inner problem variable is not greater than 1000. Additionally, we need some specific assumptions to be able to use mixed oracles. Firstly, we assume, that the objective is convex in both groups of variables and its gradient by both variables is Lipschitz continuous. Secondly, we assume the inner problem is strongly convex and its gradient is Lipschitz continuous. Also, since we are going to use tensor methods for inner problem, we need it to be p-th order Lipschitz continuous ($p > 1$). Finally, we assume strong convexity of the outer problem to be able to use fast gradient method for strongly convex functions.

    We need to emphasize, that we use superfast tensor method to tackle inner subproblem in unconstrained case. And when we solve inner problem on compact set, we use accelerated high-order composite proximal method.

    Additionally, in the end of the article we compare the theoretical complexity of obtained methods with regular gradient method, which solves the mentioned problem as regular convex optimization problem and doesn’t take into account its structure (Remarks 1 and 2).

Pages: « first previous next

Indexed in Scopus

Full-text version of the journal is also available on the web site of the scientific electronic library eLIBRARY.RU

The journal is included in the Russian Science Citation Index

The journal is included in the RSCI

International Interdisciplinary Conference "Mathematics. Computing. Education"