All issues
- 2024 Vol. 16
- 2023 Vol. 15
- 2022 Vol. 14
- 2021 Vol. 13
- 2020 Vol. 12
- 2019 Vol. 11
- 2018 Vol. 10
- 2017 Vol. 9
- 2016 Vol. 8
- 2015 Vol. 7
- 2014 Vol. 6
- 2013 Vol. 5
- 2012 Vol. 4
- 2011 Vol. 3
- 2010 Vol. 2
- 2009 Vol. 1
-
Нижние оценки для методов типа условного градиента для задач минимизации гладких сильно выпуклых функций
Компьютерные исследования и моделирование, 2022, т. 14, № 2, с. 213-223В данной работе рассматриваются методы условного градиента для оптимизации сильно выпуклых функций. Это методы, использующие линейный минимизационный оракул, то есть умеющие вычислять решение задачи
$$ \text{Argmin}_{x\in X}{\langle p,\,x \rangle} $$
для заданного вектора $p \in \mathbb{R}^n$. Существует целый ряд методов условного градиента, имеющих линейную скорость сходимости в сильно выпуклом случае. Однако во всех этих методах в оценку скорости сходимости входит размерность задачи, которая в современных приложениях может быть очень большой. В данной работе доказывается, что в сильно выпуклом случае скорость сходимости методов условного градиента в лучшем случае зависит от размерности задачи $n$ как $\widetilde{\Omega}\left(\!\sqrt{n}\right)$. Таким образом, методы условного градиента могут оказаться неэффективными для решения сильно выпуклых оптимизационных задач больших размерностей.
Отдельно рассматривается приложение методов условного градиента к задачам минимизации квадратичной формы. Уже была доказана эффективность метода Франк – Вульфа для решения задачи квадратичной оптимизации в выпуклом случае на симплексе (PageRank). Данная работа показывает, что использование методов условного градиента для минимизации квадратичной формы в сильно выпуклом случае малоэффективно из-за наличия размерности в оценке скорости сходимости этих методов. Поэтому рассматривается метод рестартов условного градиента (Shrinking Conditional Gradient). Его отличие от методов условного градиента заключается в том, что в нем используется модифицированный линейный минимизационный оракул, который для заданного вектора $p \in \mathbb{R}^n$ вычисляет решение задачи $$ \text{Argmin}\{\langle p, \,x \rangle\colon x\in X, \;\|x-x_0^{}\| \leqslant R \}. $$ В оценку скорости сходимости такого алгоритма размерность уже не входит. С помощью рестартов метода условного градиента получена сложность (число арифметических операций) минимизации квадратичной формы на $\infty$-шаре. Полученная оценка работы метода сравнима со сложностью градиентного метода.
Ключевые слова: метод Франк – Вульфа, рестарты.
Lower bounds for conditional gradient type methods for minimizing smooth strongly convex functions
Computer Research and Modeling, 2022, v. 14, no. 2, pp. 213-223In this paper, we consider conditional gradient methods for optimizing strongly convex functions. These are methods that use a linear minimization oracle, which, for a given vector $p \in \mathbb{R}^n$, computes the solution of the subproblem
\[ \text{Argmin}_{x\in X}{\langle p,\,x \rangle}. \]There are a variety of conditional gradient methods that have a linear convergence rate in a strongly convex case. However, in all these methods, the dimension of the problem is included in the rate of convergence, which in modern applications can be very large. In this paper, we prove that in the strongly convex case, the convergence rate of the conditional gradient methods in the best case depends on the dimension of the problem $ n $ as $ \widetilde {\Omega} \left(\!\sqrt {n}\right) $. Thus, the conditional gradient methods may turn out to be ineffective for solving strongly convex optimization problems of large dimensions.
Also, the application of conditional gradient methods to minimization problems of a quadratic form is considered. The effectiveness of the Frank – Wolfe method for solving the quadratic optimization problem in the convex case on a simplex (PageRank) has already been proved. This work shows that the use of conditional gradient methods to solve the minimization problem of a quadratic form in a strongly convex case is ineffective due to the presence of dimension in the convergence rate of these methods. Therefore, the Shrinking Conditional Gradient method is considered. Its difference from the conditional gradient methods is that it uses a modified linear minimization oracle. It's an oracle, which, for a given vector $p \in \mathbb{R}^n$, computes the solution of the subproblem \[ \text{Argmin}\{\langle p, \,x \rangle\colon x\in X, \;\|x-x_0^{}\| \leqslant R \}. \] The convergence rate of such an algorithm does not depend on dimension. Using the Shrinking Conditional Gradient method the complexity (the total number of arithmetic operations) of solving the minimization problem of quadratic form on a $ \infty $-ball is obtained. The resulting evaluation of the method is comparable to the complexity of the gradient method.
Keywords: Frank –Wolfe method, Shrinking Conditional Gradient. -
Параметрический анализ термодинамического алгоритма расчета стационарной скорости распространения пламени
Компьютерные исследования и моделирование, 2013, т. 5, № 5, с. 799-804Представлены результаты расчетов стационарной скорости распространения пламени с использованием соотношения, полученного на основе термодинамического вариационного принципа. Показано, что предложенный вычислительный алгоритм обеспечивает устойчивую сходимость итерационного процесса при любом начальном приближении значительно отличающемся от искомого решения.
Ключевые слова: распространение пламени, стационарное состояние, термодинамический функционал, вычислительный алгоритм.
Parametric study of the thermodynamic algorithm for the prediction of steady flame spread rate
Computer Research and Modeling, 2013, v. 5, no. 5, pp. 799-804Views (last year): 1. Citations: 1 (RSCI).The stationary flame spread rate has been calculated using the relationship based on the thermodynamic variational principle. It has been shown that proposed numerical algorithm provides the stable convergence under any initial approximation, which could be noticeably far from the searched solution.
-
Верификация расчетных характеристик сверхзвуковых турбулентных струй
Компьютерные исследования и моделирование, 2017, т. 9, № 1, с. 21-35В статье приводятся результаты верификационных расчетов в программном комплексе вычислительной аэро-, гидродинамики FlowVision характеристик сверхзвуковых турбулентных струй. Численное моделирование в статье охватывает несколько известных экспериментов по исследованию сверхзвуковых струй, находящихся в свободном доступе. Представленные тестовые случаи включают в себя тесты Сейнера с числом Маха на срезе $M = 2$ при расчетном $(n = 1)$ и нерасчетном $(n = 1.47)$ истечении из сопла в широком диапазоне температур газа. В работе также проведен численный эксперимент по распространению сверхзвуковой струи в спутном сверхзвуковом потоке $M = 2.2$. Для данного теста заданы параметры, определенные в эксперименте Putnam: степень понижения давления в сопле $\mathrm{NPR} = 8.12$ и полная температура $T = 317 \, \mathrm{K}$.
Показано сравнение расчетов FlowVision с экспериментальными и полученными в других расчетных кодах данными. Наилучшее совпадение с экспериментом Сейнера среди рассмотренных моделей турбулентности получено при использовании стандартной $k–\varepsilon$ модели турбулентности с установленной поправкой на сжимаемость по модели Wilcox. Достигнуто согласование с экспериментальными данными на дальнем следе до 7 % по скорости потока на оси сопла. Для струи в спутном потоке расчетная характеристика (число Маха) отличается на 3 % от экспериментальной.
В работе определены общие рекомендации к построению методики моделирования FlowVision сверхзвуковых турбулентных струй. В ходе исследования сходимости по сетке получены оптимальные размеры ячеек расчетной сетки: для расчетного истечения достаточно 40 ячеек по радиусу сопла и в области формирования струи, а для нерасчетных режимов необходимо не менее 80 ячеек по радиусу для точного моделирования ударно-волновой структуры вблизи выхода из сопла.
Влияние применяемых моделей турбулентности показано на примере расчета теста Сейнера. SST-модель турбулентности, применяемая в FlowVision, существенно занижает скорость на оси сопла, для расчета струй данная модель не рекомендуется даже для предварительных оценок. Стандартная $k–\varepsilon$ модель без учета сжимаемости также несколько занижает скорость газа. Модель турбулентности KEFV, разработанная для FlowVision, показывает хорошее согласование и несколько завышает «дальнобойность» струи. И наилучшее совпадение с экспериментом по исследуемым характеристикам турбулентных струй получено при расчетах на стандартной $k–\varepsilon$ модели с учетом сжимаемости, соответствующей модели Wilcox. Представленная методика может быть взята за основу при моделировании истечения из сверхзвуковых сопел более сложной геометрии.
Verification of calculated characteristics of supersonic turbulent jets
Computer Research and Modeling, 2017, v. 9, no. 1, pp. 21-35Views (last year): 43.Verification results of supersonic turbulent jets computational characteristics are presented. Numerical simulation of axisymmetric nozzle operating is realized using FlowVision CFD. Open test cases for CFD are used. The test cases include Seiner tests with exit Mach number of 2.0 both fully-expanded and under-expanded $(P/P_0 = 1.47)$. Fully-expanded nozzle investigated with wide range of flow temperature (300…3000 K). The considered studies include simulation downstream from the nozzle exit diameter. Next numerical investigation is presented at an exit Mach number of 2.02 and a free-stream Mach number of 2.2. Geometric model of convergent- divergent nozzle rebuilt from original Putnam experiment. This study is set with nozzle pressure ratio of 8.12 and total temperature of 317 K.
The paper provides a comparison of obtained FlowVision results with experimental data and another current CFD studies. A comparison of the calculated characteristics and experimental data indicates a good agreement. The best coincidence with Seiner's experimental velocity distribution (about 7 % at far field for the first case) obtained using two-equation $k–\varepsilon$ standard turbulence model with Wilcox compressibility correction. Predicted Mach number distribution at $Y/D = 1$ for Putnam nozzle presents accuracy of 3 %.
General guidelines for simulation of supersonic turbulent jets in the FlowVision software are formulated in the given paper. Grid convergence determined the optimal cell rate. In order to calculate the design regime, it is recommended to build a grid, containing not less than 40 cells from the axis of symmetry to the nozzle wall. In order to calculate an off-design regime, it is necessary to resolve the shock waves. For this purpose, not less than 80 cells is required in the radial direction. Investigation of the influence of turbulence model on the flow characteristics has shown that the version of the SST $k–\omega$ turbulence model implemented in the FlowVision software essentially underpredicts the axial velocity. The standard $k–\varepsilon$ model without compressibility correction also underpredicts the axial velocity. These calculations agree well with calculations in other CFD codes using the standard $k–\varepsilon$ model. The in-home $k–\varepsilon$ turbulence model KEFV with compressibility correction a little bit overpredicts the axial velocity. Since, the best results are obtained using the standard $k–\varepsilon$ model combined with the Wilcox compressibility correction, this model is recommended for the problems discussed.
The developed methodology can be regarded as a basis for numerical investigations of more complex nozzle flows.
-
Клеточно-автоматные методы решения классических задач математической физики на гексагональной сетке. Часть 1
Компьютерные исследования и моделирование, 2017, т. 9, № 2, с. 167-186Статья носит методический характер и посвящена решению трех классических уравнений математической физики (Лапласа, диффузии и волнового) простейшими численными схемами в формулировке клеточных автоматов (КА). Особое внимание уделяется законам сохранения вещества и неприятному эффекту избыточной гексагональной симметрии (ИГС).
Делается вывод о том, что по сравнению с классическими конечно-разностными методами, хотя локальная функция перехода (ЛФП) КА терминологически эквивалентна шаблону вычислительной двухслоевой явной схемы, различие состоит в замене матричных (direct) методов (например, метода прогонки для трехдиагональной матрицы) итерационными. Из этого следуют более жесткие требования к дискретизации условий для граничных КА-ячеек.
Для гексагональной сетки и консервативных граничных условий записана корректная ЛФП для граничных ячеек, справедливая, по крайней мере, для границ прямоугольной и круговой формы. Предложена идея разделения ЛФП на internal, boundary и postfix. На примере этой задачи заново осмыслено значение числа Куранта–Леви как соотношения скорости сходимости КА к решению задачи, данному на фиксированный момент времени, и скорости изменения самого решения в динамике.
Ключевые слова: клеточные автоматы с непрерывными значениями, гексагональная сетка, конечно-разностные методы, уравнения в частных производных.
Cellular automata methods in mathematical physics classical problems solving on hexagonal grid. Part 1
Computer Research and Modeling, 2017, v. 9, no. 2, pp. 167-186Views (last year): 6.The paper has methodical character; it is devoted to three classic partial differential equations (Laplace, Diffusion and Wave) solution using simple numerical methods in terms of Cellular Automata. Special attention was payed to the matter conservation law and the offensive effect of excessive hexagonal symmetry.
It has been shown that in contrary to finite-difference approach, in spite of terminological equivalence of CA local transition function to the pattern of computing double layer explicit method, CA approach contains the replacement of matrix technique by iterative ones (for instance, sweep method for three diagonal matrixes). This suggests that discretization of boundary conditions for CA-cells needs more rigid conditions.
The correct local transition function (LTF) of the boundary cells, which is valid at least for the boundaries of the rectangular and circular shapes have been firstly proposed and empirically given for the hexagonal grid and the conservative boundary conditions. The idea of LTF separation into «internal», «boundary» and «postfix» have been proposed. By the example of this problem the value of the Courant-Levy constant was re-evaluated as the CA convergence speed ratio to the solution, which is given at a fixed time, and to the rate of the solution change over time.
-
Применение схемы«КАБАРЕ» к задаче об эволюции свободного сдвигового течения
Компьютерные исследования и моделирование, 2017, т. 9, № 6, с. 881-903В настоящей работе приводятся результаты численного моделирования свободного сдвигового течения с помощью схемы «КАБАРЕ», реализованной в приближении слабой сжимаемости. Анализ схемы проводится на основе изучения свойств неустойчивости Кельвина–Гельмгольца и порождаемой ею двумерной турбулентности, с использованием интегральных кривых кинетической энергии и энстрофии, картин временной эволюции завихренности, спектров энстрофии и энергии, а также дисперсионного соотношения для инкремента неустойчивости. Расчеты проводились для числа Рейнольдса $\text{Re} = 4 \times 10^5$, на квадратных последовательно сгущаемых сетках в диапазоне $128^2-2048^2$ ячеек. Внимание уделено проблеме «недоразрешенности слоев», проявляющейся в возникновении лишнего вихря при свертывании двух вихревых листов (слоев вихревой пелены). Данное явление существует только на грубых сетках $(128^2)$, однако, полностью симметричная картина эволюции завихренности начинает наблюдаться только при переходе к сетке $1024^2$ ячеек. Размерные оценки отношения вихрей на границах инерционного интервала показывают, что наиболее подробная сетка $2048^2$ ячеек оказывается достаточной для качественного отображения мелкомасштабных сгустков завихренности. Тем не менее можно говорить о достижении хорошей сходимости при отображении крупномасштабных структур. Эволюция турбулентности, в полном соответствии с теоретическими представлениями, приводит к появлению крупных вихрей, в которых сосредотачивается вся кинетическая энергия движения, и уединенных мелкомасштабных образований. Последние обладают свойствами когерентных структур, выживая в процессе нитеобразования (филаментации), и практически не взаимодействуют с вихрями других масштабов. Обсуждение диссипативных характеристик схемы ведется на основе анализа графиков скорости диссипации кинетической энергии, вычисляемой непосредственно, а также на основе теоретических соотношений для моделей несжимаемой жидкости (по кривым энстрофии) и сжимаемого газа (по влиянию тензора скоростей деформации и эффектов дилатации). Асимптотическое поведение каскадов кинетической энергии и энстрофии подчиняется реализующимся в двумерной турбулентности соотношениям $E(k) \propto k^{−3}$, $\omega^2(k) \propto k^{−1}$. Исследование зависимости инкремента неустойчивости от безразмерного волнового числа показывает хорошее согласие с данными других исследователей, вместе с тем часто используемый способ расчета инкремента неустойчивости не всегда оказывается достаточно точным, вследствие чего была предложена его модификация.
Таким образом, реализованная схема, отличаясь малой диссипативностью и хорошим вихреразрешением, оказывается вполне конкурентоспособной в сравнении с методами высокого порядка точности.
Ключевые слова: численная схема «КАБАРЕ», слабосжимаемая жидкость, неустойчивость Кельвина–Гельгольца, завихренность, энстрофия, инкремент неустойчивости, недоразрешаемые слои, «паразитный» вихрь, свертывание, инерционный интервал, когерентные структуры, филаментация, скорость диссипации, дилатация.
CABARET scheme implementation for free shear layer modeling
Computer Research and Modeling, 2017, v. 9, no. 6, pp. 881-903Views (last year): 17.In present paper we reexamine the properties of CABARET numerical scheme formulated for a weakly compressible fluid flow basing the results of free shear layer modeling. Kelvin–Helmholtz instability and successive generation of two-dimensional turbulence provide a wide field for a scheme analysis including temporal evolution of the integral energy and enstrophy curves, the vorticity patterns and energy spectra, as well as the dispersion relation for the instability increment. The most part of calculations is performed for Reynolds number $\text{Re} = 4 \times 10^5$ for square grids sequentially refined in the range of $128^2-2048^2$ nodes. An attention is paid to the problem of underresolved layers generating a spurious vortex during the vorticity layers roll-up. This phenomenon takes place only on a coarse grid with $128^2$ nodes, while the fully regularized evolution pattern of vorticity appears only when approaching $1024^2$-node grid. We also discuss the vorticity resolution properties of grids used with respect to dimensional estimates for the eddies at the borders of the inertial interval, showing that the available range of grids appears to be sufficient for a good resolution of small–scale vorticity patches. Nevertheless, we claim for the convergence achieved for the domains occupied by large-scale structures.
The generated turbulence evolution is consistent with theoretical concepts imposing the emergence of large vortices, which collect all the kinetic energy of motion, and solitary small-scale eddies. The latter resemble the coherent structures surviving in the filamentation process and almost noninteracting with other scales. The dissipative characteristics of numerical method employed are discussed in terms of kinetic energy dissipation rate calculated directly and basing theoretical laws for incompressible (via enstrophy curves) and compressible (with respect to the strain rate tensor and dilatation) fluid models. The asymptotic behavior of the kinetic energy and enstrophy cascades comply with two-dimensional turbulence laws $E(k) \propto k^{−3}, \omega^2(k) \propto k^{−1}$. Considering the instability increment as a function of dimensionless wave number shows a good agreement with other papers, however, commonly used method of instability growth rate calculation is not always accurate, so some modification is proposed. Thus, the implemented CABARET scheme possessing remarkably small numerical dissipation and good vorticity resolution is quite competitive approach compared to other high-order accuracy methods
-
Об одном методе минимизации выпуклой липшицевой функции двух переменных на квадрате
Компьютерные исследования и моделирование, 2019, т. 11, № 3, с. 379-395В статье получены оценки скорости сходимости по функции для недавно предложенного Ю.Е. Нестеровым метода минимизации выпуклой липшицевой функции двух переменных на квадрате с фиксированной стороной. Идея метода — деление квадрата на меньшие части и постепенное их удаление так, чтобы в оставшейся достаточно малой части все значения целевой функции были достаточно близки к оптимальному. При этом метод заключается вр ешении вспомогательных задач одномерной минимизации вдоль разделяющих отрезков и не предполагает вычисления точного значения градиента целевого функционала. Основной результат работы о необходимом количестве итераций для достижений заданной точности доказан вкла ссе гладких выпуклых функций, имеющих липшицев градиент. При этом отмечено, что свойство липшицевости градиента достаточно потребовать не на всем квадрате, а лишь на некоторых отрезках. Показано, что метод может работать при наличии погрешностей решения вспомогательных одномерных задач, а также при вычислении направлений градиентов. Также описана ситуация, когда возможно пренебречь временными затратами (или уменьшить их) на решение вспомогательных одномерных задач. Для некоторых примеровэк спериментально продемонстрировано, что метод может эффективно работать и на некоторых классах негладких функций. При этом построен пример простой негладкой функции, для которой при неудачном выборе субградиента даже в случае точного решения вспомогательных одномерных задач может не наблюдаться сходимость метода. Проведено сравнение работы метода Ю.Е. Нестерова, метода эллипсоидов и градиентного спуска для некоторых гладких выпуклых функций. Эксперименты показали, что метод Ю.Е. Нестерова может достигать желаемой точности решения задачи за меньшее (в сравнении с другими рассмотренными методами) время. В частности, замечено, что при увеличении точности искомого решения время работы метода Ю.Е. Нестерова может расти медленнее, чем время работы метода эллипсоидов.
Ключевые слова: задача минимизации, выпуклый функционал, липшицев функционал, липшицев градиент, негладкий функционал, субградиент, градиентный спуск, метод эллипсоидов, скорость сходимости.
One method for minimization a convex Lipschitz-continuous function of two variables on a fixed square
Computer Research and Modeling, 2019, v. 11, no. 3, pp. 379-395Views (last year): 34.In the article we have obtained some estimates of the rate of convergence for the recently proposed by Yu. E.Nesterov method of minimization of a convex Lipschitz-continuous function of two variables on a square with a fixed side. The idea of the method is to divide the square into smaller parts and gradually remove them so that in the remaining sufficiently small part. The method consists in solving auxiliary problems of one-dimensional minimization along the separating segments and does not imply the calculation of the exact value of the gradient of the objective functional. The main result of the paper is proved in the class of smooth convex functions having a Lipschitz-continuous gradient. Moreover, it is noted that the property of Lipschitzcontinuity for gradient is sufficient to require not on the whole square, but only on some segments. It is shown that the method can work in the presence of errors in solving auxiliary one-dimensional problems, as well as in calculating the direction of gradients. Also we describe the situation when it is possible to neglect or reduce the time spent on solving auxiliary one-dimensional problems. For some examples, experiments have demonstrated that the method can work effectively on some classes of non-smooth functions. In this case, an example of a simple non-smooth function is constructed, for which, if the subgradient is chosen incorrectly, even if the auxiliary one-dimensional problem is exactly solved, the convergence property of the method may not hold. Experiments have shown that the method under consideration can achieve the desired accuracy of solving the problem in less time than the other methods (gradient descent and ellipsoid method) considered. Partially, it is noted that with an increase in the accuracy of the desired solution, the operating time for the Yu. E. Nesterov’s method can grow slower than the time of the ellipsoid method.
-
Использование функций обратных связей для решения задач параметрического программирования
Компьютерные исследования и моделирование, 2023, т. 15, № 5, с. 1125-1151Рассматривается конечномерная оптимизационная задача, постановка которой, помимо искомых переменных, содержит параметры. Ее решение есть зависимость оптимальных значений переменных от параметров. В общем случае такие зависимости не являются функциями, поскольку могут быть неоднозначными, а в функциональном случае — быть недифференцируемыми. Кроме того, область их существования может оказаться уже области определения функций в условии задачи. Эти свойства затрудняют решение как исходной задачи, так и задач, в постановку которых входят данные зависимости. Для преодоления этих затруднений обычно применяются методы типа недифференцируемой оптимизации.
В статье предлагается альтернативный подход, позволяющий получать решения параметрических задач в форме, лишенной указанных свойств. Показывается, что такие представления могут исследоваться стандартными алгоритмами, основанными на формуле Тейлора. Данная форма есть функция, гладко аппроксимирующая решение исходной задачи. При этом величина погрешности аппроксимации регулируется специальным параметром. Предлагаемые аппроксимации строятся с помощью специальных функций, устанавливающих обратные связи между переменными и множителями Лагранжа. Приводится краткое описание этого метода для линейных задач с последующим обобщением на нелинейный случай.
Построение аппроксимации сводится к отысканию седловой точки модифицированной функции Лагранжа исходной задачи. Показывается, что необходимые условия существования такой седловой точки подобны условиям теоремы Каруша – Куна – Таккера, но не содержат в явном виде ограничений типа неравенств и условий дополняющей нежесткости. Эти необходимые условия аппроксимацию определяют неявным образом. Поэтому для вычисления ее дифференциальных характеристик используется теорема о неявных функциях. Эта же теорема применяется для уменьшения погрешности аппроксимации.
Особенности практической реализации метода функций обратных связей, включая оценки скорости сходимости к точному решению, демонстрируются для нескольких конкретных классов параметрических оптимизационных задач. Конкретно: рассматриваются задачи поиска глобального экстремума функций многих переменных и задачи на кратный экстремум (максимин-минимакс). Также рассмотрены оптимизационные задачи, возникающие при использовании многокритериальных математических моделей. Для каждого из этих классов приводятся демонстрационные примеры.
Ключевые слова: задача нелинейного программирования с параметрами, функция обратных связей, модифицированная функция Лагранжа, поиск глобального экстремума, минимакс, многокритериальная модель.
Using feedback functions to solve parametric programming problems
Computer Research and Modeling, 2023, v. 15, no. 5, pp. 1125-1151We consider a finite-dimensional optimization problem, the formulation of which in addition to the required variables contains parameters. The solution to this problem is a dependence of optimal values of variables on parameters. In general, these dependencies are not functions because they can have ambiguous meanings and in the functional case be nondifferentiable. In addition, their domain of definition may be narrower than the domains of definition of functions in the condition of the original problem. All these properties make it difficult to solve both the original parametric problem and other tasks, the statement of which includes these dependencies. To overcome these difficulties, usually methods such as non-differentiable optimization are used.
This article proposes an alternative approach that makes it possible to obtain solutions to parametric problems in a form devoid of the specified properties. It is shown that such representations can be explored using standard algorithms, based on the Taylor formula. This form is a function smoothly approximating the solution of the original problem for any parameter values, specified in its statement. In this case, the value of the approximation error is controlled by a special parameter. Construction of proposed approximations is performed using special functions that establish feedback (within optimality conditions for the original problem) between variables and Lagrange multipliers. This method is described for linear problems with subsequent generalization to the nonlinear case.
From a computational point of view the construction of the approximation consists in finding the saddle point of the modified Lagrange function of the original problem. Moreover, this modification is performed in a special way using feedback functions. It is shown that the necessary conditions for the existence of such a saddle point are similar to the conditions of the Karush – Kuhn – Tucker theorem, but do not contain constraints such as inequalities and conditions of complementary slackness. Necessary conditions for the existence of a saddle point determine this approximation implicitly. Therefore, to calculate its differential characteristics, the implicit function theorem is used. The same theorem is used to reduce the approximation error to an acceptable level.
Features of the practical implementation feedback function method, including estimates of the rate of convergence to the exact solution are demonstrated for several specific classes of parametric optimization problems. Specifically, tasks searching for the global extremum of functions of many variables and the problem of multiple extremum (maximin-minimax) are considered. Optimization problems that arise when using multicriteria mathematical models are also considered. For each of these classes, there are demo examples.
-
Расчет излучения в ударном слое спускаемого космического аппарата с учетом деталей спектра фотонов
Компьютерные исследования и моделирование, 2017, т. 9, № 4, с. 579-594Расчет переноса излучения в ударном слое космического аппарата вызывает значительные трудности из-за сложной многорезонансной зависимости макросечения поглощения излучения от энергий фотонов. В работе исследована сходимость двух приближенных методов осреднения спектров излучения к точному поточечному (line-by-line) расчету. Первым из приближенных методов является широко используемое многогрупповое приближение, вторым — метод лебеговского осреднения, относящийся к методам сокращения числа расчетных точек спектра за счет объединения точек с равновеликим поглощением. Показано, что с увеличением числа групп метод лебеговского осреднения сходится к точному решению значительно быстрее многогруппового приближения. Оказалось, что 100–150 лебеговых групп достаточно для достижения точности line-by-line-расчета даже в ударном слое в высоких слоях атмосферы, где линии поглощения узки. При этом объем вычислений сокращается более чем на четыре порядка. Выполнена серия расчетов функции распределения излучения в двумерном ударном слое, возникающем при обтекании сферы и затупленного конуса, с использованием приближения локально плоского слоя и метода лебеговского осреднения энергий фотонов. Показано, что излучение ударной волны становится все более сильным при увеличении размера космического аппарата, как в значениях падающего потока энергии на поверхности тела, так и в скорости обмена энергией с газодинамическим потоком, причем не только в точке торможения.
Ключевые слова: перенос энергии излучением, ударный слой, многогрупповое приближение, метод лебеговского осреднения, поточечный расчет спектра, приближение локально плоского слоя.
Calculation of radiation in shockwave layer of a space vehicle taking into account details of photon spectrum
Computer Research and Modeling, 2017, v. 9, no. 4, pp. 579-594Views (last year): 8. Citations: 1 (RSCI).Calculations of radiation transport in the shockwave layer of a descent space vehicle cause essential difficulties due to complex multi-resonance dependence of the absorption macroscopic cross sections from the photon energy. The convergence of two approximate spectrum averaging methods to the results of exact pointwise spectrum calculations is investigated. The first one is the well known multigroup method, the second one is the Lebesgue averaging method belonging to methods of the reduction of calculation points by means of aggregation of spectral points which are characterized by equal absorption strength. It is shown that convergence of the Lebesgue averaging method is significantly faster than the multigroup approach as the number of groups is increased. The only 100–150 Lebesgue groups are required to achieve the accuracy of pointwise calculations even in the shock layer at upper atmosphere with sharp absorption lines. At the same time the number of calculations is reduced by more than four order. Series of calculations of the radiation distribution function in 2D shock layer around a sphere and a blunt cone were performed using the local flat layer approximation and the Lebesgue averaging method. It is shown that the shock wave radiation becomes more significant both in value of the energy flux incident on the body surface and in the rate of energy exchange with the gas-dynamic flow in the case of increasing of the vehicle’s size.
-
Гипотеза об оптимальных оценках скорости сходимости численных методов выпуклой оптимизации высоких порядков
Компьютерные исследования и моделирование, 2018, т. 10, № 3, с. 305-314В данной работе приводятся нижние оценки скорости сходимости для класса численных методов выпуклой оптимизации первого порядка и выше, т. е. использующих градиент и старшие производные. Обсуждаются вопросы достижимости данных оценок. Приведенные в статье оценки замыкают известные на данный момент результаты в этой области. Отметим, что замыкание осуществляется без должного обоснования, поэтому в той общности, в которой данные оценки приведены в статье, их стоит понимать как гипотезу. Опишембо лее точно основной результат работы. Пожалуй, наиболее известнымм етодом второго порядка является метод Ньютона, использующий информацию о градиенте и матрице Гессе оптимизируемой функции. Однако даже для сильно выпуклых функций метод Ньютона сходится лишь локально. Глобальная сходимость метода Ньютона обеспечивается с помощью кубической регуляризации оптимизируемой на каждом шаге квадратичной модели функции [Nesterov, Polyak, 2006]. Сложность решения такой вспомогательной задачи сопоставима со сложностью итерации обычного метода Ньютона, т. е. эквивалентна по порядку сложности обращения матрицы Гессе оптимизируемой функции. В 2008 году Ю. Е. Нестеровымбыл предложен ускоренный вариант метода Ньютона с кубической регуляризацией [Nesterov, 2008]. В 2013 г. Monteiro – Svaiter сумели улучшить оценку глобальной сходимости ускоренного метода с кубической регуляризацией [Monteiro, Svaiter, 2013]. В 2017 году Arjevani – Shamir – Shiff показали, что оценка Monteiro – Svaiter оптимальна (не может быть улучшена более чем на логарифми- ческий множитель на классе методов 2-го порядка) [Arjevani et al., 2017]. Также удалось получить вид нижних оценок для методов порядка $p ≥ 2$ для задач выпуклой оптимизации. Отметим, что при этом для сильно выпуклых функций нижние оценки были получены только для методов первого и второго порядка. В 2018 году Ю. Е. Нестеров для выпуклых задач оптимизации предложил методы 3-го порядка, которые имеют сложность итерации сопоставимую со сложностью итерации метода Ньютона и сходятся почти по установленным нижним оценкам [Nesterov, 2018]. Таким образом, было показано, что методы высокого порядка вполне могут быть практичными. В данной работе приводятся нижние оценки для методов высокого порядка $p ≥ 3$ для сильно выпуклых задач безусловной оптимизации. Работа также может рассматриваться как небольшой обзор современного состояния развития численных методов выпуклой оптимизации высокого порядка.
Ключевые слова: метод Ньютона, матрица Гессе, нижние оценки, чебышёвские методы, сверхлинейная сходимость.
A hypothesis about the rate of global convergence for optimal methods (Newton’s type) in smooth convex optimization
Computer Research and Modeling, 2018, v. 10, no. 3, pp. 305-314Views (last year): 21. Citations: 1 (RSCI).In this paper we discuss lower bounds for convergence of convex optimization methods of high order and attainability of this bounds. We formulate a hypothesis that covers all the cases. It is noticeable that we provide this statement without a proof. Newton method is the most famous method that uses gradient and Hessian of optimized function. However, it converges locally even for strongly convex functions. Global convergence can be achieved with cubic regularization of Newton method [Nesterov, Polyak, 2006], whose iteration cost is comparable with iteration cost of Newton method and is equivalent to inversion of Hessian of optimized function. Yu.Nesterov proposed accelerated variant of Newton method with cubic regularization in 2008 [Nesterov, 2008]. R.Monteiro and B. Svaiter managed to improve global convergence of cubic regularized method in 2013 [Monteiro, Svaiter, 2013]. Y.Arjevani, O. Shamir and R. Shiff showed that convergence bound of Monteiro and Svaiter is optimal (cannot be improved by more than logarithmic factor with any second order method) in 2017 [Arjevani et al., 2017]. They also managed to find bounds for convex optimization methods of p-th order for $p ≥ 2$. However, they got bounds only for first and second order methods for strongly convex functions. In 2018 Yu.Nesterov proposed third order convex optimization methods with rate of convergence that is close to this lower bounds and with similar to Newton method cost of iteration [Nesterov, 2018]. Consequently, it was showed that high order methods can be practical. In this paper we formulate lower bounds for p-th order methods for $p ≥ 3$ for strongly convex unconstrained optimization problems. This paper can be viewed as a little survey of state of the art of high order optimization methods.
-
Весовой векторный метод конечных элементов и его приложения
Компьютерные исследования и моделирование, 2019, т. 11, № 1, с. 71-86Математические модели многих естественных процессов описываются дифференциальными уравнениями с особенностями решения. Классические численные методы для нахождения приближенного решения таких задач оказываются неэффективными. В настоящей работе рассмотрена краевая задача для векторного волнового уравнения в двумерной L-образной области. Наличие входящего угла величиной $3\pi/2$ на границе расчетной области обусловливает сильную сингулярность задачи, то есть ее решение не принадлежит пространству Соболева $H^1$, в результате чего классические и специализированные численные методы имеют скорость сходимости ниже чем $O(h)$. Поэтому в работе введено специальное весовое множество вектор-функций. В этом множестве решение рассматриваемой краевой задачи определено как $R_ν$-обобщенное.
Для численного нахождения $R_ν$-обобщенного решения построен весовой векторный метод конечных элементов. Основным отличием этого метода является введение в базисные функции в качестве сомножителя специальной весовой функции в степени, определяемой свойствами решения исходной краевой задачи. Это позволило существенно повысить скорость сходимости приближенного решения к точному при измельчении конечноэлементной сетки. Кроме того, введенные базисные функции соленоидальны, что обеспечило точный учет условия соленоидальности искомого решения и предотвратило появление ложных численных решений.
Представлены результаты численного эксперимента для серии модельных задач различных типов: для задач, решение которых содержит только сингулярную составляющую, и для задач, решение которых содержит как сингулярную, так и регулярную составляющие. Результаты численного анализа показали, что при измельчении конечноэлементной сетки скорость сходимости построенного весового векторного метода конечных элементов составляет $O(h)$, что по порядку степени в полтора раза выше, чем в разработанных к настоящему времени специализированных методах решения рассматриваемой задачи: методе сингулярных дополнений и методе регуляризации. Другие особенности построенного метода — его алгоритмическая простота и естественность определения решения, что является преимуществом при проведении численных расчетов.
Ключевые слова: весовой векторный метод конечных элементов, весовые пространства, $R_ν$-обобщенное решение, краевые задачи с сингулярностью.
Weighthed vector finite element method and its applications
Computer Research and Modeling, 2019, v. 11, no. 1, pp. 71-86Views (last year): 37.Mathematical models of many natural processes are described by partial differential equations with singular solutions. Classical numerical methods for determination of approximate solution to such problems are inefficient. In the present paper a boundary value problem for vector wave equation in L-shaped domain is considered. The presence of reentrant corner of size $3\pi/2$ on the boundary of computational domain leads to the strong singularity of the solution, i.e. it does not belong to the Sobolev space $H^1$ so classical and special numerical methods have a convergence rate less than $O(h)$. Therefore in the present paper a special weighted set of vector-functions is introduced. In this set the solution of considered boundary value problem is defined as $R_ν$-generalized one.
For numerical determination of the $R_ν$-generalized solution a weighted vector finite element method is constructed. The basic difference of this method is that the basis functions contain as a factor a special weight function in a degree depending on the properties of the solution of initial problem. This allows to significantly raise a convergence speed of approximate solution to the exact one when the mesh is refined. Moreover, introduced basis functions are solenoidal, therefore the solenoidal condition for the solution is taken into account precisely, so the spurious numerical solutions are prevented.
Results of numerical experiments are presented for series of different type model problems: some of them have a solution containing only singular component and some of them have a solution containing a singular and regular components. Results of numerical experiment showed that when a finite element mesh is refined a convergence rate of the constructed weighted vector finite element method is $O(h)$, that is more than one and a half times better in comparison with special methods developed for described problem, namely singular complement method and regularization method. Another features of constructed method are algorithmic simplicity and naturalness of the solution determination that is beneficial for numerical computations.
Indexed in Scopus
Full-text version of the journal is also available on the web site of the scientific electronic library eLIBRARY.RU
The journal is included in the Russian Science Citation Index
The journal is included in the RSCI
International Interdisciplinary Conference "Mathematics. Computing. Education"