Результаты поиска по 'вычисления':
Найдено статей: 204
  1. Зубанов А.М., Кутрухин Н.Н., Ширков П.Д.
    О построении линейно неявных схем, LN-эквивалентных неявным методам Рунге–Кутты
    Компьютерные исследования и моделирование, 2012, т. 4, № 3, с. 483-496

    В работе предложен новый класс безитерационных схем (явно-неявных), который позволяет получать методы, повторяющие на линейных неавтономных задачах свойства лучших неявных жестко-точных методов Рунге–Кутты [Хайрер, Ваннер,1999] – RadauIIA и LobattoIIIC. Для этого используется понятие LN-эквивалентности методов [Ширков, 2012]. С использованием среды аналитических вычислений получены уравнения порядка и затухания таких методов и найдены коэффициенты некоторых схем до 3-го порядка включительно. Проводится численное исследование новых методов на классических тестах, применяемых для проверки схем, разрабатываемых для жестких систем.

    Zubanov A.M., Kutruhin N.N., Shirkov P.D.
    Constructing of linearly implicit schemes which are LN-equivalent to implicit Runge–Kutta methods
    Computer Research and Modeling, 2012, v. 4, no. 3, pp. 483-496

    New family of linearly implicit schemes are presented. This family allows to obtain methods which are equivalent to stiffly accurate implicit Runge–Kutta schemes (such as RadauIIA and LobattoIIIC) on nonautonomous linear problems. Notion of LN-equivalence of schemes is introduced. Order conditions and stability conditions of such methods are obtained with the use of media for computer symbolic calculations. Some examples of new schemes have been constructed. Numerical studying of new method have been done with the use of classical tests for stiff problems.

    Views (last year): 2. Citations: 2 (RSCI).
  2. В работе развивается теория нового, так называемого двухпараметрического подхода к анализу и обработке случайных сигналов. Проведены математическое моделирование и сопоставление результатов решения задачи в условиях статистических моделей Гаусса и Райса. Дается обоснование применимости статистической модели Райса в условиях анализа огибающей измеряемого сигнала в задачах обработки данных и изображений. Развит и теоретически обоснован метод решения задачи шумоподавления и восстановления райсовского сигнала посредством одновременного вычисления двух статистических параметров — величины математического ожидания исходного сигнала и дисперсии шума — на основе принципа максимума правдоподобия. Проанализированы особенности функции правдоподобия для распределения Райса и вытекающие из них возможности оценки параметров сигнала и шума.

    The paper develops a theory of a new so-called two-parametric approach to the random signals' analysis and processing. A mathematical simulation and the task solutions’ comparison have been implemented for the Gauss and Rice statistical models. The applicability of the Rice statistical model is substantiated for the tasks of data and images processing when the signal’s envelope is being analyzed. A technique is developed and theoretically substantiated for solving the task of the noise suppression and initial image reconstruction by means of joint calculation of both statistical parameters — an initial signal’s mean value and noise dispersion — based on the maximum likelihood method within the Rice distribution. The peculiarities of this distribution’s likelihood function and the following from them possibilities of the signal and noise estimation have been analyzed.

    Views (last year): 2. Citations: 4 (RSCI).
  3. Белеан Б., Белеан К., Флоаре К., Вароди К., Бот А., Адам Г.
    Сеточные высокопроизводительные вычисления в получении спутниковых изображний на примере фильтра Перона–Малик
    Компьютерные исследования и моделирование, 2015, т. 7, № 3, с. 399-406

    В данной работе рассматривается подход к эффективной обработке спутниковых изображений, который включает в себя два этапа. Первый этап заключается в распределении быстро взрастающего объема спутниковых данных, полученных через Грид-инфраструктуру. Второй этап включает в себя ускорение решения отдельных задач, относящихся к обработке изображений с помощью внедрения кодов, которые способствуют интенсивному использованию пространственно-временного параллелизма. Примером такого кода является обработка изображений с помощью итерационного фильтра Перона–Малик в рамках специального применения архитектуры аппаратного обеспечения ППВМ (FPGA).

    Belean B., Belean C., Floare C., Varodi C., Bot A., Adam G.
    Grid based high performance computing in satellite imagery. Case study — Perona–Malik filter
    Computer Research and Modeling, 2015, v. 7, no. 3, pp. 399-406

    The present paper discusses an approach to the efficient satellite image processing which involves two steps. The first step assumes the distribution of the steadily increasing volume of satellite collected data through a Grid infrastructure. The second step assumes the acceleration of the solution of the individual tasks related to image processing by implementing execution codes which make heavy use of spatial and temporal parallelism. An instance of such execution code is the image processing by means of the iterative Perona–Malik filter within FPGA application specific hardware architecture.

    Views (last year): 3.
  4. Предложено обобщение блочного клеточного автомата Марголуса на гексагональную сетку. Проведена статистическая обработка результатов вероятностных клеточно-автоматных вычислений для ряда модификаций схемы, решающей тестовую задачу диффузии вещества. Показано, что выбор блоков в виде гексагонов на 25% эффективнее, чем в виде Y-блоков. Показано, что алгоритмы имеют полиномиальную сложность, причем степень полинома для параллельных вычислителей лежит в пределах 0.6÷0.8, а для последовательных — в пределах 1.5÷1.7. Исследовалось влияние внедренных в поле клеточного автомата дефектных ячеек на скорость сходимости.

    Gavrilov S.V., Matyushkin I.V.
    Statistical analysis of Margolus’s block-rotating mechanism cellular automation modeling the diffusion in a medium with discrete singularities
    Computer Research and Modeling, 2015, v. 7, no. 6, pp. 1155-1175

    The generalization of Margolus’s block cellular automaton on a hexagonal grid is formulated. Statistical analysis of the results of probabilistic cellular automation for vast variety of this scheme solving the test task of diffusion is done. It is shown that the choice of the hexagon blocks is 25% more efficient than Y-blocks. It is shown that the algorithms have polynomial complexity, and the polynom degree lies within 0.6÷0.8 for parallel computer, and in the range 1.5÷1.7 for serial computer. The effects of embedded into automaton’s field defective cells on the rate of convergence are studied also.

    Views (last year): 8. Citations: 4 (RSCI).
  5. Понятие оператора, почти алгебраического относительно некоторого двустороннего идеала, алгебры линейных операторов, действующих в некоторых конечномерных линейных пространствах, распространяется на тот случай, когда идеал только левый. Доказывается теорема о виде частного решения уравнения вида $\sum\limits^{n, m}_{i=0, j=0} a_{ij} A^i B^j u = f$, где $A$ и $B$ — линейные операторы, $f$ — элемент некоторого линейного пространства. Результаты применяются к дифференциально- разностным уравнениям.

    The concept of an operator is an almost algebraic with respect to two-sided ideal of the algebra of linear operators in some finite-dimensional linear spaces, it extended to the case when the ideal is left. We prove a theorem on the following equation particular solution $\sum\limits^{n, m}_{i=0, j=0} a_{ij} A^i B^j u = f$, where $A$ and $B$ is a linear operator, $f$ is an element of a linear space. The result is applied to the differential-difference equations.

    Views (last year): 1.
  6. Свириденко А.Б.
    Прямые мультипликативные методы для разреженных матриц. Несимметричные линейные системы
    Компьютерные исследования и моделирование, 2016, т. 8, № 6, с. 833-860

    Малая практическая ценность многих численных методов решения несимметричных систем линейных уравнений с плохо обусловленными матрицами объясняется тем, что эти методы в реальных условиях ведут себя совсем иначе, чем в случае точных вычислений. Исторически вопросам устойчивости не отводилось достаточного внимания, как в численной алгебре «средних размеров», а делался акцент на решении задач максимального порядка при данных возможностях вычислительной машины, в том числе за счет некоторой потери точности результатов. Поэтому главными объектами исследования были: наиболее целесообразное хранение информации, заключенной в разреженной матрице; поддержание наибольшей степени ее разреженности на всех этапах вычислительного процесса. Таким образом, разработка эффективных численных методов решения неустойчивых систем относится к актуальным проблемам вычислительной математики.

    В данной работе рассмотрен подход к построению численно устойчивых прямых мультипликативных методов решения систем линейных уравнений, учитывающих разреженность матриц, представленных в упакованном виде. Преимущество подхода состоит в возможности минимизации заполнения главных строк мультипликаторов без потери точности результатов, причем изменения в позиции очередной обрабатываемой строки матрицы не вносятся, что позволяет использовать статические форматы хранения данных. Рассмотрен формат хранения разреженных матриц, преимущество которого состоит в возможности параллельного выполнения любых матричных операций без распаковывания, что значительно сокращает время выполнения операций и объем занимаемой памяти.

    Прямые мультипликативные методы решения систем линейных уравнений являются наиболее приспособленными для решения задач большого размера на ЭВМ: разреженные матрицы системы позволяют получать мультипликаторы, главные строки которых также разрежены, а операция умножения вектора-строки на мультипликатор по трудоемкости пропорциональна числу ненулевых элементов этого мультипликатора.

    В качестве прямого продолжения данной работы в основу построения прямого мультипликативного алгоритма линейного программирования предлагается положить модификацию прямого мультипликативного алгоритма решения систем линейных уравнений, основанного на интеграции техники метода линейного программирования для выбора ведущего элемента. Прямые мультипликативные методы линейного программирования являются наиболее приспособленными и для построения прямого мультипликативного алгоритма задания направления спуска в ньютоновских методах безусловной оптимизации путем интеграции одной из существующих техник построения существенно положительно-определенной матрицы вторых производных.

    Sviridenko A.B.
    Direct multiplicative methods for sparse matrices. Unbalanced linear systems.
    Computer Research and Modeling, 2016, v. 8, no. 6, pp. 833-860

    Small practical value of many numerical methods for solving single-ended systems of linear equations with ill-conditioned matrices due to the fact that these methods in the practice behave quite differently than in the case of precise calculations. Historically, sustainability is not enough attention was given, unlike in numerical algebra ‘medium-sized’, and emphasis is given to solving the problems of maximal order in data capabilities of the computer, including the expense of some loss of accuracy. Therefore, the main objects of study is the most appropriate storage of information contained in the sparse matrix; maintaining the highest degree of rarefaction at all stages of the computational process. Thus, the development of efficient numerical methods for solving unstable systems refers to the actual problems of computational mathematics.

    In this paper, the approach to the construction of numerically stable direct multiplier methods for solving systems of linear equations, taking into account sparseness of matrices, presented in packaged form. The advantage of the approach consists in minimization of filling the main lines of the multipliers without compromising accuracy of the results and changes in the position of the next processed row of the matrix are made that allows you to use static data storage formats. The storage format of sparse matrices has been studied and the advantage of this format consists in possibility of parallel execution any matrix operations without unboxing, which significantly reduces the execution time and memory footprint.

    Direct multiplier methods for solving systems of linear equations are best suited for solving problems of large size on a computer — sparse matrix systems allow you to get multipliers, the main row of which is also sparse, and the operation of multiplication of a vector-row of the multiplier according to the complexity proportional to the number of nonzero elements of this multiplier.

    As a direct continuation of this work is proposed in the basis for constructing a direct multiplier algorithm of linear programming to put a modification of the direct multiplier algorithm for solving systems of linear equations based on integration of technique of linear programming for methods to select the host item. Direct multiplicative methods of linear programming are best suited for the construction of a direct multiplicative algorithm set the direction of descent Newton methods in unconstrained optimization by integrating one of the existing design techniques significantly positive definite matrix of the second derivatives.

    Views (last year): 20. Citations: 2 (RSCI).
  7. Зыза А.В.
    Компьютерное исследование полиномиальных решений уравнений динамики гиростата
    Компьютерные исследования и моделирование, 2018, т. 10, № 1, с. 7-25

    В работе исследуются полиномиальные решения уравнений движения гиростата под действием потенциальных и гироскопических сил и уравнений движения гиростата в магнитном поле с учетом эффекта Барнетта–Лондона. В математической постановке каждая из указанных задач описывается системой нелинейных обыкновенных дифференциальных уравнений, правые части которых содержат пятнадцать постоянных параметров, характеризующих распределение масс гиростата, потенциальные и непотенциальные силы, действующие на гиростат. Рассмотрены полиномиальные решения двух классов: Стеклова–Ковалевского–Горячева и Докшевича. Структура инвариантных соотношений для полиномиальных решений показывает, что, как правило, к указанным выше пятнадцати параметрам добавляется еще не менее двадцати пяти параметров задачи. При решении такой многопараметрической задачи в статье наряду с аналитическими методами применяются численные методы, основанные на вычислительных математических пакетах. Исследование условий существования полиномиальных решений проведено в два этапа. На первом этапе выполнена оценка максимальных степеней рассмотренных полиномов и получена нелинейная алгебраическая система на параметры дифференциальных уравнений и полиномиальных решений. На втором этапе с помощью компьютерных вычислений исследованы условия разрешимости полученных систем и изучены условия действительности построенных решений.

    Для уравнений Кирхгофа–Пуассона построены два новых полиномиальных решения. Первое решение характеризуется следующим свойством: квадраты проекций угловой скорости на небарецентрические оси являются многочленами пятой степени от компоненты вектора угловой скорости на барецентрическую ось, которая выражается в виде гиперэллиптической функции времени. Второе решение характеризуется тем, что первая компонента угловой скорости является многочленом второго порядка, вторая компонента—многочленом третьего порядка, квадрат третьей компоненты—многочленом шестого порядка по вспомогательной переменной, которая является обращением эллиптического интеграла Лежандра.

    Третье решение построено для уравнений движения гиростата в магнитном поле с учетом эффекта Барнетта–Лондона. Для него структура такова: первая и вторая компоненты вектора угловой скорости—многочлены второй степени, квадрат третьей компоненты—многочлен четвертой степени по вспомогательной переменной, которая находится обращением эллиптического интеграла Лежандра.

    Все построенные решения не имеют аналогов в динамике твердого тела с неподвижной точкой.

    Zyza A.V.
    Computer studies of polynomial solutions for gyrostat dynamics
    Computer Research and Modeling, 2018, v. 10, no. 1, pp. 7-25

    We study polynomial solutions of gyrostat motion equations under potential and gyroscopic forces applied and of gyrostat motion equations in magnetic field taking into account Barnett–London effect. Mathematically, either of the above mentioned problems is described by a system of non-linear ordinary differential equations whose right hand sides contain fifteen constant parameters. These parameters characterize the gyrostat mass distribution, as well as potential and non-potential forces acting on gyrostat. We consider polynomial solutions of Steklov–Kovalevski–Gorjachev and Doshkevich classes. The structure of invariant relations for polynomial solutions shows that, as a rule, on top of the fifteen parameters mentioned one should add no less than twenty five problem parameters. In the process of solving such a multi-parametric problem in this paper we (in addition to analytic approach) apply numeric methods based on CAS. We break our studies of polynomial solutions existence into two steps. During the first step, we estimate maximal degrees of polynomials considered and obtain a non-linear algebraic system for parameters of differential equations and polynomial solutions. In the second step (using the above CAS software) we study the solvability conditions of the system obtained and investigate the conditions of the constructed solutions to be real.

    We construct two new polynomial solutions for Kirchhoff–Poisson. The first one is described by the following property: the projection squares of angular velocity on the non-baracentric axes are the fifth degree polynomials of the angular velocity vector component of the baracentric axis that is represented via hypereliptic function of time. The second solution is characterized by the following: the first component of velocity conditions is a second degree polynomial, the second component is a polynomial of the third degree, and the square of the third component is the sixth degree polynomial of the auxiliary variable that is an inversion of the elliptic Legendre integral.

    The third new partial solution we construct for gyrostat motion equations in the magnetic field with Barnett–London effect. Its structure is the following: the first and the second components of the angular velocity vector are the second degree polynomials, and the square of the third component is a fourth degree polynomial of the auxiliary variable which is found via inversion of the elliptic Legendre integral of the third kind.

    All the solutions constructed in this paper are new and do not have analogues in the fixed point dynamics of a rigid body.

    Views (last year): 15.
  8. Душкин Р.В.
    Обзор текущего состояния квантовых технологий
    Компьютерные исследования и моделирование, 2018, т. 10, № 2, с. 165-179

    Сегодня квантовые технологии могут получить новый виток развития, что, наверняка, даст возможность получить решения для многочисленных задач, которые ранее не поддавались решению в рамках традиционных парадигм и вычислительных моделей. Все человечество стоит у порога так называемой второй квантовой революции, и ее краткосрочные и отдаленные последствия затронут практически все сферы жизни глобального общества. Свое непосредственное развитие получат такие направления и отрасли науки и техники, как материаловедение, нанотехнология, фармакология и биохимия вообще, моделирование хаотичных динамических процессов (ядерные взрывы, турбулентные потоки, погода и долгосрочные климатические явления) и т. д., а также решение любых задач, которые сводятся к перемножению матриц больших размеров (в частности, моделирование квантовых систем). Однако вместе с необычайными возможностями квантовые технологии несут с собой и определенные риски и угрозы, в частности слом всех информационных систем, основанных на современных достижениях криптографии, что повлечет за собой практически полное разрушение секретности, глобальный финансовый кризис из-за разрушения банковской сферы и компрометации всех каналов связи. Даже несмотря на то, что уже сегодня разрабатываются методы так называемой постквантовой криптографии, некоторые риски еще необходимо осознать, так как не все долгосрочные последствия могут быть просчитаны. Вместе с тем ко всему перечисленному надо быть готовым, в том числе при помощи подготовки специалистов, работающих в области квантовых технологий и понимающих все их аспекты, новые возможности, риски и угрозы. В связи с этим в настоящей статье приводится краткое описание текущего состояния квантовых технологий, а именно квантовой сенсорики, передачи информации при помощи квантовых протоколов, универсального квантового компьютера (аппаратное обеспечение) и квантовых вычислений, основанных на квантовых алгоритмов (программное обеспечение). Для всего перечисленного приводятся прогнозы развития в части воздействия на различные сферы человеческой цивилизации.

    Dushkin R.V.
    Review of Modern State of Quantum Technologies
    Computer Research and Modeling, 2018, v. 10, no. 2, pp. 165-179

    At present modern quantum technologies can get a new twist of development, which will certainly give an opportunity to obtain solutions for numerous problems that previously could not be solved in the framework of “traditional” paradigms and computational models. All mankind stands at the threshold of the so-called “second quantum revolution”, and its short-term and long-term consequences will affect virtually all spheres of life of a global society. Such directions and branches of science and technology as materials science, nanotechnology, pharmacology and biochemistry in general, modeling of chaotic dynamic processes (nuclear explosions, turbulent flows, weather and long-term climatic phenomena), etc. will be directly developed, as well as the solution of any problems, which reduce to the multiplication of matrices of large dimensions (in particular, the modeling of quantum systems). However, along with extraordinary opportunities, quantum technologies carry with them certain risks and threats, in particular, the scrapping of all information systems based on modern achievements in cryptography, which will entail almost complete destruction of secrecy, the global financial crisis due to the destruction of the banking sector and compromise of all communication channels. Even in spite of the fact that methods of so-called “post-quantum” cryptography are already being developed today, some risks still need to be realized, since not all long-term consequences can be calculated. At the same time, one should be prepared to all of the above, including by training specialists working in the field of quantum technologies and understanding all their aspects, new opportunities, risks and threats. In this connection, this article briefly describes the current state of quantum technologies, namely, quantum sensorics, information transfer using quantum protocols, a universal quantum computer (hardware), and quantum computations based on quantum algorithms (software). For all of the above, forecasts are given for the development of the impact on various areas of human civilization.

    Views (last year): 56.
  9. В данной статье решается задача определения функционального состояния опьянения водителей автотранспортных средств. Ее решение актуально в сфере транспортной безопасности при прохождении предрейсовых медицинских осмотров. Решение задачи основано на применении метода пупиллометрии, позволяющего судить о состоянии водителя по его зрачковой реакции на изменение освещенности. Производится постановка задачи определения состояния опьянения водителя по анализу значений параметров пупиллограммы — временного ряда, характеризующего изменение размеров зрачка при воздействии кратковременного светового импульса. Для анализа пупиллограмм предлагается использовать нейронную сеть. Разработана нейросетевая модель определения функционального состояния опьянения водителей. Для ее обучения использованы специально подготовленные выборки данных, представляющие собой сгруппированные по двум классам функциональных состояний водителей значения следующих параметров зрачковых реакций: диаметр начальный, диаметр минимальный, диаметр половинного сужения, диаметр конечный, амплитуда сужения, скорость сужения, скорость расширения, латентное время реакции, время сужения, время расширения, время половинного сужения и время половинного расширения. Приводится пример исходных данных. На основе их анализа построена нейросетевая модель в виде однослойного персептрона, состоящего из двенадцати входных нейронов, двадцати пяти нейронов скрытого слоя и одного выходного нейрона. Для повышения адекватности модели методом ROC-анализа определена оптимальная точка отсечения классов решений на выходе нейронной сети. Предложена схема определения состояния опьянения водителей, включающая следующие этапы: видеорегистрация зрачковой реакции, построение пупиллограммы, вычисление значений ее параметров, анализ данных на основе нейросетевой модели, классификация состояния водителя как «норма» или «отклонение от нормы», принятие решений по проверяемому лицу. Медицинскому работнику, проводящему осмотр водителя, представляется нейросетевая оценка его состояния опьянения. На основе данной оценки производится заключение о допуске или отстранении водителя от управления транспортным средством. Таким образом, нейросетевая модель решает задачу повышения эффективности проведения предрейсового медицинского осмотра за счет повышения достоверности принимаемых решений.

    Akhmetvaleev A.M., Katasev A.S.
    Neural network model of human intoxication functional state determining in some problems of transport safety solution
    Computer Research and Modeling, 2018, v. 10, no. 3, pp. 285-293

    This article solves the problem of vehicles drivers intoxication functional statedetermining. Its solution is relevant in the transport security field during pre-trip medical examination. The problem solution is based on the papillomometry method application, which allows to evaluate the driver state by his pupillary reaction to illumination change. The problem is to determine the state of driver inebriation by the analysis of the papillogram parameters values — a time series characterizing the change in pupil dimensions upon exposure to a short-time light pulse. For the papillograms analysis it is proposed to use a neural network. A neural network model for determining the drivers intoxication functional state is developed. For its training, specially prepared data samples are used which are the values of the following parameters of pupillary reactions grouped into two classes of functional states of drivers: initial diameter, minimum diameter, half-constriction diameter, final diameter, narrowing amplitude, rate of constriction, expansion rate, latent reaction time, the contraction time, the expansion time, the half-contraction time, and the half-expansion time. An example of the initial data is given. Based on their analysis, a neural network model is constructed in the form of a single-layer perceptron consisting of twelve input neurons, twenty-five neurons of the hidden layer, and one output neuron. To increase the model adequacy using the method of ROC analysis, the optimal cut-off point for the classes of solutions at the output of the neural network is determined. A scheme for determining the drivers intoxication state is proposed, which includes the following steps: pupillary reaction video registration, papillogram construction, parameters values calculation, data analysis on the base of the neural network model, driver’s condition classification as “norm” or “rejection of the norm”, making decisions on the person being audited. A medical worker conducting driver examination is presented with a neural network assessment of his intoxication state. On the basis of this assessment, an opinion on the admission or removal of the driver from driving the vehicle is drawn. Thus, the neural network model solves the problem of increasing the efficiency of pre-trip medical examination by increasing the reliability of the decisions made.

    Views (last year): 42. Citations: 2 (RSCI).
  10. Гасников А.В., Горбунов Э.А., Ковалев Д.А., Мохаммед А.А., Черноусова Е.О.
    Обоснование гипотезы об оптимальных оценках скорости сходимости численных методов выпуклой оптимизации высоких порядков
    Компьютерные исследования и моделирование, 2018, т. 10, № 6, с. 737-753

    В данной работе рассматривается проксимальный быстрый градиентный метод Монтейро – Свайтера (2013 г.), в котором используется один шаг метода Ньютона для приближенного решения вспомогательной задачи на каждой итерации проксимального метода. Метод Монтейро – Свайтера является оптимальным (по числу вычислений градиента и гессиана оптимизируемой функции) для достаточно гладких задач выпуклой оптимизации в классе методов, использующих только градиент и гессиан оптимизируемой функции. За счет замены шага метода Ньютона на шаг недавно предложенного тензорного метода Ю. Е. Нестерова (2018 г.), а также за счет специального обобщения условия подбора шага в проксимальном внешнем быстром градиентном методе удалось предложить оптимальный тензорный метод, использующий старшие производные. В частности, такой тензорный метод, использующий производные до третьего порядка включительно, оказался достаточно практичным ввиду сложности итерации, сопоставимой со сложностью итерации метода Ньютона. Таким образом, получено конструктивное решение задачи, поставленной Ю. Е. Нестеровым в 2018 г., об устранении зазора в точных нижних и завышенных верхних оценках скорости сходимости для имеющихся на данный момент тензорных методов порядка $p \geqslant 3$.

    Gasnikov A.V., Gorbunov E.A., Kovalev D.A., Mohammed A.A., Chernousova E.O.
    The global rate of convergence for optimal tensor methods in smooth convex optimization
    Computer Research and Modeling, 2018, v. 10, no. 6, pp. 737-753

    In this work we consider Monteiro – Svaiter accelerated hybrid proximal extragradient (A-HPE) framework and accelerated Newton proximal extragradient (A-NPE) framework. The last framework contains an optimal method for rather smooth convex optimization problems with second-order oracle. We generalize A-NPE framework for higher order derivative oracle (schemes). We replace Newton’s type step in A-NPE that was used for auxiliary problem by Newton’s regularized (tensor) type step (Yu. Nesterov, 2018). Moreover we generalize large step A-HPE/A-NPE framework by replacing Monteiro – Svaiter’s large step condition so that this framework could work for high-order schemes. The main contribution of the paper is as follows: we propose optimal highorder methods for convex optimization problems. As far as we know for that moment there exist only zero, first and second order optimal methods that work according to the lower bounds. For higher order schemes there exists a gap between the lower bounds (Arjevani, Shamir, Shiff, 2017) and existing high-order (tensor) methods (Nesterov – Polyak, 2006; Yu.Nesterov, 2008; M. Baes, 2009; Yu.Nesterov, 2018). Asymptotically the ratio of the rates of convergences for the best existing methods and lower bounds is about 1.5. In this work we eliminate this gap and show that lower bounds are tight. We also consider rather smooth strongly convex optimization problems and show how to generalize the proposed methods to this case. The basic idea is to use restart technique until iteration sequence reach the region of quadratic convergence of Newton method and then use Newton method. One can show that the considered method converges with optimal rates up to a logarithmic factor. Note, that proposed in this work technique can be generalized in the case when we can’t solve auxiliary problem exactly, moreover we can’t even calculate the derivatives of the functional exactly. Moreover, the proposed technique can be generalized to the composite optimization problems and in particular to the constraint convex optimization problems. We also formulate a list of open questions that arise around the main result of this paper (optimal universal method of high order e.t.c.).

    Views (last year): 75.
Pages: « first previous next last »

Indexed in Scopus

Full-text version of the journal is also available on the web site of the scientific electronic library eLIBRARY.RU

The journal is included in the Russian Science Citation Index

The journal is included in the RSCI

International Interdisciplinary Conference "Mathematics. Computing. Education"