All issues
- 2025 Vol. 17
- 2024 Vol. 16
- 2023 Vol. 15
- 2022 Vol. 14
- 2021 Vol. 13
- 2020 Vol. 12
- 2019 Vol. 11
- 2018 Vol. 10
- 2017 Vol. 9
- 2016 Vol. 8
- 2015 Vol. 7
- 2014 Vol. 6
- 2013 Vol. 5
- 2012 Vol. 4
- 2011 Vol. 3
- 2010 Vol. 2
- 2009 Vol. 1
-
Обучение с подкреплением при оптимизации параметров торговой стратегии на финансовых рынках
Компьютерные исследования и моделирование, 2024, т. 16, № 7, с. 1793-1812Высокочастотная алгоритмическая торговля — это подкласс трейдинга, ориентированный на получение прибыли на субсекундных временных интервалах. Такие торговые стратегии не зависят от большинства факторов, подходящих для долгосрочной торговли, и требуют особого подхода. Было много попыток использовать методы машинного обучения как для высоко-, так и для низкочастотной торговли. Однако они по-прежнему имеют ограниченное применение на практике из-за высокой подверженности переобучению, требований к быстрой адаптации к новым режимам рынка и общей нестабильности результатов. Мы провели комплексное исследование по сочетанию известных количественных теорий и методов обучения с подкреплением, чтобы вывести более эффективный и надежный подход при построении автоматизированной торговой системы в попытке создать поддержку для известных алгоритмических торговых техник. Используя классические теории поведения цен, а также современные примеры применения в субмиллисекундной торговле, мы применили модели обучения с усилением для улучшения качества алгоритмов. В результате мы создали надежную модель, использующую глубокое обучение с усилением для оптимизации параметров статических торговых алгоритмов, способных к онлайн-обучению на живых данных. Более конкретно, мы исследовали систему на срочном криптовалютном рынке, который в основном не зависит от внешних факторов в краткосрочной перспективе. Наше исследование было реализовано в высокочастотной среде, и итоговые модели показали способность работать в рамках принятых таймфреймов высокочастотной торговли. Мы сравнили различные комбинации подходов глубинного обучения с подкреплением и классических алгоритмов и оценили устойчивость и эффективность улучшений для каждой комбинации.
Ключевые слова: обучение с подкреплением, алгоритмическая торговля, высокочастотная торговля, маркет-мейкинг.
Reinforcement learning in optimisation of financial market trading strategy parameters
Computer Research and Modeling, 2024, v. 16, no. 7, pp. 1793-1812High frequency algorithmic trading became is a subclass of trading which is focused on gaining basis-point like profitability on sub-second time frames. Such trading strategies do not depend on most of the factors eligible for the longer-term trading and require specific approach. There were many attempts to utilize machine learning techniques to both high and low frequency trading. However, it is still having limited application in the real world trading due to high exposure to overfitting, requirements for rapid adaptation to new market regimes and overall instability of the results. We conducted a comprehensive research on combination of known quantitative theory and reinforcement learning methods in order derive more effective and robust approach at construction of automated trading system in an attempt to create a support for a known algorithmic trading techniques. Using classical price behavior theories as well as modern application cases in sub-millisecond trading, we utilized the Reinforcement Learning models in order to improve quality of the algorithms. As a result, we derived a robust model which utilize Deep Reinforcement learning in order to optimise static market making trading algorithms’ parameters capable of online learning on live data. More specifically, we explored the system in the derivatives cryptocurrency market which mostly not dependent on external factors in short terms. Our research was implemented in high-frequency environment and the final models showed capability to operate within accepted high-frequency trading time-frames. We compared various combinations of Deep Reinforcement Learning approaches and the classic algorithms and evaluated robustness and effectiveness of improvements for each combination.
-
Теоретическое моделирование достижения консенсуса в условиях коалиций на основе регулярных марковских цепей
Компьютерные исследования и моделирование, 2020, т. 12, № 5, с. 1247-1256Часто решения в социальных группах принимается на основе консенсуса. Это касается, например, проведения экспертизы в техническом комитете по стандартизации (ТК) перед утверждением национального стандарта Росстандартом. Стандарт утверждается в том и только том случае, если обеспечен консенсус в ТК. Такой же подход к разработке стандартов принят практически во всех странах мира, а также на региональном и международном уровне. Ранее опубликованные работы авторов посвящены построению математической модели времени достижения консенсуса в технических комитетах по стандартизации в условиях варьирования числа членов ТК и уровня их авторитарности. Настоящее исследование является продолжением этих работ для случая образования коалиций в работе социальных групп, в том числе технических комитетов по стандартизации. В рамках модели показано, что при наличии коалиций консенсус не достижим. Однако коалиции, как правило, преодолеваются в ходе переговорного процесса, в против- ном случае число принятых стандартов было бы исключительно мало. В работе проанализированы факторы, которые оказывают влияние на преодоление коалиций: величина уступки и индекс влияния коалиции. На основе статистического моделирования регулярных марковских цепей исследуется их воздействие на время обеспечения консенсуса. Доказано, что время достижения консенсуса значимо зависит от величины односторонней уступки коалиции и слабо зависит от размеров коалиций. Построена регрессионная модель зависимости среднего числа согласований от величины уступки. Выявлено, что даже небольшая уступка влечет наступление консенсуса, увеличение размера уступки приводит (при прочих равных факторах) к резкому снижению времени до наступления консенсуса. Показано, что уступка бо́льшей коалиции в отношении малочисленной коалиции не требует в среднем бо́льшего времени до наступления консенсуса. Уступка авторитарного лидера в группе позволяет сократить число согласований и повысить качество консенсуса. Полученные результаты имеют практическую ценность для всех организационных структур, где возникновение коалиций влечет невозможность принятия решений в рамках достижения консенсуса и требует рассмотрения различных способов для выхода на консенсусное решение.
Ключевые слова: социальная группа, консенсус, стандарты, регулярные марковские цепи, время достижения консенсуса, коалиции.
Theoretical modeling consensus building in the work of standardization technical committees in coalitions based on regular Markov chains
Computer Research and Modeling, 2020, v. 12, no. 5, pp. 1247-1256Often decisions in social groups are made by consensus. This applies, for example, to the examination in the technical committee for standardization (TC) before the approval of the national standard by Rosstandart. The standard is approved if and only if the secured consensus in the TC. The same approach to standards development was adopted in almost all countries and at the regional and international level. Previously published works of authors dedicated to the construction of a mathematical model of time to reach consensus in technical committees for standardization in terms of variation in the number of TC members and their level of authoritarianism. The present study is a continuation of these works for the case of the formation of coalitions that are often formed during the consideration of the draft standard to the TC. In the article the mathematical model is constructed to ensure consensus on the work of technical standardization committees in terms of coalitions. In the framework of the model it is shown that in the presence of coalitions consensus is not achievable. However, the coalition, as a rule, are overcome during the negotiation process, otherwise the number of the adopted standards would be extremely small. This paper analyzes the factors that influence the bridging coalitions: the value of the assignment and an index of the effect of the coalition. On the basis of statistical modelling of regular Markov chains is investigated their effects on the time to ensure consensus in the technical Committee. It is proved that the time to reach consensus significantly depends on the value of unilateral concessions coalition and weakly depends on the size of coalitions. Built regression model of dependence of the average number of approvals from the value of the assignment. It was revealed that even a small concession leads to the onset of consensus, increasing the size of the assignment results (with other factors being equal) to a sharp decline in time before the consensus. It is shown that the assignment of a larger coalition against small coalitions takes on average more time before consensus. The result has practical value for all organizational structures, where the emergence of coalitions entails the inability of decision-making in the framework of consensus and requires the consideration of various methods for reaching a consensus decision.
-
Оптимальное управление вложением средств банка как фактор экономической стабильности
Компьютерные исследования и моделирование, 2012, т. 4, № 4, с. 959-967В работе представлена модель пополнения банковской ликвидности собственными средствами банков. Дано методологическое обоснование необходимости создания банковских стабилизационных фондов для покрытия убытков в период кризиса в экономике. Приводится эконометрический вывод уравнений описывающих поведение банка в финансовой и операционной деятельности. В соответствии с поставленной целью создания стабилизационного фонда вводится критерий оптимальности осуществляемого управления. На основе полученных уравнений поведения банка, методом динамического программирования выводится вектор оптимальных управлений.
Ключевые слова: банковская ликвидность, стабилизационный фонд, нелинейная регрес- сия, доход функция, критерий, оптимальное управление, динамическое программирование.
Optimal control of bank investment as a factorof economic stability
Computer Research and Modeling, 2012, v. 4, no. 4, pp. 959-967Views (last year): 5.This paper presents a model of replenishment of bank liquidity by additional income of banks. Given the methodological basis for the necessity for bank stabilization funds to cover losses during the economy crisis. An econometric derivation of the equations describing the behavior of the bank financial and operating activity performed. In accordance with the purpose of creating a stabilization fund introduces an optimality criterion used controls. Based on the equations of the behavior of the bank by the method of dynamic programming is derived a vector of optimal controls.
-
Опыт использования puppet для управления вычислительным грид-кластером Tier-1 в НИЦ «Курчатовский институт»
Компьютерные исследования и моделирование, 2015, т. 7, № 3, с. 735-740Статья посвящена организации системы управления кластером при помощи puppet. Рассматриваются вопросы: безопасности использования, с точки зрения массового применения к вычислительному кластеру неверной конфигурации (в виду человеческого фактора); организации совместной работы и создания для каждого администратора возможности, независимо от других, написания и отладки собственных сценариев, до включения их в общую систему управления; написания сценариев, которые позволят получить как целиком настроенный узел, так и обновлять конфигурацию по частям, не затрагивая остальные компоненты, независимо от текущего состояния узла вычислительного кластера.
Сравниваются различные подходы к созданию иерархии puppet сценариев: описываются проблемы, связанные с использованием «include» для организации иерархии и переход к системе последова- тельного вызова классов через shell-скрипт.
Ключевые слова: puppet, автоматизация настройки, совместное управление кластером, варианты использования puppet.
Experience of puppet usage for managment of Tier-1 GRID cluster at NRC “Kurchatov Institute”
Computer Research and Modeling, 2015, v. 7, no. 3, pp. 735-740This article is about the organization of the cluster management using puppet. It tells about: safety of usage, from the point of view of mass apply at a computing cluster wrong configuration (by reason of human factor); collaboration work and the creation of opportunities for each cluster administrator, regardless of others, writing and debugging your own scripts, before include them in the overall system of cluster managment; writing scripts, which allow to get as fully configured nodes, and updates the configuration of any system parts, without affecting the rest of the nodes components, regardless of the current state of the node of computing cluster.
The article compares different methods of the creation of the hierarchy of puppet scenarios, describes problems associated with the use of “include” for the organization hierarchy, and tells about the transition to a system of sequential call classes through shell-script.
Indexed in Scopus
Full-text version of the journal is also available on the web site of the scientific electronic library eLIBRARY.RU
The journal is included in the Russian Science Citation Index
The journal is included in the RSCI
International Interdisciplinary Conference "Mathematics. Computing. Education"




