All issues
- 2026 Vol. 18
- 2025 Vol. 17
- 2024 Vol. 16
- 2023 Vol. 15
- 2022 Vol. 14
- 2021 Vol. 13
- 2020 Vol. 12
- 2019 Vol. 11
- 2018 Vol. 10
- 2017 Vol. 9
- 2016 Vol. 8
- 2015 Vol. 7
- 2014 Vol. 6
- 2013 Vol. 5
- 2012 Vol. 4
- 2011 Vol. 3
- 2010 Vol. 2
- 2009 Vol. 1
-
Семантическая структуризация текстовых документов на основе паттернов сущностей естественного языка
Компьютерные исследования и моделирование, 2022, т. 14, № 5, с. 1185-1197Рассматривается технология создания паттернов из слов (понятий) естественного языка по текстовым данным в модели «мешок слов». Паттерны применяются для снижения размерности исходного пространства в описании документов и поиска семантически связанных слов по темам. Процесс снижения размерности реализуется через формирование по паттернам латентных признаков. Исследуется многообразие структур отношений документов для разбиения их на темы в латентном пространстве.
Считается, что заданное множество документов (объектов) разделено на два непересекающихся класса, для анализа которых необходимо использовать общий словарь. Принадлежность слов к общему словарю изначально неизвестна. Объекты классов рассматриваются в ситуации оппозиции друг к другу. Количественные параметры оппозиционности определяются через значения устойчивости каждого признака и обобщенные оценки объектов по непересекающимся наборам признаков.
Для вычисления устойчивости используются разбиения значений признаков на непересекающиеся интервалы, оптимальные границы которых определяются по специальному критерию. Максимум устойчивости достигается при условии, что в границах каждого интервала содержатся значения одного из двух классов.
Состав признаков в наборах (паттернах из слов) формируется из упорядоченной по значениям устойчивости последовательности. Процесс формирования паттернов и латентных признаков на их основе реализуется по правилам иерархической агломеративной группировки.
Набор латентных признаков используется для кластерного анализа документов по метрическим алгоритмам группировки. В процессе анализа применяется коэффициент контентной аутентичности на основе данных о принадлежности документов к классам. Коэффициент является численной характеристикой доминирования представителей классов в группах.
Для разбиения документов на темы предложено использовать объединение групп по отношению их центров. В качестве закономерностей по каждой теме рассматривается упорядоченная по частоте встречаемости последовательность слов из общего словаря.
Приводятся результаты вычислительного эксперимента на коллекциях авторефератов научных диссертаций. Сформированы последовательности слов из общего словаря по четырем темам.
Ключевые слова: тематическое моделирование, иерархическая агломеративная группировка, онтология, общий словарь, контентная аутентичность.
Semantic structuring of text documents based on patterns of natural language entities
Computer Research and Modeling, 2022, v. 14, no. 5, pp. 1185-1197The technology of creating patterns from natural language words (concepts) based on text data in the bag of words model is considered. Patterns are used to reduce the dimension of the original space in the description of documents and search for semantically related words by topic. The process of dimensionality reduction is implemented through the formation of patterns of latent features. The variety of structures of document relations is investigated in order to divide them into themes in the latent space.
It is considered that a given set of documents (objects) is divided into two non-overlapping classes, for the analysis of which it is necessary to use a common dictionary. The belonging of words to a common vocabulary is initially unknown. Class objects are considered as opposition to each other. Quantitative parameters of oppositionality are determined through the values of the stability of each feature and generalized assessments of objects according to non-overlapping sets of features.
To calculate the stability, the feature values are divided into non-intersecting intervals, the optimal boundaries of which are determined by a special criterion. The maximum stability is achieved under the condition that the boundaries of each interval contain values of one of the two classes.
The composition of features in sets (patterns of words) is formed from a sequence ordered by stability values. The process of formation of patterns and latent features based on them is implemented according to the rules of hierarchical agglomerative grouping.
A set of latent features is used for cluster analysis of documents using metric grouping algorithms. The analysis applies the coefficient of content authenticity based on the data on the belonging of documents to classes. The coefficient is a numerical characteristic of the dominance of class representatives in groups.
To divide documents into topics, it is proposed to use the union of groups in relation to their centers. As patterns for each topic, a sequence of words ordered by frequency of occurrence from a common dictionary is considered.
The results of a computational experiment on collections of abstracts of scientific dissertations are presented. Sequences of words from the general dictionary on 4 topics are formed.
-
Нечеткое моделирование восприимчивости человека к паническим ситуациям
Компьютерные исследования и моделирование, 2021, т. 13, № 1, с. 203-218Изучение механизма развития массовой паники ввиду ее чрезвычайной значимости и социальной опасности представляет собой важную научную задачу. Имеющаяся информация о механизме ее разви- тия основана в основном на работах специалистов-психологов и относится к разряду неточной. Поэтому в качестве инструмента для разработки математической модели восприимчивости человека к паническим ситуациям выбрана теория нечетких множеств.
В результате проведенного исследования разработана нечеткая модель, состоящая из следующих блоков: «Фаззификация», где происходит вычисление степени принадлежности значений входных пара- метров к нечетким множествам; «Вывод», где на основе степени принадлежности входных параметров вычисляется результирующая функция принадлежности выходного значения нечеткой модели; «Дефаззификация», где с помощью метода центра тяжести определяется единственное количественное значение выходной переменной, характеризующей восприимчивость человека к паническим ситуациям.
Так как реальные количественные значения для лингвистических переменных психических свойств человека неизвестны, то оценить качество разработанной модели, создавая настоящую ситуацию страха и паники, не подвергая людей опасности, не представляется возможным. Поэтому качество результатов нечеткого моделирования оценивалось по расчетному значению коэффициента детерминации, показавшего, что разработанная нечеткая модель относится к разряду моделей хорошего качества $(R^2 = 0.93)$, что подтверждает правомерность принятых допущений при ее разработке.
Согласно результатам моделирования восприимчивость человека к паническим ситуациям для сангвинического и холерического видов темперамента в соответствии с принятой классификацией можно отнести к повышенной (0.88), а для флегматического и меланхолического — к умеренной (0.38). Это означает, что холерики и сангвиники могут стать эпицентрами распространения паники и инициаторами возникновения давки, а флегматики и меланхолики — препятствиями на путях эвакуации, что необходимо учитывать при разработке эффективных эвакуационных мероприятий, главной задачей которых является быстрая и безопасная эвакуация людей из неблагоприятных условий.
В утвержденных методиках расчет нормативных значений параметров безопасности основан на упрощенных аналитических моделях движения людского потока, потому что приходится учитывать большое число факторов, часть которых являются количественно неопределенными. Полученный результат в виде количественных оценок восприимчивости человека к паническим ситуациям позволит повысить точность расчетов.
Ключевые слова: массовая паника, восприимчивость человека к паническим ситуациям, неточная информация, теория нечетких множеств, нечеткая модель.
Fuzzy modeling of human susceptibility to panic situations
Computer Research and Modeling, 2021, v. 13, no. 1, pp. 203-218The study of the mechanism for the development of mass panic in view of its extreme importance and social danger is an important scientific task. Available information about the mechanism of her development is based mainly on the work of psychologists and belongs to the category of inaccurate. Therefore, the theory of fuzzy sets has been chosen as a tool for developing a mathematical model of a person's susceptibility to panic situations. As a result of the study, an fuzzy model was developed, consisting of blocks: “Fuzzyfication”, where the degree of belonging of the values of the input parameters to fuzzy sets is calculated; “Inference” where, based on the degree of belonging of the input parameters, the resulting function of belonging of the output value to an odd model is calculated; “Defuzzyfication”, where using the center of gravity method, the only quantitative value of the output variable characterizing a person's susceptibility to panic situations is determined Since the real quantitative values for linguistic variables mental properties of a person are unknown, then to assess the quality of the developed model, without endangering people, it is not possible. Therefore, the quality of the results of fuzzy modeling was estimated by the calculated value of the determination coefficient R2, which showed that the developed fuzzy model belongs to the category of good quality models $(R^2 = 0.93)$, which confirms the legitimacy of the assumptions made during her development. In accordance with to the results of the simulation, human susceptibility to panic situations for sanguinics and cholerics can be attributed to “increased” (0.88), and for phlegmatics and melancholics — to “moderate” (0.38). This means that cholerics and sanguinics can become epicenters of panic and the initiators of stampede, and phlegmatics and melancholics — obstacles to evacuation routes. What should be taken into account when developing effective evacuation measures, the main task of which is to quickly and safely evacuate people from adverse conditions. In the approved methods, the calculation of normative values of safety parameters is based on simplified analytical models of human flow movement, because a large number of factors have to be taken into account, some of which are quantitatively uncertain. The obtained result in the form of quantitative estimates of a person's susceptibility to panic situations will increase the accuracy of calculations.
-
Нечеткое моделирование механизма передачи панического состояния среди людей с различными видами темперамента
Компьютерные исследования и моделирование, 2021, т. 13, № 5, с. 1079-1092Массовое скопление людей всегда представляет собой потенциальную опасность и угрозу для их жизни. К тому же ежегодно в мире в давке, основной причиной которой является массовая паника, гибнет очень большое количество людей. Поэтому изучение феномена массовой паники, ввиду ее чрезвычайной социальной опасности, представляет собой важную научную задачу. Имеющаяся информация о процессах ее возникновения и распространения относится к разряду неточной. Поэтому в качестве инструмента для разработки математической модели механизма передачи панического состояния среди людей с различными видами темперамента выбрана теория нечетких множеств.
При разработке нечеткой модели было сделано предположение о том, что паника, из эпицентра шокирующего стимула, распространяется среди людей по волновому принципу, проходя с различной частотой через разные среды (виды темперамента человека), и определяется скоростью и интенсивностью циркулярной реакции механизма передачи панического состояния. Поэтому разработанная нечеткая модель, наряду с двумя входами, имеет два выхода — скорость и интенсивность циркулярной реакции. В блоке «Фаззификация» вычисляются степени принадлежности числовых значений входных параметров (частоты волны распространения паники и восприимчивости человека к паническим ситуациям) к нечетким множествам. Блок «Вывод» на входе получает степени принадлежности для каждого входного параметра и на выходе определяет результирующую функцию принадлежности скорости циркулярной реакции и ее производную, являющуюся функцией принадлежности для интенсивности циркулярной реакции. В блоке «Дефаззификация» с помощью метода центра тяжести определяется количественное значение для каждого выходного параметра. Оценка качества разработанной нечеткой модели, проведенная посредством вычисления коэффициента детерминации, показала, что разработанная математическая модель относится к разряду моделей хорошего качества.
Полученный результат в виде количественных оценок циркулярной реакции позволяет улучшить качество понимания психических процессов, происходящих при передаче панического состояния среди людей. Кроме того, это дает возможность усовершенствовать существующие и разрабатывать новые модели хаотичного поведения людей, которые предназначены для выработки эффективных решений в кризисных ситуациях, направленных на полное либо частичное предотвращение распространения массовой паники, приводящей к возникновению панического бегства, давки и появлению человеческих жертв.
Ключевые слова: массовая паника, механизм передачи панического состояния, нечеткая модель, функция принадлежности.
Fuzzy modeling the mechanism of transmitting panic state among people with various temperament species
Computer Research and Modeling, 2021, v. 13, no. 5, pp. 1079-1092A mass congestion of people always represents a potential danger and threat for their lives. In addition, every year in the world a very large number of people die because of the crush, the main cause of which is mass panic. Therefore, the study of the phenomenon of mass panic in view of her extreme social danger is an important scientific task. Available information, about the processes of her occurrence and spread refers to the category inaccurate. Therefore, the theory of fuzzy sets has been chosen as a tool for developing a mathematical model of the mechanism of transmitting panic state among people with various temperament species.
When developing an fuzzy model, it was assumed that panic, from the epicenter of the shocking stimulus, spreads among people according to the wave principle, passing at different frequencies through different environments (types of human temperament), and is determined by the speed and intensity of the circular reaction of the mechanism of transmitting panic state among people. Therefore, the developed fuzzy model, along with two inputs, has two outputs — the speed and intensity of the circular reaction. In the block «Fuzzyfication», the degrees of membership of the numerical values of the input parameters to fuzzy sets are calculated. The «Inference» block at the input receives degrees of belonging for each input parameter and at the output determines the resulting function of belonging the speed of the circular reaction and her derivative, which is a function of belonging for the intensity of the circular reaction. In the «Defuzzyfication» block, using the center of gravity method, a quantitative value is determined for each output parameter. The quality assessment of the developed fuzzy model, carried out by calculating of the determination coefficient, showed that the developed mathematical model belongs to the category of good quality models.
The result obtained in the form of quantitative assessments of the circular reaction makes it possible to improve the quality of understanding of the mental processes occurring during the transmission of the panic state among people. In addition, this makes it possible to improve existing and develop new models of chaotic humans behaviors. Which are designed to develop effective solutions in crisis situations, aimed at full or partial prevention of the spread of mass panic, leading to the emergence of panic flight and the appearance of human casualties.
-
О некоторых методах зеркального спуска для задач сильно выпуклого программирования с липшицевыми функциональными ограничениями
Компьютерные исследования и моделирование, 2024, т. 16, № 7, с. 1727-1746Статья посвящена специальному подходу к субградиентным методам для задач сильно выпуклого программирования с несколькими функциональными ограничениями. Точнее говоря, рассматривается задача сильно выпуклой минимизации с несколькими сильно выпуклыми ограничениями-неравенствами и предлагаются оптимизационные методы первого порядка для такого класса задач. Особенность предложенных методов — возможность использования в теоретических оценках качества выдаваемого методом решения параметров сильной выпуклости именно тех функционалов ограничений, для которых нарушается условие продyктивности итерации. Основная задача — предложить для такой постановки субградиентный метод с адаптивными правилами подбора шагов и остановки метода. Ключевая идея предложенной в данной статье методики заключается в объединении двух подходов: схемы с переключениями по продуктивным и непродуктивным шагам и недавно предложенных модификаций зеркального спуска для задач выпуклого программирования, позволяющих игнорировать часть функциональных ограничений на непродуктивных шагах алгоритма. В статье описан субградиентний метод с переключением по продyктивным и непродyктивным шагам для задач сильно выпуклого программирования в случае, когда целевая функция и функциональные ограничения удовлетворяют условию Липшица. Также рассмотрен аналог этой схемы типа зеркального спуска для задач с относительно липшицевыми и относительно сильно выпуклыми целевой функцией и ограничениями. Для предлагаемых методов получены теоретические оценки качества выдаваемого решения, указывающие на оптимальность этих методов с точки зрения нижних оракульных оценок. Кроме того, поскольку во многих задачах операция нахождения точного вектора субградиента достаточно затратна, то для рассматриваемого класса задач исследованы аналоги указанных выше методов с заменой обычного субградиента на $\delta$-субградиент целевого функционала или функциональных ограничений-неравенств. Отмеченный подход может позволить сэкономить вычислительные затраты метода за счет отказа от требования доступности точного значения субградиента в текущей точке. Показано, что оценки качества решения при этом изменяются на величину $O(\delta)$. Также приводятся результаты численных экспериментов, иллюстрирующие преимущество предлагаемых в статье методов в сравнении с некоторыми ранее известными.
Ключевые слова: субградиентный метод, зеркальный спуск, сильно выпуклая функция, липшицева функция, $\delta$-субградиент, продyктивный шаг, непродyктивный шаг.
On some mirror descent methods for strongly convex programming problems with Lipschitz functional constraints
Computer Research and Modeling, 2024, v. 16, no. 7, pp. 1727-1746The paper is devoted to one approach to constructing subgradient methods for strongly convex programming problems with several functional constraints. More precisely, the strongly convex minimization problem with several strongly convex (inequality-type) constraints is considered, and first-order optimization methods for this class of problems are proposed. The special feature of the proposed methods is the possibility of using the strong convexity parameters of the violated functional constraints at nonproductive iterations, in theoretical estimates of the quality of the produced solution by the methods. The main task, to solve the considered problem, is to propose a subgradient method with adaptive rules for selecting steps and stopping rule of the method. The key idea of the proposed methods in this paper is to combine two approaches: a scheme with switching on productive and nonproductive steps and recently proposed modifications of mirror descent for convex programming problems, allowing to ignore some of the functional constraints on nonproductive steps of the algorithms. In the paper, it was described a subgradient method with switching by productive and nonproductive steps for strongly convex programming problems in the case where the objective function and functional constraints satisfy the Lipschitz condition. An analog of the proposed subgradient method, a mirror descent scheme for problems with relatively Lipschitz and relatively strongly convex objective functions and constraints is also considered. For the proposed methods, it obtained theoretical estimates of the quality of the solution, they indicate the optimality of these methods from the point of view of lower oracle estimates. In addition, since in many problems, the operation of finding the exact subgradient vector is quite expensive, then for the class of problems under consideration, analogs of the mentioned above methods with the replacement of the usual subgradient of the objective function or functional constraints by the $\delta$-subgradient were investigated. The noted approach can save computational costs of the method by refusing to require the availability of the exact value of the subgradient at the current point. It is shown that the quality estimates of the solution change by $O(\delta)$. The results of numerical experiments illustrating the advantages of the proposed methods in comparison with some previously known ones are also presented.
-
Дискретная сетевая динамическая система для моделирования распространения паники в группах людей
Компьютерные исследования и моделирование, 2026, т. 18, № 2, с. 483-499В работе рассматривается задача моделирования формирования и распространения панических состояний в социальных группах людей с относительно устойчивой структурой межличностных взаимодействий. Паника интерпретируется как нелинейный процесс эмоционального заражения, возникающий в результате взаимодействия индивидуальных психологических характеристик и коллективных эффектов в социальной среде. В отличие от моделей, ориентированных на пространственную динамику движущихся толп, предложенный подход фокусируется на квазистационарных сетях взаимодействий, отражающих информационные и эмоциональные контакты между участниками. Разработанная дискретная сетевая динамическая система интегрирует индивидуальные параметры типов темпераментов человека (сангвинического, холерического, флегматического и меланхолического), структуру социальных связей и нелинейные механизмы коллективного поведения. Индивидуальная динамика паники описывается S-образной функцией роста, обеспечивающей ограниченность уровня эмоционального возбуждения и отражающей стадии его формирования и насыщения. Социальное влияние моделируется на графе межличностных взаимодействий (случайная сеть Эрдёша – Реньи) через локальные контакты между участниками. Дополнительно учитываются эффекты коллективного заражения и лавинообразного усиления, обусловленные средним уровнем паники в группе, а также базовый стрессовый фактор, зависящий от численности группы. Численное моделирование реализовано в дискретной итерационной форме с возможностью анализа индивидуальных и групповых траекторий паники. Введен количественный показатель скорости распространения паники, определяемый временем достижения состоянием группы уровня, близкого к полной панике. Проведен сравнительный анализ гетерогенной и однородных групп, показавший, что гетерогенность состава существенно ускоряет распространение паники за счет межтемпераментного взаимодействия: высоковозбудимые индивиды выступают инициаторами эмоционального заражения, тогда как более устойчивые участники частично сглаживают его динамику. Оценка качества модели с использованием коэффициента детерминации показала высокую степень согласованности результатов в рамках модельных данных. Практическая значимость работы заключается в возможности применения модели для анализа устойчивости социальных групп к паническим состояниям, оценки рисков на массовых мероприятиях и разработки интеллектуальных систем мониторинга коллективного поведения. Перспективы дальнейших исследований связаны с расширением модели с учетом направленных и динамических сетей, а также с ее калибровкой на основе эмпирических данных.
Ключевые слова: паническое состояние, эмоциональное заражение, сетевое моделирование, нелинейная динамика, социальные взаимодействия, численное моделирование.
Discrete network dynamic system for modeling the spread of panic in groups of people
Computer Research and Modeling, 2026, v. 18, no. 2, pp. 483-499The paper addresses the problem of modeling the formation and propagation of panic states in social groups with relatively stable structures of interpersonal interactions. Panic is interpreted as a nonlinear process of emotional contagion arising from the interaction between individual psychological characteristics and collective effects within a social environment. In contrast to models focused on the spatial dynamics of moving crowds, the proposed approach concentrates on quasi-stationary interaction networks that reflect informational and emotional contacts among individuals.
The developed discrete network dynamical system integrates individual temperament parameters (sanguine, choleric, phlegmatic, melancholic), the structure of social connections, and nonlinear mechanisms of collective behavior. The individual dynamics of panic are described using an S-shaped growth function, which ensures boundedness of the emotional arousal level and captures the stages of its formation and saturation. Social influence is modeled on a graph of interpersonal interactions (an Erdos –Renyi random network) through local contacts between individuals.
Additionally, the model incorporates the effects of collective contagion and avalanche-like amplification driven by the average panic level in the group, as well as a baseline stress factor depending on group size. Numerical simulation is implemented in a discrete iterative form, allowing for the analysis of both individual and group panic trajectories. A quantitative indicator of the panic propagation rate is introduced, defined by the time required for the group to reach a state close to full panic.
A comparative analysis of heterogeneous and homogeneous groups is conducted, demonstrating that group heterogeneity significantly accelerates panic propagation due to inter-temperament interactions: highly excitable individuals act as initiators of emotional contagion, while more stable individuals partially dampen its dynamics. The evaluation of the model quality using the coefficient of determination shows a high degree of consistency within the simulation data.
The practical significance of the work lies in the potential application of the model for analyzing the resilience of social groups to panic states, assessing risks at mass events, and developing intelligent systems for monitoring collective behavior. Future research directions include extending the model to account for directed and dynamic networks, as well as its calibration based on empirical data.
-
Оценка качества кластеризации панельных данных с использованием методов Монте-Карло (на примере данных российской региональной экономики)
Компьютерные исследования и моделирование, 2020, т. 12, № 6, с. 1501-1513В работе рассматривается метод исследования панельных данных, основанный на использовании агломеративной иерархической кластеризации — группировки объектов на основании сходства и разли- чия их признаков в иерархию вложенных друг в друга кластеров. Применялись 2 альтернативных способа вычисления евклидовых расстояний между объектами — расстояния между усредненными по интервалу наблюдений значениями и расстояния с использованием данных за все рассматриваемые годы. Сравнивались 3 альтернативных метода вычисления расстояний между кластерами. В первом случае таким расстоянием считается расстояние между ближайшими элементами из двух кластеров, во втором — среднее по парам элементов, в третьем — расстояние между наиболее удаленными элементами. Исследована эффективность использования двух индексов качества кластеризации — индекса Данна и Силуэта для выбора оптимального числа кластеров и оценки статистической значимости полученных решений. Способ оценивания статистической достоверности кластерной структуры заключался в сравнении качества кластеризации, на реальной выборке с качеством кластеризаций на искусственно сгенерированных выборках панельных данных с теми же самыми числом объектов, признаков и длиной рядов. Генерация производилась из фиксированного вероятностного распределения. Использовались способы симуляции, имитирующие гауссов белый шум и случайное блуждание. Расчеты с индексом Силуэт показали, что случайное блуждание характеризуется не только ложной регрессией, но и ложной кластеризацией. Кластеризация принималась достоверной для данного числа выделенных кластеров, если значение индекса на реальной выборке оказывалось больше значения 95%-ного квантиля для искусственных данных. В качестве выборки реальных данных использован набор временных рядов показателей, характеризующих производство в российских регионах. Для этих данных только Силуэт показывает достоверную кластеризацию на уровне $p < 0.05$. Расчеты также показали, что значения индексов для реальных данных в целом ближе к значениям для случайных блужданий, чем для белого шума, но имеют значимые отличия и от тех, и от других. Визуально можно выделить скопления близко расположенных друг от друга в трехмерном признаковом пространстве точек, выделяемые также в качестве кластеров применяемым алгоритмом иерархической кластеризации.
Assessing the validity of clustering of panel data by Monte Carlo methods (using as example the data of the Russian regional economy)
Computer Research and Modeling, 2020, v. 12, no. 6, pp. 1501-1513The paper considers a method for studying panel data based on the use of agglomerative hierarchical clustering — grouping objects based on the similarities and differences in their features into a hierarchy of clusters nested into each other. We used 2 alternative methods for calculating Euclidean distances between objects — the distance between the values averaged over observation interval, and the distance using data for all considered years. Three alternative methods for calculating the distances between clusters were compared. In the first case, the distance between the nearest elements from two clusters is considered to be distance between these clusters, in the second — the average over pairs of elements, in the third — the distance between the most distant elements. The efficiency of using two clustering quality indices, the Dunn and Silhouette index, was studied to select the optimal number of clusters and evaluate the statistical significance of the obtained solutions. The method of assessing statistical reliability of cluster structure consisted in comparing the quality of clustering on a real sample with the quality of clustering on artificially generated samples of panel data with the same number of objects, features and lengths of time series. Generation was made from a fixed probability distribution. At the same time, simulation methods imitating Gaussian white noise and random walk were used. Calculations with the Silhouette index showed that a random walk is characterized not only by spurious regression, but also by “spurious clustering”. Clustering was considered reliable for a given number of selected clusters if the index value on the real sample turned out to be greater than the value of the 95% quantile for artificial data. A set of time series of indicators characterizing production in the regions of the Russian Federation was used as a sample of real data. For these data only Silhouette shows reliable clustering at the level p < 0.05. Calculations also showed that index values for real data are generally closer to values for random walks than for white noise, but it have significant differences from both. Since three-dimensional feature space is used, the quality of clustering was also evaluated visually. Visually, one can distinguish clusters of points located close to each other, also distinguished as clusters by the applied hierarchical clustering algorithm.
-
Субградиентные методы для задач негладкой оптимизации с некоторой релаксацией условия острого минимума
Компьютерные исследования и моделирование, 2022, т. 14, № 2, с. 473-495Задачи негладкой оптимизации нередко возникают во многих приложениях. Вопросы разработки эффективных вычислительных процедур для негладких задач в пространствах больших размерностей весьма актуальны. В таких случаях разумно применятьмет оды первого порядка (субградиентные методы), однако в достаточно общих ситуациях они приводят к невысоким скоростным гарантиям. Одним из подходов к этой проблеме может являться выделение подкласса негладких задач, допускающих относительно оптимистичные результаты о скорости сходимости в пространствах больших размерностей. К примеру, одним из вариантов дополнительных предположений может послужитьуслови е острого минимума, предложенное в конце 1960-х годов Б. Т. Поляком. В случае доступности информации о минимальном значении функции для липшицевых задач с острым минимумом известен субградиентный метод с шагом Б. Т. Поляка, который гарантирует линейную скорость сходимости по аргументу. Такой подход позволил покрыть ряд важных прикладных задач (например, задача проектирования точки на выпуклый компакт или задача отыскания общей точки системы выпуклых множеств). Однако как условие доступности минимального значения функции, так и само условие острого минимума выглядят довольно ограничительными. В этой связи в настоящей работе предлагается обобщенное условие острого минимума, аналогичное известному понятию неточного оракула. Предложенный подход позволяет расширить класс применимости субградиентных методов с шагом Б. Т. Поляка на ситуации неточной информации о значении минимума, а также неизвестной константы Липшица целевой функции. Более того, использование в теоретической оценке качества выдаваемого методом решения локальных аналогов глобальных характеристик целевой функции позволяет применять результаты такого типа и к более широким классам задач. Показана возможностьпр именения предложенного подхода к сильно выпуклым негладким задачам и выполнено экспериментальное сравнение с известным оптимальным субградиентным методом на таком классе задач. Более того, получены результаты о применимости предложенной методики для некоторых типов задач с релаксациями выпуклости: недавно предложенное понятие слабой $\beta$-квазивыпуклости и обычной квазивыпуклости. Исследовано обобщение описанной методики на ситуацию с предположением о доступности на итерациях $\delta$-субградиента целевой функции вместо обычного субградиента. Для одного из рассмотренных методов найдены условия, при которых на практике можно отказаться от проектирования итеративной последовательности на допустимое множество поставленной задачи.
Ключевые слова: субградиентный метод, острый минимум, квазивыпуклая функция, слабо $\beta$-квазивыпуклая функция, липшицева функция, $\delta$-субградиент.
Subgradient methods for non-smooth optimization problems with some relaxation of sharp minimum
Computer Research and Modeling, 2022, v. 14, no. 2, pp. 473-495Non-smooth optimization often arises in many applied problems. The issues of developing efficient computational procedures for such problems in high-dimensional spaces are very topical. First-order methods (subgradient methods) are well applicable here, but in fairly general situations they lead to low speed guarantees for large-scale problems. One of the approaches to this type of problem can be to identify a subclass of non-smooth problems that allow relatively optimistic results on the rate of convergence. For example, one of the options for additional assumptions can be the condition of a sharp minimum, proposed in the late 1960s by B. T. Polyak. In the case of the availability of information about the minimal value of the function for Lipschitz-continuous problems with a sharp minimum, it turned out to be possible to propose a subgradient method with a Polyak step-size, which guarantees a linear rate of convergence in the argument. This approach made it possible to cover a number of important applied problems (for example, the problem of projecting onto a convex compact set). However, both the condition of the availability of the minimal value of the function and the condition of a sharp minimum itself look rather restrictive. In this regard, in this paper, we propose a generalized condition for a sharp minimum, somewhat similar to the inexact oracle proposed recently by Devolder – Glineur – Nesterov. The proposed approach makes it possible to extend the class of applicability of subgradient methods with the Polyak step-size, to the situation of inexact information about the value of the minimum, as well as the unknown Lipschitz constant of the objective function. Moreover, the use of local analogs of the global characteristics of the objective function makes it possible to apply the results of this type to wider classes of problems. We show the possibility of applying the proposed approach to strongly convex nonsmooth problems, also, we make an experimental comparison with the known optimal subgradient method for such a class of problems. Moreover, there were obtained some results connected to the applicability of the proposed technique to some types of problems with convexity relaxations: the recently proposed notion of weak $\beta$-quasi-convexity and ordinary quasiconvexity. Also in the paper, we study a generalization of the described technique to the situation with the assumption that the $\delta$-subgradient of the objective function is available instead of the usual subgradient. For one of the considered methods, conditions are found under which, in practice, it is possible to escape the projection of the considered iterative sequence onto the feasible set of the problem.
-
Предсказание производительности избранных типов циклов над одномерными массивами посредством анализа эмбеддингов промежуточных представлений
Компьютерные исследования и моделирование, 2023, т. 15, № 1, с. 211-224Предложен метод отображения промежуточных представлений C-, C++-программ в пространство векторов (эмбеддингов) для оценки производительности программ на этапе компиляции, без необходимости исполнения. Использование эмбеддингов для данной цели позволяет не проводить сравнение графов исследуемых программ непосредственно, что вычислительно упрощает задачу сравнения программ. Метод основан на серии трансформаций исходного промежуточного представления (IR), таких как: инструментирование — добавление фиктивных инструкций в оптимизационном проходе компилятора в зависимости от разности смещений в текущей инструкции обращения к памяти относительно предыдущей, преобразование IR в многомерный вектор с помощью технологии IR2Vec с понижением размерности по алгоритму t-SNE (стохастическое вложение соседей с t-распределением). В качестве метрики производительности предлагается доля кэш-промахов 1-го уровня (D1 cache misses). Приводится эвристический критерий отличия программ с большей долей кэш-промахов от программ с меньшей долей по их образам. Также описан разработанный в ходе работы проход компилятора, генерирующий и добавляющий фиктивные инструкции IR согласно используемой модели памяти. Приведено описание разработанного программного комплекса, реализующего предложенный способ оценивания на базе компиляторной инфраструктуры LLVM. Проведен ряд вычислительных экспериментов на синтетических тестах из наборов программ с идентичными потоками управления, но различным порядком обращений к одномерному массиву, показано, что коэффициент корреляции между метрикой производительности и расстоянием до эмбеддинга худшей программы в наборе отрицателен вне зависимости от инициализации t-SNE, что позволяет сделать заключение о достоверности эвристического критерия. Также в статье рассмотрен способ генерации тестов. По результатам экспериментов, вариативность значений метрики производительности на исследуемых множествах предложена как метрика для улучшения генератора тестов.
Ключевые слова: математическое моделирование, компиляторы, промежуточные представления программ, эмбеддинги, анализ производительности, статический анализ.
Performance prediction for chosen types of loops over one-dimensional arrays with embedding-driven intermediate representations analysis
Computer Research and Modeling, 2023, v. 15, no. 1, pp. 211-224The method for mapping of intermediate representations (IR) set of C, C++ programs to vector embedding space is considered to create an empirical estimation framework for static performance prediction using LLVM compiler infrastructure. The usage of embeddings makes programs easier to compare due to avoiding Control Flow Graphs (CFG) and Data Flow Graphs (DFG) direct comparison. This method is based on transformation series of the initial IR such as: instrumentation — injection of artificial instructions in an instrumentation compiler’s pass depending on load offset delta in the current instruction compared to the previous one, mapping of instrumented IR into multidimensional vector with IR2Vec and dimension reduction with t-SNE (t-distributed stochastic neighbor embedding) method. The D1 cache miss ratio measured with perf stat tool is considered as performance metric. A heuristic criterion of programs having more or less cache miss ratio is given. This criterion is based on embeddings of programs in 2D-space. The instrumentation compiler’s pass developed in this work is described: how it generates and injects artificial instructions into IR within the used memory model. The software pipeline that implements the performance estimation based on LLVM compiler infrastructure is given. Computational experiments are performed on synthetic tests which are the sets of programs with the same CFGs but with different sequences of offsets used when accessing the one-dimensional array of a given size. The correlation coefficient between performance metric and distance to the worst program’s embedding is measured and proved to be negative regardless of t-SNE initialization. This fact proves the heuristic criterion to be true. The process of such synthetic tests generation is also considered. Moreover, the variety of performance metric in programs set in such a test is proposed as a metric to be improved with exploration of more tests generators.
-
Молекулярно-динамическое исследование влияния мутаций в молекуле тропомиозина на свойства тонких нитей сердечной мышцы
Компьютерные исследования и моделирование, 2024, т. 16, № 2, с. 513-524Сокращением поперечно-полосатых мышц управляют регуляторные белки — тропонин и тропомиозин, ассоциированные с тонкими актиновыми нитями в саркомерах. В зависимости от концентрации Ca2+ тонкая нить перестраивается, и тропомиозин смещается по ее поверхности, открывая или закрывая доступ к актину для моторных доменов миозиновых молекул и вызывая сокращение или расслабление соответственно. Известны многочисленные точечные аминокислотные замены в тропомиозине, приводящие к генетическим патологиям — мио- и кардиомиопатиям, что обусловлено изменениями структурных и функциональных свойств тонкой нити. Представлены результаты молекулярно-динамического моделирования фрагмента тонкой нити саркомеров сердечной мышцы, образованной фибриллярным актином и тропомиозином дикого типа или тропомиозином с аминокислотными заменами: двойной стабилизирующей D137L/G126R либо кардиомиопатической S215L. Для расчетов использовали новую модель фрагмента тонкой нити, содержащую 26 мономеров актина и 4 димера тропомиозина, с уточненной структурой области перекрытия соседних молекул тропомиозина в каждом из двух тропомиозиновых тяжей. Результаты моделирования показали, что добавление тропомиозина к нити актина существенно увеличивает ее изгибную жесткость, как было ранее найдено экспериментально. Двойная стабилизирующая замена D137L/G126R приводит к дальнейшему увеличению изгибной жесткости нити, а замена S215L, наоборот, — к ее снижению, что также соответствует экспериментальным данным. В то же время эти замены по-разному влияют на угловую подвижность актиновой спирали и лишь не значительно модулируют угловую подвижность тропомиозиновых тяжей по отношению к спирали актина и населенность в одородных связей между отрицательно заряженными остатками тропомиозина и положительно заряженными остатками актина. Результаты верификации модели показали, что ее качество достаточно для того, чтобы проводить численное исследование влияния одиночных аминокислотных замен на структуру и динамику тонких нитей и изучать эффекты, приводящие к нарушениям регуляции мышечного сокращения. Эта модель может быть использована как полезный инструмент выяснения молекулярных механизмов некоторых известных генетических заболеваний и оценки патогенности недавно обнаруженных генетических вариантов.
Ключевые слова: сердечная мышца, актин, тропомиозин, молекулярная динамика, мутации, кардиомиопатия.
Molecular dynamics study of the effect of mutations in the tropomyosin molecule on the properties of thin filaments of the heart muscle
Computer Research and Modeling, 2024, v. 16, no. 2, pp. 513-524Muscle contraction is controlled by Ca2+ ions via regulatory proteins, troponin and tropomyosin, associated with thin actin filaments in sarcomeres. Depending on the Ca2+ concentration, the thin filament rearranges so that tropomyosin moves along its surface, opening or closing access to actin for the motor domains of myosin molecules, and causing contraction or relaxation, respectively. Numerous point amino acid substitutions in tropomyosin are known, leading to genetic pathologies — myo- and cardiomyopathies caused by changes in the structural and functional properties of the thin filament. The results of molecular dynamics modeling of a fragment of a thin filament of cardiac muscle sarcomeres formed by fibrillar actin and wildtype tropomyosin or with amino acid substitutions: the double stabilizing substitution D137L/G126R and the cardiomyopathic substitution S215L are presented. For numerical calculations, we used a new model of a thin filament fragment containing 26 actin monomers and 4 tropomyosin dimers, with a refined structure of the region of overlap of neighboring tropomyosin molecules in each of the two tropomyosin strands. The simulation results showed that tropomyosin significantly increases the bending stiffness of the thin filament, as previously found experimentally. The double stabilizing replacement D137L/G126R leads to a further increase in this rigidity, and the replacement S215L, on the contrary, leads to its decrease, which also corresponds to experimental data. At the same time, these substitutions have different effects on the angular mobility of the actin helix and only slightly modulate the angular mobility of tropomyosin cables relative to the actin helix and the population of hydrogen bonds between negatively charged tropomyosin residues and positively charged actin residues. The results of the verification of the new model demonstrate that its quality is sufficient for the numerical study of the effect of single amino acid substitutions on the structure and dynamics of thin filaments and study the effects leading to dysregulation of muscle contraction. This model can be used as a useful tool for elucidating the molecular mechanisms of some genetic diseases and assessing the pathogenicity of newly discovered genetic variants.
-
Автоматизированное выявление противоречивости в контенте социальных медиа: подход на основе предварительно обученных моделей
Компьютерные исследования и моделирование, 2026, т. 18, № 2, с. 501-517Обнаружение противоречивости в онлайн-дискурсе имеет важное значение для управления связями с общественностью, что позволяет информировать различные процессы от законотворчества до предпринимательства. В данной работе предлагается подход к обнаружению противоречивости в онлайн-контенте на основе анализа выражаемых эмоций. Противоречивость онлайн-контента определяется как феномен провоцирования разногласий и конфликтов в обсуждениях. Данная работа развивает предыдущие семантические методы, анализируя численные оценки именно эмоционального окраса сообщений. В качестве инструментов обнаружения противоречивости рассматриваются современные языковые модели для распознавания эмоций и распознавания именованных сущностей. Результаты работы этих моделей были агрегированы по сущностям для оценки их эмоциональной коннотации. Был предложен показатель эмоциональной дивергенции, основанный на дисперсии эмоций, для количественной оценки противоречивости контента. Затем сущности с достаточно высокой эмоциональной дивергенцией по отношению к специфике коммуникаций в рамках сообщества были отобраны в качестве маркеров противоречивости. Проведены эксперименты на данных Reddit, связанных с политическим кризисом в Шри-Ланке 2022 года, которые подтверждают возможность показателя эмоциональной дивергенции обнаруживать противоречивость. Всего было собрано два набора данных с использованием различных методологий: одна была направлена на извлечение более ранних сообщений, а другая была предназначена для сбора более свежих записей. Собранные данные включали обсуждения политики, общественных деятелей, организаций и локаций, связанных с обозначенным кризисом. При измерении на данных с ручной разметкой, предложенный метод достиг значения полноты 0,705 и точности около 0,496 для первого набора данных, в то время как для второго набора были зафиксированы значения полноты 0,716 и точности 0,436. Основными факторами, ограничивающими точность, стали качество низлежащих моделей и ложные срабатывания: широко обсуждаемые, но непротиворечивые маркеры. Наконец, было установлено, что изучение типичного распределения эмоций в контенте социальных медиа может быть полезным для повышения качества обнаружения противоречивости.
Ключевые слова: обнаружение противоречивости, социальные медиа, обработка естественного языка, анализ тональности, распознавание именованных сущностей.
Semi-automated detection of controversy in social media content: an approach based on pre-trained models
Computer Research and Modeling, 2026, v. 18, no. 2, pp. 501-517Detecting controversy in online discussions is critical for managing public relations, as it helps inform various processes from policymaking to business. This work aims to expand approaches to online controversy detection based on the expressed emotions. Controversy was defined as an online content phenomenon of provoking disagreements and conflict. This study builds upon prior semantic methods by analyzing estimates of emotional connotations of messages. Modern language models for emotion recognition and named entity recognition are explored as tools of controversy detection. The outputs of these models were aggregated by entity to estimate the entity’s emotional connotation. The emotional divergence score based on the dispersion of emotions was proposed to quantify controversy in user content. Then, entities with sufficiently high emotional divergence relative to the domain of discussions were selected as markers of controversy. A case study of Reddit data related to Sri-Lankan 2022 political crisis was conducted, showing the capabilities of emotional divergence score in controversy detection. A total of two datasets were collected with different methodologies: one aimed at collecting earlier messages and another aimed at collecting more recent ones. The collected data contained discussions of policy, public figures, organizations and locations tied to the crisis. When measured on manually annotated data samples, the proposed method achieved a recall value of 0.705 and a precision value close to 0.496 for the first dataset, while recall of 0.716 and precision of 0.436 were recorded for the second dataset. The main factors that limit the precision were found to be the quality of underlying models and false positives: highly discussed non-controversial markers. Lastly, it was identified that a study of regular emotional distribution of social media content may be helpful for improving controversy detection quality.
Indexed in Scopus
Full-text version of the journal is also available on the web site of the scientific electronic library eLIBRARY.RU
The journal is included in the Russian Science Citation Index
The journal is included in the RSCI
International Interdisciplinary Conference "Mathematics. Computing. Education"




