All issues
- 2026 Vol. 18
- 2025 Vol. 17
- 2024 Vol. 16
- 2023 Vol. 15
- 2022 Vol. 14
- 2021 Vol. 13
- 2020 Vol. 12
- 2019 Vol. 11
- 2018 Vol. 10
- 2017 Vol. 9
- 2016 Vol. 8
- 2015 Vol. 7
- 2014 Vol. 6
- 2013 Vol. 5
- 2012 Vol. 4
- 2011 Vol. 3
- 2010 Vol. 2
- 2009 Vol. 1
-
Разработка и исследование алгоритмов машинного обучения для решения задачи классификации в публикациях Twitter
Компьютерные исследования и моделирование, 2023, т. 15, № 1, с. 185-195Посты в социальных сетях способны как предсказывать движение финансового рынка, так и в некоторых случаях даже определять его направление. Анализ постов в Twitter способствует прогнозированию цен на криптовалюту. Специфика рассматриваемого сообщества заключается в особенной лексике. Так, в постах используются сленговые выражения, аббревиатуры и сокращения, наличие которых затрудняет векторизацию текстовых данных, в следствие чего рассматриваются методы предобработки такие, как лемматизация Stanza и применение регулярных выражений. В этой статье описываются простейшие модели машинного обучения, которые могут работать, несмотря на такие проблемы, как нехватка данных и короткие сроки прогнозирования. Решается задача бинарной текстовой классификации, в условиях которой слово рассматривается как элемент бинарного вектора единицы данных. Базисные слова определяются на основе частотного анализа упоминаний того или иного слова. Разметка составляется на основе свечей Binance с варьируемыми параметрами для более точного описания тренда изменения цены. В работе вводятся метрики, отражающие распределение слов в зависимости от их принадлежности к положительному или отрицательному классам. Для решения задачи классификации использовались dense-модель с подобранными при помощи Keras Tuner параметрами, логистическая регрессия, классификатор случайного леса, наивный байесовский классификатор, способный работать с малочисленной выборкой, что весьма актуально для нашей задачи, и метод k-ближайших соседей. Было проведено сравнение построенных моделей на основе метрики точности предсказанных меток. В ходе исследования было выяснено, что наилучшим подходом является использование моделей, которые предсказывают ценовые движения одной монеты. Наши модели имеют дело с постами, содержащими упоминания проекта LUNA, которого на данный момент уже не существует. Данный подход к решению бинарной классификации текстовых данных широко применяется для предсказания цены актива, тренда ее движения, что часто используется в автоматизированной торговле.
Ключевые слова: криптовалюты, Twitter, машинное обучение, обработка естественного языка, векторизация, dense модель, логистическая регрессия, случайный лес, KNN, наивный байесовский классификатор.
Development of and research on machine learning algorithms for solving the classification problem in Twitter publications
Computer Research and Modeling, 2023, v. 15, no. 1, pp. 185-195Posts on social networks can both predict the movement of the financial market, and in some cases even determine its direction. The analysis of posts on Twitter contributes to the prediction of cryptocurrency prices. The specificity of the community is represented in a special vocabulary. Thus, slang expressions and abbreviations are used in posts, the presence of which makes it difficult to vectorize text data, as a result of which preprocessing methods such as Stanza lemmatization and the use of regular expressions are considered. This paper describes created simplest machine learning models, which may work despite such problems as lack of data and short prediction timeframe. A word is considered as an element of a binary vector of a data unit in the course of the problem of binary classification solving. Basic words are determined according to the frequency analysis of mentions of a word. The markup is based on Binance candlesticks with variable parameters for a more accurate description of the trend of price changes. The paper introduces metrics that reflect the distribution of words depending on their belonging to a positive or negative classes. To solve the classification problem, we used a dense model with parameters selected by Keras Tuner, logistic regression, a random forest classifier, a naive Bayesian classifier capable of working with a small sample, which is very important for our task, and the k-nearest neighbors method. The constructed models were compared based on the accuracy metric of the predicted labels. During the investigation we recognized that the best approach is to use models which predict price movements of a single coin. Our model deals with posts that mention LUNA project, which no longer exist. This approach to solving binary classification of text data is widely used to predict the price of an asset, the trend of its movement, which is often used in automated trading.
-
Динамика активности в виртуальных сетях: сравнение модели распространения эпидемии и модели возбудимой среды
Компьютерные исследования и моделирование, 2020, т. 12, № 6, с. 1485-1499Модели распространения эпидемий широко применяются для моделирования социальной активности, например распространения слухов или паники. С другой стороны, для моделирования распространения активности традиционно используются модели возбудимых сред. Проведено моделирование распространения активности в виртуальном сообществе в рамках двух моделей: модели распространения эпидемий SIRS и модели возбудимой среды Винера – Розенблюта. Использованы сетевые версии этих моделей. Сеть предполагалась неоднородной: каждый элемент сети обладает индивидуальным набором характеристик, что соответствует различным психологическим типам членов сообщества. Структура виртуальной сети полагается соответствующей безмасштабной сети. Моделирование проводилось на безмасштабных сетях с различными значениями средней степени вершин. Дополнительно рассмотрен частный случай — полный граф, соответствующий узкой профессиональной группе, когда каждый член группы взаимодействует с каждым. Участники виртуального сообщества могут находиться в одном из трех состояний: 1) потенциальная готовность к восприятию определенной информации; 2) активный интерес к этой информации; 3) полное безразличие к этой информации. Эти состояния вполне соответствуют состояниям, которые обычно используют в моделях распространения эпидемий: 1) восприимчивый к ин- фекции субъект, 2) больной, 3) переболевший и более невосприимчивый к инфекции в силу приобретенного иммунитета или смерти от болезни. Сопоставление двух моделей показало их близость как на уровне формулировки основных положений, так и на уровне возможных режимов. Распространение активности по сети аналогично распространению инфекционных заболеваний. Показано, что активность в виртуальной сети может испытывать колебания или затухать.
Ключевые слова: модель Винера – Розенблюта, модель SIRS, клеточный автомат, безмасштабная сеть, возбудимая среда, моделирование распространения эпидемий, дифференциально-разностные уравнения.
Activity dynamics in virtual networks: an epidemic model vs an excitable medium model
Computer Research and Modeling, 2020, v. 12, no. 6, pp. 1485-1499Epidemic models are widely used to mimic social activity, such as spreading of rumors or panic. Simultaneously, models of excitable media are traditionally used to simulate the propagation of activity. Spreading of activity in the virtual community was simulated within two models: the SIRS epidemic model and the Wiener – Rosenblut model of the excitable media. We used network versions of these models. The network was assumed to be heterogeneous, namely, each element of the network has an individual set of characteristics, which corresponds to different psychological types of community members. The structure of a virtual network relies on an appropriate scale-free network. Modeling was carried out on scale-free networks with various values of the average degree of vertices. Additionally, a special case was considered, namely, a complete graph corresponding to a close professional group, when each member of the group interacts with each. Participants in a virtual community can be in one of three states: 1) potential readiness to accept certain information; 2) active interest to this information; 3) complete indifference to this information. These states correspond to the conditions that are usually used in epidemic models: 1) susceptible to infection, 2) infected, 3) refractory (immune or death due to disease). A comparison of the two models showed their similarity both at the level of main assumptions and at the level of possible modes. Distribution of activity over the network is similar to the spread of infectious diseases. It is shown that activity in virtual networks may experience fluctuations or decay.
-
Дискретная сетевая динамическая система для моделирования распространения паники в группах людей
Компьютерные исследования и моделирование, 2026, т. 18, № 2, с. 483-499В работе рассматривается задача моделирования формирования и распространения панических состояний в социальных группах людей с относительно устойчивой структурой межличностных взаимодействий. Паника интерпретируется как нелинейный процесс эмоционального заражения, возникающий в результате взаимодействия индивидуальных психологических характеристик и коллективных эффектов в социальной среде. В отличие от моделей, ориентированных на пространственную динамику движущихся толп, предложенный подход фокусируется на квазистационарных сетях взаимодействий, отражающих информационные и эмоциональные контакты между участниками. Разработанная дискретная сетевая динамическая система интегрирует индивидуальные параметры типов темпераментов человека (сангвинического, холерического, флегматического и меланхолического), структуру социальных связей и нелинейные механизмы коллективного поведения. Индивидуальная динамика паники описывается S-образной функцией роста, обеспечивающей ограниченность уровня эмоционального возбуждения и отражающей стадии его формирования и насыщения. Социальное влияние моделируется на графе межличностных взаимодействий (случайная сеть Эрдёша – Реньи) через локальные контакты между участниками. Дополнительно учитываются эффекты коллективного заражения и лавинообразного усиления, обусловленные средним уровнем паники в группе, а также базовый стрессовый фактор, зависящий от численности группы. Численное моделирование реализовано в дискретной итерационной форме с возможностью анализа индивидуальных и групповых траекторий паники. Введен количественный показатель скорости распространения паники, определяемый временем достижения состоянием группы уровня, близкого к полной панике. Проведен сравнительный анализ гетерогенной и однородных групп, показавший, что гетерогенность состава существенно ускоряет распространение паники за счет межтемпераментного взаимодействия: высоковозбудимые индивиды выступают инициаторами эмоционального заражения, тогда как более устойчивые участники частично сглаживают его динамику. Оценка качества модели с использованием коэффициента детерминации показала высокую степень согласованности результатов в рамках модельных данных. Практическая значимость работы заключается в возможности применения модели для анализа устойчивости социальных групп к паническим состояниям, оценки рисков на массовых мероприятиях и разработки интеллектуальных систем мониторинга коллективного поведения. Перспективы дальнейших исследований связаны с расширением модели с учетом направленных и динамических сетей, а также с ее калибровкой на основе эмпирических данных.
Ключевые слова: паническое состояние, эмоциональное заражение, сетевое моделирование, нелинейная динамика, социальные взаимодействия, численное моделирование.
Discrete network dynamic system for modeling the spread of panic in groups of people
Computer Research and Modeling, 2026, v. 18, no. 2, pp. 483-499The paper addresses the problem of modeling the formation and propagation of panic states in social groups with relatively stable structures of interpersonal interactions. Panic is interpreted as a nonlinear process of emotional contagion arising from the interaction between individual psychological characteristics and collective effects within a social environment. In contrast to models focused on the spatial dynamics of moving crowds, the proposed approach concentrates on quasi-stationary interaction networks that reflect informational and emotional contacts among individuals.
The developed discrete network dynamical system integrates individual temperament parameters (sanguine, choleric, phlegmatic, melancholic), the structure of social connections, and nonlinear mechanisms of collective behavior. The individual dynamics of panic are described using an S-shaped growth function, which ensures boundedness of the emotional arousal level and captures the stages of its formation and saturation. Social influence is modeled on a graph of interpersonal interactions (an Erdos –Renyi random network) through local contacts between individuals.
Additionally, the model incorporates the effects of collective contagion and avalanche-like amplification driven by the average panic level in the group, as well as a baseline stress factor depending on group size. Numerical simulation is implemented in a discrete iterative form, allowing for the analysis of both individual and group panic trajectories. A quantitative indicator of the panic propagation rate is introduced, defined by the time required for the group to reach a state close to full panic.
A comparative analysis of heterogeneous and homogeneous groups is conducted, demonstrating that group heterogeneity significantly accelerates panic propagation due to inter-temperament interactions: highly excitable individuals act as initiators of emotional contagion, while more stable individuals partially dampen its dynamics. The evaluation of the model quality using the coefficient of determination shows a high degree of consistency within the simulation data.
The practical significance of the work lies in the potential application of the model for analyzing the resilience of social groups to panic states, assessing risks at mass events, and developing intelligent systems for monitoring collective behavior. Future research directions include extending the model to account for directed and dynamic networks, as well as its calibration based on empirical data.
-
В статье дан обзор основных результатов изучения как реальных социальных сетей (сетей сотрудничества ученых и актеров, сетей цитирования научных публикаций, сетей друзей и знакомых и т. д.), так и современных онлайновых социальных сетей (Twitter, Facebook и т. д.) с точки зрения теории сложных сетей. На основе собственных исследований авторами выявлены особенности восприятия некоторых сложных сетей.
Views (last year): 6. Citations: 6 (RSCI).The paper reviews the main results of the study of real social networks (networks of collaboration between scientists and actors, networks of citation of scientific publications, networks of friends and acquaintances, etc.) and modern online social networks (Twitter, Facebook etc.) from the complex networks theory standpoint. Based on original research by the authors, it reveals peculiarities of perception of certain complex networks.
-
Многокритериальный метрический анализ данных при моделировании человеческого капитала
Компьютерные исследования и моделирование, 2020, т. 12, № 5, с. 1223-1245В статье описываетсявы числимаям одель человека в информационной экономике и демонстрируется многокритериальный оптимизационный подход к метрическому анализу модельных данных. Традиционный подход к идентификации и исследованию модели предполагает идентификацию модели по временным рядам и прогнозирование дальнейшей динамики ряда. Однако этот подход неприменим к моделям, некоторые важнейшие переменные которых не наблюдаютсяя вно, и известны только некоторые типичные границы или особенности генеральной совокупности. Такая ситуация часто встречается в социальных науках, что делает модели сугубо теоретическими. Чтобы избежать этого, для (неявной) идентификации и изучения таких моделей предлагается использовать метод метрического анализа данных (MMDA), основанный на построении и анализе метрических сетей Колмогорова – Шеннона, аппроксимирующих генеральную совокупность данных модельной генерации в многомерном пространстве социальных характеристик. С помощью этого метода идентифицированы коэффициенты модели и изучены особенности ее фазовых траекторий. Представленнаяв статье модель рассматривает человека как субъекта, обрабатывающего информацию, включая его информированность и когнитивные способности. Составлены пожизненные индексы человеческого капитала: креативного индивида (обобщающего когнитивные способности) и продуктивного (обобщает объем освоенной человеком информации). Поставлена задача их многокритериальной (двухкритериальной) оптимизации с учетом ожидаемой продолжительности жизни. Такой подход позволяет выявить и экономически обосновать требования к системе образования и социализации (информационному окружению) человека до достиженияим взрослого возраста. Показано, что в поставленной оптимизационной задаче возникает Парето-граница, причем ее тип зависит от уровня смертности: при высокой продолжительности жизни доминирует одно решение, в то время как для более низкой продолжительности жизни существуют различные типы Парето-границы. В частности, в случае России применим принцип Парето: значительное увеличение креативного человеческого капитала индивида возможно за счет небольшого сниженияпр одуктивного человеческого капитала (обобщение объема освоенной человеком информации). Показано, что рост продолжительности жизни делает оптимальным компетентностный подход, ориентированный на развитие когнитивных способностей, в то время как при низкой продолжительности жизни предпочтительнее знаниевый подход.
Ключевые слова: многокритериальнаяоп тимизация, метрические сети, визуализация данных, человеческое развитие, идентификациям одели, метод достижимых целей, интерактивные карты решений, человеческий капитал, метрический анализ данных.
Multicriterial metric data analysis in human capital modelling
Computer Research and Modeling, 2020, v. 12, no. 5, pp. 1223-1245The article describes a model of a human in the informational economy and demonstrates the multicriteria optimizational approach to the metric analysis of model-generated data. The traditional approach using the identification and study involves the model’s identification by time series and its further prediction. However, this is not possible when some variables are not explicitly observed and only some typical borders or population features are known, which is often the case in the social sciences, making some models pure theoretical. To avoid this problem, we propose a method of metric data analysis (MMDA) for identification and study of such models, based on the construction and analysis of the Kolmogorov – Shannon metric nets of the general population in a multidimensional space of social characteristics. Using this method, the coefficients of the model are identified and the features of its phase trajectories are studied. In this paper, we are describing human according to his role in information processing, considering his awareness and cognitive abilities. We construct two lifetime indices of human capital: creative individual (generalizing cognitive abilities) and productive (generalizing the amount of information mastered by a person) and formulate the problem of their multi-criteria (two-criteria) optimization taking into account life expectancy. This approach allows us to identify and economically justify the new requirements for the education system and the information environment of human existence. It is shown that the Pareto-frontier exists in the optimization problem, and its type depends on the mortality rates: at high life expectancy there is one dominant solution, while for lower life expectancy there are different types of Paretofrontier. In particular, the Pareto-principle applies to Russia: a significant increase in the creative human capital of an individual (summarizing his cognitive abilities) is possible due to a small decrease in the creative human capital (summarizing awareness). It is shown that the increase in life expectancy makes competence approach (focused on the development of cognitive abilities) being optimal, while for low life expectancy the knowledge approach is preferable.
Indexed in Scopus
Full-text version of the journal is also available on the web site of the scientific electronic library eLIBRARY.RU
The journal is included in the Russian Science Citation Index
The journal is included in the RSCI
International Interdisciplinary Conference "Mathematics. Computing. Education"




