Результаты поиска по 'Большие Данные':
Найдено статей: 203
  1. Жаркова В.В., Щеляев А.Е., Дядькин А.А., Павлов А.О., Симакова Т.В.
    Расчет гидродинамических воздействий на возвращаемый аппарат при посадке на воду
    Компьютерные исследования и моделирование, 2017, т. 9, № 1, с. 37-46

    В работе представлены результаты моделирования расчетных случаев приводнения возвращаемого аппарата (ВА) пилотируемого транспортного корабля нового поколения в условиях штиля. Рассмотрены случаи посадки ВА с работающими и с выключенными двигательными установками.

    Задача приводнения ВА моделировалась в рамках двухфазной постановки с наличием двух несмешивающихся фаз: воды и газа, состоящего из воздуха и продуктов сгорания, поступающих из двигательной установки. Параметры течения в каждой фазе резко отличаются друг от друга по величине плотности и скорости распространения звука. Истечение продуктов сгорания из сопловых установок характеризуется высокими скоростями и давлениями, что усложняет задачу, по сравнению со свободным падением ВА в воду. В расчетах используется упрощение постановки задачи, в котором при взаимодействии горячих струй с водой кипение, испарение и образование водяного пара не учитываются. Газовые струи только нагревают и вытесняют воду.

    Для моделирования переноса межфазных границ применяется метод VOF (Volume of fluid), где перенос контактной поверхности описывается конвективным уравнением, а поверхностное натяжение на межфазной границе учитывается давлением Лапласа. Ключевой особенностью метода является расщепление поверхностных ячеек, куда заносятся данные соответствующей фазы. Уравнения для обеих фаз (уравнения неразрывности, импульса, энергии и другие) в поверхностных ячейках решаются совместно.

    Моделирование приводнения ВА занимает длительное время, что связанно с особенностями явного расчета уровня границы раздела фаз (свободной поверхности). Для получения качественных результатов свободная поверхность должна быть разрешена большим количеством расчетных ячеек, но при этом за один шаг интегрирования перемещаться не более чем на одну ячейку.

    В процессе приземления исследовались гидродинамическое воздействие на ВА, динамика его движения и остойчивость ВА после приводнения, оценивались продольные перегрузки. Полученные данные использовались для анализа нагружения и прочности конструкции корпуса ВА, а также его отдельных элементов.

    Zharkova V.V., Schelyaev A.E., Dyadkin A.A., Pavlov A.O., Simakova T.V.
    The calculation of hydrodynamic impact on reentry vehicle during splashdown
    Computer Research and Modeling, 2017, v. 9, no. 1, pp. 37-46

    The reentry vehicle of the transportation spacecraft that is being created by RSC Energia in regular mode makes soft landing on land surface using a parachute system and thruster devices. But in not standard situations the reentry vehicle also is capable of executing a splashdown. In that case, it becomes important to define the hydrodynamics impact on the reentry vehicle at the moment of the first contact with the surface of water and during submersion into water medium, and to study the dynamics of the vehicle behavior at more recent moments of time.

    This article presents results of numerical studies of hydrodynamics forces on the conical vehicle during splashdown, done with the FlowVision software. The paper reviews the cases of the splashdown with inactive solid rocket motors on calm sea and the cases with interactions between rocket jets and the water surface. It presents data on the allocation of pressure on the vehicle in the process of the vehicle immersion into water medium and dynamics of the vehicle behavior after splashdown. The paper also shows flow structures in the area of the reentry vehicle at the different moments of time, and integral forces and moments acting on the vehicle.

    For simulation process with moving interphases in the FlowVision software realized the model VOF (volume of fluid). Transfer of the phase boundary is described by the equation of volume fraction of this continuous phase in a computational cell. Transfer contact surface is described by the convection equation, and at the surface tension is taken into account by the Laplace pressure. Key features of the method is the splitting surface cells where data is entered the corresponding phase. Equations for both phases (like the equations of continuity, momentum, energy and others) in the surface cells are accounted jointly.

    Views (last year): 30.
  2. Крат Ю.Г., Потапов И.И.
    Движение влекомых наносов над периодическим дном
    Компьютерные исследования и моделирование, 2018, т. 10, № 1, с. 47-60

    Движение влекомых наносов по дну напорного канала может приводить к потере устойчивости донной поверхности, когда на дне канала возникают донные волны. Исследование процесса развития донных волн связано с возможностью определения характера движения влекомых наносов по дну периодической формы. Несмотря на большое внимание многих исследователей к данной проблеме, вопрос о развитии процесса донных волн остается открытым и в настоящее время. В значительной мере это связано с тем, что при анализе данного процесса многие исследователи используют в своих работах феноменологические формулы движения влекомых наносов. Полученные в таких моделях результаты позволяют лишь качественно оценить процесс развития донных волн. По этой причине представляет интерес проведение анализа развития донных волн с использованием аналитической модели движения влекомых наносов.

    В работе предложена двумерная профильная математическая русловая модель, позволяющая исследовать движение влекомых наносов над периодическим дном. Особенностью математической модели является возможность расчета расхода влекомых наносов по аналитической модели с реологией Кулона–Прандтля, учитывающей влияние уклонов поверхности дна, придонных нормальных и касательных напряжений на процесс движения донного материала. Показано, что при движении донного материла по дну периодической формы диффузионные и напорные расходы влекомых наносов являются разнонаправленными и доминирующими по отношению к транзитному расходу. Изучались влияния параметра перекошенности донной волны на вклад транзитного, диффузионного и напорного расходов в полный расход влекомых наносов. Выполнено сравнение полученных результатов с численными решениями других авторов для донной поверхности косинусоидальной формы.

    Krat Y.G., Potapov I.I.
    Movement of sediment over periodic bed
    Computer Research and Modeling, 2018, v. 10, no. 1, pp. 47-60

    The movement of bed load along the closed conduit can lead to a loss of stability of the bed surface, when bed waves arise at the bed of the channel. Investigation of the development of bed waves is associated with the possibility of determining of the bed load nature along the bed of the periodic form. Despite the great attention of many researchers to this problem, the question of the development of bed waves remains open at the present time. This is due to the fact that in the analysis of this process many researchers use phenomenological formulas for sediment transport in their work. The results obtained in such models allow only assess qualitatly the development of bed waves. For this reason, it is of interest to carry out an analysis of the development of bed waves using the analytical model for sediment transport.

    The paper proposed two-dimensional profile mathematical riverbed model, which allows to investigate the movement of sediment over a periodic bed. A feature of the mathematical model is the possibility of calculating the bed load transport according to an analytical model with the Coulomb–Prandtl rheology, which takes into account the influence of bottom surface slopes, bed normal and tangential stresses on the movement of bed material. It is shown that when the bed material moves along the bed of periodic form, the diffusion and pressure transport of bed load are multidirectional and dominant with respect to the transit flow. Influence of the effects of changes in wave shape on the contribution of transit, diffusion and pressure transport to the total sediment transport has been studied. Comparison of the received results with numerical solutions of the other authors has shown their good qualitative initiation.

    Views (last year): 9.
  3. Усанов М.С., Кульберг Н.С., Морозов С.П.
    Разработка алгоритма анизотропной нелинейной фильтрации данных компьютерной томографии с применением динамического порога
    Компьютерные исследования и моделирование, 2019, т. 11, № 2, с. 233-248

    В статье рассматривается разработка алгоритма шумоподавления на основе анизотропной нелинейной фильтрации данных. Анализ отечественной и зарубежной литературы показал, что наиболее эффективные алгоритмы шумоподавления данных рентгеновской компьютерной томографии применяют комплекс нелинейных методик анализа и обработки данных, таких как билатеральная, адаптивная, трехмерная фильтрации. Однако комбинация таких методик редко применяется на практике ввиду большого времени обработки данных. В связи с этим было принято решение разработать эффективный и быстродейственный алгоритм шумоподавления на основе упрощенных билатеральных фильтров с трехмерным накоплением данных. Алгоритм был разработан на языке C++11 в программной среде Microsoft Visual Studio 2015. Основным отличием разработанного алгоритма шумоподавления является применение в нем улучшенной математической модели шума на основе распределения Пуассона и Гаусса от логарифмической величины, разработанной ранее. Это позволило точнее определить уровень шума и тем самым порог обработки данных. В результате работы алгоритма шумоподавления были получены обработанные данные компьютерной томографии с пониженным уровнем шума. При визуальной оценке работы алгоритма были отмечены повышенная информативность обработанных данных по сравнению с оригиналом, четкость отображения гомогенных областей и значительное сокращение шума в областях обработки. При оценке численных результатов обработки было выявлено снижение уровня среднеквадратичного отклонения более чем в 6 раз в областях, подвергшихся шумоподавлению, а высокие показатели коэффициента детерминации показали, что данные не подверглись искажению и изменились только из-за удаления шумов. Применение разработанного универсального динамического порога, принцип работы которого основан на пороговых критериях, позволил снизить уровень шума во всем массиве данных более чем в 6 раз. Динамический порог хорошо вписывается как в разработанный алгоритм шумоподавления на основе анизотропной нелинейной фильтрации, так и другой алгоритм шумоподавления. Алгоритм успешно функционирует в составе рабочей станции MultiVox, получил высокую оценку своей работы от специалистов-рентгенологов, а также готовится к внедрению в единую радиологическую сеть города Москвы в качестве модуля.

    Usanov M.S., Kulberg N.S., Morozov S.P.
    Development of anisotropic nonlinear noise-reduction algorithm for computed tomography data with context dynamic threshold
    Computer Research and Modeling, 2019, v. 11, no. 2, pp. 233-248

    The article deals with the development of the noise-reduction algorithm based on anisotropic nonlinear data filtering of computed tomography (CT). Analysis of domestic and foreign literature has shown that the most effective algorithms for noise reduction of CT data use complex methods for analyzing and processing data, such as bilateral, adaptive, three-dimensional and other types of filtrations. However, a combination of such techniques is rarely used in practice due to long processing time per slice. In this regard, it was decided to develop an efficient and fast algorithm for noise-reduction based on simplified bilateral filtration method with three-dimensional data accumulation. The algorithm was developed on C ++11 programming language in Microsoft Visual Studio 2015. The main difference of the developed noise reduction algorithm is the use an improved mathematical model of CT noise, based on the distribution of Poisson and Gauss from the logarithmic value, developed earlier by our team. This allows a more accurate determination of the noise level and, thus, the threshold of data processing. As the result of the noise reduction algorithm, processed CT data with lower noise level were obtained. Visual evaluation of the data showed the increased information content of the processed data, compared to original data, the clarity of the mapping of homogeneous regions, and a significant reduction in noise in processing areas. Assessing the numerical results of the algorithm showed a decrease in the standard deviation (SD) level by more than 6 times in the processed areas, and high rates of the determination coefficient showed that the data were not distorted and changed only due to the removal of noise. Usage of newly developed context dynamic threshold made it possible to decrease SD level on every area of data. The main difference of the developed threshold is its simplicity and speed, achieved by preliminary estimation of the data array and derivation of the threshold values that are put in correspondence with each pixel of the CT. The principle of its work is based on threshold criteria, which fits well both into the developed noise reduction algorithm based on anisotropic nonlinear filtration, and another algorithm of noise-reduction. The algorithm successfully functions as part of the MultiVox workstation and is being prepared for implementation in a single radiological network of the city of Moscow.

    Views (last year): 21.
  4. Ступицкий Е.Л., Андрущенко В.А.
    Физические исследования, численное и аналитическое моделирование взрывных явлений. Обзор
    Компьютерные исследования и моделирование, 2020, т. 12, № 3, с. 505-546

    В данном обзоре рассмотрен широкий круг явлений и задач, связанных с взрывом. Подробные численные исследования позволили обнаружить интересный физический эффект — образование дискретных вихревых структур сразу за фронтом ударной волны, распространяющейся в плотных слоях неоднородной атмосферы. Показана необходимость дальнейшего исследования такого рода явлений и определения степени их связи с возможным развитием газодинамической неустойчивости. Дан краткий анализ многочисленных работ по тепловому взрыву метеороидов при их высокоскоростном движении в атмосфере Земли. Большое внимание уделено разработке численного алгоритма для расчета одновременного взрыва нескольких фрагментов метеороидов и проанализированы особенности развития такого газодинамического течения. Показано, что разработанные раннее алгоритмы для расчета взрывов могут успешно использоваться для исследования взрывных вулканических извержений. В работе представлены и обсуждаются результаты таких исследований как для континентальных, так и для подводных вулканов с определенными ограничениями на условия вулканической активности.

    В работе выполнен математический анализ и представлены результаты аналитических исследований ряда важных физических явлений, характерных для взрывов высокой удельной энергии в ионосфере. Показано, что принципиальное значение для разработки достаточно полных и адекватных теоретических и численных моделей таких сложных явлений, как мощные плазменные возмущения в ионосфере, имеет предварительное лабораторное физическое моделирование основных процессов, определяющих эти явления. Показано, что наиболее близким объектом для такого моделирования является лазерная плазма. Приведены результаты соответствующих теоретических и экспериментальных исследований и показана их научная и практическая значимость. Дан краткий обзор работ последних лет по использованию лазерного излучения для лабораторного физического моделирования процессов воздействия ядерного взрыва на астроидные материалы.

    В результате выполненного в обзоре анализа удалось выделить и предварительно сформулировать некоторые интересные и весомые в научном и прикладном отношении вопросы, которые необходимо исследовать на основе уже полученных представлений: это мелкодисперсные химически активные системы, образующиеся при выбросе вулканов; маломасштабные вихревые структуры; генерация спонтанных магнитных полей из-за развития неустойчивости и их роль в трансформации энергии плазмы при ее разлете в ионосфере. Важное значение имеет также вопрос об исследовании возможного лабораторного физического моделирования теплового взрыва тел при воздействии высокоскоростного плазменного потока, который до настоящего времени имеет лишь теоретические толкования.

    Stupitsky E.L., Andruschenko V.A.
    Physical research, numerical and analytical modeling of explosion phenomena. A review
    Computer Research and Modeling, 2020, v. 12, no. 3, pp. 505-546

    The review considers a wide range of phenomena and problems associated with the explosion. Detailed numerical studies revealed an interesting physical effect — the formation of discrete vortex structures directly behind the front of a shock wave propagating in dense layers of a heterogeneous atmosphere. The necessity of further investigation of such phenomena and the determination of the degree of their connection with the possible development of gas-dynamic instability is shown. The brief analysis of numerous works on the thermal explosion of meteoroids during their high-speed movement in the Earth’s atmosphere is given. Much attention is paid to the development of a numerical algorithm for calculating the simultaneous explosion of several fragments of meteoroids and the features of the development of such a gas-dynamic flow are analyzed. The work shows that earlier developed algorithms for calculating explosions can be successfully used to study explosive volcanic eruptions. The paper presents and discusses the results of such studies for both continental and underwater volcanoes with certain restrictions on the conditions of volcanic activity.

    The mathematical analysis is performed and the results of analytical studies of a number of important physical phenomena characteristic of explosions of high specific energy in the ionosphere are presented. It is shown that the preliminary laboratory physical modeling of the main processes that determine these phenomena is of fundamental importance for the development of sufficiently complete and adequate theoretical and numerical models of such complex phenomena as powerful plasma disturbances in the ionosphere. Laser plasma is the closest object for such a simulation. The results of the corresponding theoretical and experimental studies are presented and their scientific and practical significance is shown. The brief review of recent years on the use of laser radiation for laboratory physical modeling of the effects of a nuclear explosion on asteroid materials is given.

    As a result of the analysis performed in the review, it was possible to separate and preliminarily formulate some interesting and scientifically significant questions that must be investigated on the basis of the ideas already obtained. These are finely dispersed chemically active systems formed during the release of volcanoes; small-scale vortex structures; generation of spontaneous magnetic fields due to the development of instabilities and their role in the transformation of plasma energy during its expansion in the ionosphere. It is also important to study a possible laboratory physical simulation of the thermal explosion of bodies under the influence of highspeed plasma flow, which has only theoretical interpretations.

  5. Зацерковный А.В., Нурминский Е.А.
    Нейросетевой анализ транспортных потоков городских агломераций на основе данных публичных камер видеообзора
    Компьютерные исследования и моделирование, 2021, т. 13, № 2, с. 305-318

    Адекватное моделирование сложной динамики городских транспортных потоков требует сбора больших объемов данных для определения характера соответствующих моделей и их калибровки. Вместе с тем оборудование специализированных постов наблюдения является весьма затратным мероприятием и не всегда технически возможно. Совокупность этих факторов приводит к недостаточному фактографическому обеспечению как систем оперативного управления транспортными потоками, так и специалистов по транспортному планированию с очевидными последствиями для качества принимаемых решений. В качестве способа обеспечить массовый сбор данных хотя бы для качественного анализа ситуаций достаточно давно применяется обзорные видеокамеры, транслирующие изображения в определенные ситуационные центры, где соответствующие операторы осуществляют контроль и управление процессами. Достаточно много таких обзорных камер предоставляют данные своих наблюдений в общий доступ, что делает их ценным ресурсом для транспортных исследований. Вместе с тем получение количественных данных с таких камер сталкивается с существенными проблемами, относящимися к теории и практике обработки видеоизображений, чему и посвящена данная работа. В работе исследуется практическое применение некоторых мейнстримовских нейросетевых технологий для определения основных характеристик реальных транспортных потоков, наблюдаемых камерами общего доступа, классифицируются возникающие при этом проблемы и предлагаются их решения. Для отслеживания объектов дорожного движения применяются варианты сверточных нейронных сетей, исследуются способы их применения для определения базовых характеристик транспортных потоков. Простые варианты нейронной сети используются для автоматизации при получении обучающих примеров для более глубокой нейронной сети YOLOv4. Сеть YOLOv4 использована для оценки характеристик движения (скорость, плотность потока) для различных направлений с записей камер видеонаблюдения.

    Zatserkovnyy A.V., Nurminski E.A.
    Neural network analysis of transportation flows of urban aglomeration using the data from public video cameras
    Computer Research and Modeling, 2021, v. 13, no. 2, pp. 305-318

    Correct modeling of complex dynamics of urban transportation flows requires the collection of large volumes of empirical data to specify types of the modes and their identification. At the same time, setting a large number of observation posts is expensive and technically not always feasible. All this results in insufficient factographic support for the traffic control systems as well as for urban planners with the obvious consequences for the quality of their decisions. As one of the means to provide large-scale data collection at least for the qualitative situation analysis, the wide-area video cameras are used in different situation centers. There they are analyzed by human operators who are responsible for observation and control. Some video cameras provided their videos for common access, which makes them a valuable resource for transportation studies. However, there are significant problems with getting qualitative data from such cameras, which relate to the theory and practice of image processing. This study is devoted to the practical application of certain mainstream neuro-networking technologies for the estimation of essential characteristics of actual transportation flows. The problems arising in processing these data are analyzed, and their solutions are suggested. The convolution neural networks are used for tracking, and the methods for obtaining basic parameters of transportation flows from these observations are studied. The simplified neural networks are used for the preparation of training sets for the deep learning neural network YOLOv4 which is later used for the estimation of speed and density of automobile flows.

  6. Шушко Н.И., Барашов Е.Б., Красоткин С.А., Лемтюжникова Д.В.
    Новый алгоритм объединения решений подзадач в задаче коммивояжера
    Компьютерные исследования и моделирование, 2025, т. 17, № 1, с. 45-58

    Традиционные методы решения задачи коммивояжера не являются эффективными для задач высокой размерности из-за их высокой вычислительной сложности. Одним из эффективных способов решения этой проблемы является декомпозиционный подход, который включает в себя три основных этапа: кластеризацию вершин, решение подзадач внутри каждого кластера и последующее объединение полученных решений в итоговое. В данной статье основное внимание уделяется третьему этапу — объединению циклов решений подзадач, поскольку этому этапу не всегда уделяется должное внимание, что приводит к менее точному итоговому решению. В статье предлагается новый модифицированный алгоритм Сигала для объединения циклов. Для оценки его эффективности проводится сравнение с двумя алгоритмами объединения циклов: метод соединения средних точек ребер и алгоритм на основе близости центроидов кластеров. Исследуется зависимость качества решения подзадач на алгоритмы объединения циклов. Модифицированный алгоритм Сигала выполняет попарное объединение кластеров, минимизируя количество пересечений и общее расстояние. Метод центроидов ориентирован на соединение кластеров на основе близости центроидов, а алгоритм с использованием средних точек оценивает расстояние между средними точками ребер. Также были рассмотрены два типа кластеризации: алгоритмы k-means и affinity propagation. Для проверки эффективности предложенного алгоритма были проведены численные эксперименты на наборе данных TSPLIB с различным количеством городов. В исследовании анализируются ошибки, вызванные порядком объединения кластеров, качеством решения подзадач и количеством кластеров. Эксперименты показали, что модифицированный алгоритм Сигала демонстрирует наименьшую медиану итогового расстояния и наиболее устойчивые результаты по сравнению с другими методами. Результаты указывают на большую устойчивость качества конечного решения, полученным модифицированным алгоритмом Сигала, от последовательности объединения кластеров. Повышение качества решения подзадачи обычно приводит к линейному улучшению конечного решения, но используемый алгоритм объединения редко влияет на степень этого улучшения.

    Shushko N.I., Barashov E.B., Krasotkin S.A., Lemtuzhnikova D.V.
    Solving traveling salesman problem via clustering and a new algorithm for merging tours
    Computer Research and Modeling, 2025, v. 17, no. 1, pp. 45-58

    Traditional methods for solving the traveling salesman problem are not effective for high-dimensional problems due to their high computational complexity. One of the most effective ways to solve this problem is the decomposition approach, which includes three main stages: clustering vertices, solving subproblems within each cluster and then merging the obtained solutions into a final solution. This article focuses on the third stage — merging cycles of solving subproblems — since this stage is not always given sufficient attention, which leads to less accurate final solutions of the problem. The paper proposes a new modified Sigal algorithm for merging cycles. To evaluate its effectiveness, it is compared with two algorithms for merging cycles — the method of connecting midpoints of edges and an algorithm based on closeness of cluster centroids. The dependence of quality of solving subproblems on algorithms used for merging cycles is investigated. Sigal’s modified algorithm performs pairwise clustering and minimizes total distance. The centroid method focuses on connecting clusters based on closeness of centroids, and an algorithm using mid-points estimates the distance between mid-points of edges. Two types of clustering — k-means and affinity propagation — were also considered. Numerical experiments were performed using the TSPLIB dataset with different numbers of cities and topologies to test effectiveness of proposed algorithm. The study analyzes errors caused by the order in which clusters were merged, the quality of solving subtasks and number of clusters. Experiments show that the modified Sigal algorithm has the smallest median final distance and the most stable results compared to other methods. Results indicate that the quality of the final solution obtained using the modified Sigal algorithm is more stable depending on the sequence of merging clusters. Improving the quality of solving subproblems usually results in linear improvement of the final solution, but the pooling algorithm rarely affects the degree of this improvement.

  7. Антипова С.А., Журкин А.М.
    Ресурсно-адаптивный подход к разметке текстовых данных в структурированном виде с использованием малых языковых моделей
    Компьютерные исследования и моделирование, 2026, т. 18, № 1, с. 41-59

    В данной работе проведено экспериментальное исследование применения автоматической разметки текстовых данных в формате «вопрос – ответ» (QA-пары) в условиях ограниченных вычислительных ресурсов и требований к защите данных. В отличие от традиционных подходов, основанных на жестких правилах или использовании внешних API, предложено применять малые языковые модели с небольшим количеством параметров, способные функционировать локально без GPU на стандартных CPU-системах. Для тестирования были выбраны две модели: Gemma-3-4b и Qwen-2.5-3b (квантованные 4-битные версии), а в качестве исходного материала использован корпус документов с четкой структурой и формально-строгим стилем изложения. Разработана система автоматической аннотации, реализующая полный цикл генерации QA-датасета: автоматическое разбиение исходного документа на логически связные фрагменты, формирование пар «вопрос – ответ» моделью Gemma-3-4b, предварительная проверка их корректности с использованием Qwen-2.5-3b с опорой на доказательный фрагмент из контекста и экспертной оценкой качества. Экспорт полученных результатов предоставляется в формате JSONL. Оценка производительности охватывает всю систему генерации QA-пар, включая обработку фрагментов локальной языковой моделью, модули предобработки и постобработки текста. Производительность измеряется по времени генерации одной QA-пары, общей пропускной способности системы, использованию оперативной памяти и загрузке процессора, что позволяет объективно оценить вычислительную эффективность предлагаемого подхода при запуске на CPU. Эксперимент на расширенной выборке из 12 документов показал, что автоматическая аннотация демонстрирует устойчивую производительность при обработке документов различных типов, тогда как ручная разметка характеризуется существенно большими временными затратами и высокой вариативностью. В зависимости от типа документа ускорение аннотации по сравнению с ручным процессом составляет от 8 до 14 раз. Анализ качества показал, что большинство сгенерированных QA-пар обладают высокой семантической согласованностью с исходным контекстом, при этом лишь ограниченная доля данных требует экспертной корректировки или исключения. Хотя полная ручная валидация корпуса (золотой стандарт) в рамках работы не проводилась, сочетание автоматической оценки и выборочной экспертной проверки позволяет рассматривать полученный уровень качества как приемлемый для задач предварительной автоматизированной аннотации. В целом результаты подтверждают практическую применимость малых языковых моделей для построения автономных и воспроизводимых систем автоматической разметки текстов в условиях ограниченных вычислительных ресурсов и создают основу для дальнейших исследований в области эффективной подготовки обучающих корпусов для задач обработки естественного языка.

    Antipova S.A., Zhurkin A.M.
    Resource-adaptive approach to structured text data annotation using small language models
    Computer Research and Modeling, 2026, v. 18, no. 1, pp. 41-59

    This paper presents an experimental study of the application of automatic annotation of text data in the question – answer format (QA pairs) under conditions of limited computing resources and data protection requirements. Unlike traditional approaches based on rigid rules or the use of external APIs, we propose using small language models with a small number of parameters that can function locally without a GPU on standard CPU systems. Two models were selected for testing — Gemma-3-4b and Qwen-2.5-3b (quantized 4-bit versions) — and a corpus of documents with a clear structure and a formally rigorous style of presentation was used as source material. An automatic annotation system was developed that implements the full cycle of QA dataset generation: automatic division of the source document into logically connected fragments, formation of “question – answer” pairs using the Gemma-3-4b model, preliminary verification of their correctness using Qwen-2.5-3b based on evidence span from the context and expert quality assessment. The results are exported in JSONL format. Performance evaluation covers the entire QA pair generation system, including fragment processing by the local language model, text preprocessing and postprocessing modules. Performance is measured by the time it takes to generate a single QA pair, the total throughput of the system, RAM usage, and CPU load, which allows for an objective assessment of the computational efficiency of the proposed approach when running on a CPU. An experiment on an extended sample of 12 documents showed that automatic annotation demonstrates stable performance when processing different types of documents, while manual annotation is characterized by significantly higher time costs and high variability. Depending on the type of document, the acceleration of annotation compared to the manual process ranges from 8 to 14 times. Quality analysis showed that most of the generated QA pairs have high semantic consistency with the original context, with only a limited proportion of data requiring expert correction or exception. Although full manual validation of the corpus (the “gold standard”) was not performed as part of this work, the combination of automatic evaluation and selective expert review allows us to consider the resulting quality level acceptable for preliminary automated annotation tasks. Overall, the results confirm the practical applicability of small language models for building autonomous and reproducible automatic text annotation systems under limited computational resources and provide a basis for further research in the field of effective training corpus preparation for natural language processing tasks.

  8. Комаров В.М.
    О Международной Пущинской школе-конференции молодых ученых «Биология – наука XXI века»
    Компьютерные исследования и моделирование, 2010, т. 2, № 1, с. 41
    Komarov V.M.
    Editor's note
    Computer Research and Modeling, 2010, v. 2, no. 1, p. 41
  9. Калинин И.Н., Глухарев К.К.
    Исследование интегральных характеристик перекрестков при помощи микроскопических моделей транспортных потоков
    Компьютерные исследования и моделирование, 2014, т. 6, № 4, с. 523-534

    Рассматривается проблема применимости микроскопического моделирования транспортных потоков к анализу достаточно больших фрагментов сетей на примере модели дискретного потока с безопасной дистанцией. Вводится понятие интегральных характеристик перекрестков и предлагается методика получения интегральных характеристик на основе данных численных экспериментов по моделированию потоков на заданном перекрестке. Методика применяется к кольцевому коммутатору с Т-образными перекрестками, анализируются полученные характеристики.

    Kalinin I.N., Glukharev K.K.
    Interchange integral characteristics study via microscopic traffic flow models
    Computer Research and Modeling, 2014, v. 6, no. 4, pp. 523-534

    The problem of application of miscroscopic traffic models for the analysis of large network segments is discussed with an example of discrete flow with safe distance. A concept of integral charasteristics of network segments is introduced, a method for obtaining such characteristics via microscopic traffic flow models is presented. Said method is applied to a circular unidirectional interchange, obtained characteristics analysed.

    Views (last year): 4. Citations: 7 (RSCI).
  10. Хоружников С.Э., Грудинин В.А., Садов О.Л., Шевель А.Е., Каирканов А.Б.
    Предварительное изучение передачи больших данных по компьютерной сети
    Компьютерные исследования и моделирование, 2015, т. 7, № 3, с. 421-427

    Передача больших данных по компьютерной сети — это важная и неотъемлемая операция в прошлом, настоящем и в любом обозримом будущем. Существует несколько методов передачи данных по глобальной компьютерной сети (Интернет) с помощью ряда инструментов. В этой статье рассматривается передача данных из одной точки Интернета в другую точку Интернета в основном на большие расстояния: многие тысячи километров. В статье представлен анализ нескольких бесплатных систем передачи больших данных. Подчеркиваются наиболее важные архитектурные особенности и предлагается идея использования технологии ПКС на базе протокола Openflow для улучшения процесса передачи данных по нескольким параллельным каналам связи.

    Khoruzhnikov S.E., Grudinin V.A., Sadov O.L., Shevel A.Y., Kairkanov A.B.
    Preliminary study of big data transfer over computer network
    Computer Research and Modeling, 2015, v. 7, no. 3, pp. 421-427

    The transfer of Big Data over computer network is important and unavoidable operation in the past, now and in any feasible future. There are a number of methods to transfer the data over computer global network (Internet) with a range of tools. In this paper the transfer of one piece of Big Data from one point in the Internet to another point in Internet in general over long range distance: many thousands kilometers. Several free of charge systems to transfer the Big Data are analyzed here. The most important architecture features are emphasized and suggested idea to add SDN Openflow protocol technique for fine tuning the data transfer over several parallel data links.

    Views (last year): 4.
Pages: « first previous next last »

Indexed in Scopus

Full-text version of the journal is also available on the web site of the scientific electronic library eLIBRARY.RU

The journal is included in the Russian Science Citation Index

The journal is included in the RSCI

International Interdisciplinary Conference "Mathematics. Computing. Education"