Результаты поиска по 'Большие Данные':
Найдено статей: 175
  1. Шмидт Ю.Д., Ивашина Н.В., Озерова Г.П.
    Моделирование межрегиональных миграционных потоков клеточными автоматами
    Компьютерные исследования и моделирование, 2020, т. 12, № 6, с. 1467-1483

    В статье исследуется проблема разработки и обоснования наиболее адекватного инструментария для прогнозирования величины и структуры межрегиональных миграционных потоков. Миграционные процессы оказывают значительное влияние на численность и демографическую структуру населения территорий, состояние и сбалансированность региональных и локальных рынков труда. Для анализа миграционных процессов и оценки их последствий необходим экономикоатематический инструментарий, позволяющий с необходимой точностью моделировать миграционные процессы и потоки для различных территорий. Рассмотрены существующие подходы и методы моделирования миграционных процессов с анализом их преимуществ и недостатков. Отмечается, что для реализации многих из этих методов необходим большой массив агрегированных статистических данных, который не всегда имеется в наличии и не характеризует поведение мигрантов на локальном уровне, на котором принимается решение о переезде на новое место жительства. Это существенно влияет на возможность применения соответствующих методов моделирования миграционных процессов и точность прогнозов величины и структуры миграционных потоков.

    В работе разработана и апробирована на данных Приморского края модель клеточного автомата для моделирования межрегиональных миграционных потоков, реализующая интеграцию модели миграционного поведения домашних хозяйств в условиях ограниченной рациональности в общую модель миграционного потока территории. Для реализации модели миграционного поведения домашних хозяйств в условиях ограниченной рациональности предложен интегральный индекс привлекательности регионов с экономической, социальной и экологической составляющими. Для оценки прогностической способности разработанной модели проведено ее сравнение с существующими моделями клеточных автоматов, используемыми для прогнозирования межрегиональных миграционных потоков. Для этих целей был использован метод вневыборочного прогнозирования, который показал статистически значимое превосходство предложенной модели, которая позволяет получать прогнозы и количественные характеристики миграционных потоков территорий на основе реального миграционного поведения домашних хозяйств на локальном уровне с учетом условий их проживания и поведенческих мотивов.

    Shmidt Y.D., Ivashina N.V., Ozerova G.P.
    Modelling interregional migration flows by the cellular automata
    Computer Research and Modeling, 2020, v. 12, no. 6, pp. 1467-1483

    The article dwells upon investigating the issue of the most adequate tools developing and justifying to forecast the interregional migration flows value and structure. Migration processes have a significant impact on the size and demographic structure of the population of territories, the state and balance of regional and local labor markets.

    To analyze the migration processes and to assess their impact an economic-mathematical tool is required which would be instrumental in modelling the migration processes and flows for different areas with the desired precision. The current methods and approaches to the migration processes modelling, including the analysis of their advantages and disadvantages, were considered. It is noted that to implement many of these methods mass aggregated statistical data is required which is not always available and doesn’t characterize the migrants behavior at the local level where the decision to move to a new dwelling place is made. This has a significant impact on the ability to apply appropriate migration processes modelling techniques and on the projection accuracy of the migration flows magnitude and structure.

    The cellular automata model for interregional migration flows modelling, implementing the integration of the households migration behavior model under the conditions of the Bounded Rationality into the general model of the area migration flow was developed and tested based on the Primorye Territory data. To implement the households migration behavior model under the conditions of the Bounded Rationality the integral attractiveness index of the regions with economic, social and ecological components was proposed in the work.

    To evaluate the prognostic capacity of the developed model, it was compared with the available cellular automata models used to predict interregional migration flows. The out of sample prediction method which showed statistically significant superiority of the proposed model was applied for this purpose. The model allows obtaining the forecasts and quantitative characteristics of the areas migration flows based on the households real migration behaviour at the local level taking into consideration their living conditions and behavioural motives.

  2. Аксёнов А.А., Жлуктов С.В., Похилко В.И., Сорокин К.Э.
    Неявный алгоритм решения уравнений движения несжимаемой жидкости
    Компьютерные исследования и моделирование, 2023, т. 15, № 4, с. 1009-1023

    Для решения уравнений Навье – Стокса в случае несжимаемых течений разработано большое количество методов, наиболее популярными из которых являются методы с коррекцией скорости по алгоритму SIMPLE, аналогом которого является метод расщепления по физическим переменным. Данные методы, разработанные еще в прошлом веке, использовались для решения достаточно простых задач — расчета как стационарных течений, так и нестационарных, в которых границы расчетной области были неподвижны. В настоящее время задачи вычислительной гидродинамики существенно усложнились. Интерес представляют задачи с движением тел в расчетной области, движением контактных границ, кавитацией и задачи с динамической локальной адаптацией расчетной сетки. При этом расчетная сетка меняется, что приводит к нарушению условия дивергентности скорости на ней. Поскольку дивергентные скорости используются не только для уравнений Навье – Стокса, но и для всех остальных уравнений математической модели движения жидкости — моделей турбулентности, массопереноса и сохранения энергии, нарушение этого условия ведет к численным ошибкам и, зачастую, к расхождению вычислительного алгоритма.

    В статье представлен неявный метод расщепления по физическим переменным, который использует дивергентные скорости с данного шага по времени для решения несжимаемых уравнений Навье – Стокса. Метод разработан для расчета течений при наличии подвижных и контактных границ, моделируемых в постановке Эйлера. Метод позволяет проводить расчеты с шагом интегрирования, на порядки превышающем явный шаг по времени (число Куранта – Фридрихcа – Леви $CFL\gg1$). В данной статье представлен вариант метода для несжимаемых течений. Вариант метода, позволяющий рассчитывать движение жидкости и газа при любых числах Маха, будет опубликован в ближайшее время. Метод для полностью сжимаемых течений реализован в программном комплексе FlowVision.

    В статье приводятся результаты численного решения классической задачи обтекания кругового цилиндра при малых числах Рейнольдса ($50<Re<140$), при которых ламинарное обтекание цилиндра становиться нестационарным и образуется дорожка Кармана. Показано хорошее совпадение расчетов с экспериментальными данными, опубликованными в классических работах Ван-Дайка и Танеды.

    Aksenov A.A., Zhluktov S.V., Pokhilko V.I., Sorokin K.E.
    Implicit algorithm for solving equations of motion of incompressible fluid
    Computer Research and Modeling, 2023, v. 15, no. 4, pp. 1009-1023

    A large number of methods have been developed to solve the Navier – Stokes equations in the case of incompressible flows, the most popular of which are methods with velocity correction by the SIMPLE algorithm and its analogue — the method of splitting by physical variables. These methods, developed more than 40 years ago, were used to solve rather simple problems — simulating both stationary flows and non-stationary flows, in which the boundaries of the calculation domain were stationary. At present, the problems of computational fluid dynamics have become significantly more complicated. CFD problems are involving the motion of bodies in the computational domain, the motion of contact boundaries, cavitation and tasks with dynamic local adaptation of the computational mesh. In this case the computational mesh changes resulting in violation of the velocity divergence condition on it. Since divergent velocities are used not only for Navier – Stokes equations, but also for all other equations of the mathematical model of fluid motion — turbulence, mass transfer and energy conservation models, violation of this condition leads to numerical errors and, often, to undivergence of the computational algorithm.

    This article presents an implicit method of splitting by physical variables that uses divergent velocities from a given time step to solve the incompressible Navier – Stokes equations. The method is developed to simulate flows in the case of movable and contact boundaries treated in the Euler paradigm. The method allows to perform computations with the integration step exceeding the explicit time step by orders of magnitude (Courant – Friedrichs – Levy number $CFL\gg1$). This article presents a variant of the method for incompressible flows. A variant of the method that allows to calculate the motion of liquid and gas at any Mach numbers will be published shortly. The method for fully compressible flows is implemented in the software package FlowVision.

    Numerical simulating classical fluid flow around circular cylinder at low Reynolds numbers ($50 < Re < 140$), when laminar flow is unsteady and the Karman vortex street is formed, are presented in the article. Good agreement of calculations with the experimental data published in the classical works of Van Dyke and Taneda is demonstrated.

  3. Фиалко Н.С., Ольшевец М.М., Лахно В.Д.
    Численное исследование модели Холстейна в разных термостатах
    Компьютерные исследования и моделирование, 2024, т. 16, № 2, с. 489-502

    На основе гамильтониана Холстейна промоделирована динамика заряда, привнесенного в молекулярную цепочку сайтов, при разной температуре. При расчете температура цепочки задается начальными данными — случайными гауссовыми распределениями скоростей и смещений сайтов. Рассмотрены разные варианты начального распределенияз арядовой плотности. Расчеты показывают, что система на больших расчетных временах переходит к колебаниям около нового равновесного состояния. Для одинаковых начальных скоростей и смещений средняя кинетическая энергия (и, соответственно, температура $T$) цепочки меняется в зависимости от начального распределения зарядовой плотности: убывает при внесении в цепочку полярона или увеличивается, если в начальный момент электронная часть энергии максимальна.

    Проведено сравнение с результатами, полученными ранее в модели с термостатом Ланжевена. В обоих случаях существование полярона определяется тепловой энергией всей цепочки. По результатам моделирования, переход от режима полярона к делокализованному состоянию происходит в одинаковой области значений тепловой энергии цепочки $N$ сайтов ~ $NT$ для обоих вариантов термостата, с дополнительной корректировкой: для гамильтоновой системы температура не соответствует начально заданной, а определяется на больших расчетных временах из средней кинетической энергии цепочки.

    В поляронной области применение разных способов имитации температуры приводит к ряду существенных различий в динамике системы. В области делокализованного состояния заряда, для больших температур, результаты, усредненные по набору траекторий в системе со случайной силой, и результаты, усредненные по времени для гамильтоновой системы, близки, что не противоречит гипотезе эргодичности. С практической точки зрения для больших температур T ≈ 300 K при моделировании переноса заряда в однородных цепочках можно использовать любой вариант задания термостата.

    Fialko N.S., Olshevets M.M., Lakhno V.D.
    Numerical study of the Holstein model in different thermostats
    Computer Research and Modeling, 2024, v. 16, no. 2, pp. 489-502

    Based on the Holstein Hamiltonian, the dynamics of the charge introduced into the molecular chain of sites was modeled at different temperatures. In the calculation, the temperature of the chain is set by the initial data ¡ª random Gaussian distributions of velocities and site displacements. Various options for the initial charge density distribution are considered. Long-term calculations show that the system moves to fluctuations near a new equilibrium state. For the same initial velocities and displacements, the average kinetic energy, and, accordingly, the temperature of the T chain, varies depending on the initial distribution of the charge density: it decreases when a polaron is introduced into the chain, or increases if at the initial moment the electronic part of the energy is maximum. A comparison is made with the results obtained previously in the model with a Langevin thermostat. In both cases, the existence of a polaron is determined by the thermal energy of the entire chain.

    According to the simulation results, the transition from the polaron mode to the delocalized state occurs in the same range of thermal energy values of a chain of $N$ sites ~ $NT$ for both thermostat options, with an additional adjustment: for the Hamiltonian system the temperature does not correspond to the initially set one, but is determined after long-term calculations from the average kinetic energy of the chain.

    In the polaron region, the use of different methods for simulating temperature leads to a number of significant differences in the dynamics of the system. In the region of the delocalized state of charge, for high temperatures, the results averaged over a set of trajectories in a system with a random force and the results averaged over time for a Hamiltonian system are close, which does not contradict the ergodic hypothesis. From a practical point of view, for large temperatures T ≈ 300 K, when simulating charge transfer in homogeneous chains, any of these options for setting the thermostat can be used.

  4. Малков С.Ю., Давыдова О.И.
    Модернизация как глобальный процесс: опыт математического моделирования
    Компьютерные исследования и моделирование, 2021, т. 13, № 4, с. 859-873

    В статье проведен анализ эмпирических данных по долгосрочной демографической и экономической динамике стран мира за период с начала XIX века по настоящее время. В качестве показателей, характеризующих долгосрочную демографическую и экономическую динамику стран мира, были выбраны данные по численности населения и ВВП ряда стран мира за период 1500–2016 годов. Страны выбирались таким образом, чтобы в их число вошли представители с различным уровнем развития (развитые и развивающиеся страны), а также страны из различных регионов мира (Северная Америка, Южная Америка, Европа, Азия, Африка). Для моделирования и обработки данных использована специально разработанная математическая модель. Представленная модель является автономной системой дифференциальных уравнений, которая описывает процессы социально-экономической модернизации, в том числе процесс перехода от аграрного общества к индустриальному и постиндустриальному. В модель заложена идея о том, что процесс модернизации начинается с возникновения в традиционном обществе инновационного сектора, развивающегося на основе новых технологий. Население из традиционного сектора постепенно перемещается в инновационный сектор. Модернизация завершается, когда большая часть населения переходит в инновационный сектор.

    При работе с моделью использовались статистические методы обработки данных, методы Big Data, включая иерархическую кластеризацию. С помощью разработанного алгоритма на базе метода случайного спуска были идентифицированы параметры модели и проведена ее верификация на основе эмпирических рядов, а также проведено тестирование модели с использованием статистических данных, отражающих изменения, наблюдаемые в развитых и развивающихся странах в период происходящей в течение последних столетий модернизации. Тестирование модели продемонстрировало ее высокое качество — отклонения расчетных кривых от статистических данных, как правило, небольшие и происходят в периоды войн и экономических кризисов. Проведенный анализ статистических данных по долгосрочной демографической и экономической динамике стран мира позволил определить общие закономерности и формализовать их в виде математической модели. Модель будет использоваться с целью прогноза демографической и экономической динамики в различных странах мира.

    Malkov S.Yu., Davydova O.I.
    Modernization as a global process: the experience of mathematical modeling
    Computer Research and Modeling, 2021, v. 13, no. 4, pp. 859-873

    The article analyzes empirical data on the long-term demographic and economic dynamics of the countries of the world for the period from the beginning of the 19th century to the present. Population and GDP of a number of countries of the world for the period 1500–2016 were selected as indicators characterizing the long-term demographic and economic dynamics of the countries of the world. Countries were chosen in such a way that they included representatives with different levels of development (developed and developing countries), as well as countries from different regions of the world (North America, South America, Europe, Asia, Africa). A specially developed mathematical model was used for modeling and data processing. The presented model is an autonomous system of differential equations that describes the processes of socio-economic modernization, including the process of transition from an agrarian society to an industrial and post-industrial one. The model contains the idea that the process of modernization begins with the emergence of an innovative sector in a traditional society, developing on the basis of new technologies. The population is gradually moving from the traditional sector to the innovation sector. Modernization is completed when most of the population moves to the innovation sector.

    Statistical methods of data processing and Big Data methods, including hierarchical clustering were used. Using the developed algorithm based on the random descent method, the parameters of the model were identified and verified on the basis of empirical series, and the model was tested using statistical data reflecting the changes observed in developed and developing countries during the period of modernization taking place over the past centuries. Testing the model has demonstrated its high quality — the deviations of the calculated curves from statistical data are usually small and occur during periods of wars and economic crises. Thus, the analysis of statistical data on the long-term demographic and economic dynamics of the countries of the world made it possible to determine general patterns and formalize them in the form of a mathematical model. The model will be used to forecast demographic and economic dynamics in different countries of the world.

  5. Васюков А.В., Беклемышева К.А., Онучин Е.С., Товарнова Н.А., Петров И.Б.
    Расчет скорости поперечной волны при ударе по предварительно нагруженным нитям
    Компьютерные исследования и моделирование, 2022, т. 14, № 4, с. 887-897

    В работе рассматривается задача о поперечном ударе по тонкой предварительно нагруженной нити. Общепринятая теория о поперечному даре по тонкой нити отталкивается от классических публикаций Рахматулина и Смита. На основании теории Рахматулина – Смита получены соотношения, широко используемые в инженерной практике. Однако существуют многочисленные данные о том, что экспериментальные результаты могут существенно отличаться от оценок, сделанных на базе этих соотношений. Краткий обзор факторов, которые вызывают отличия, приведен в тексте статьи.

    Основное внимание в данной статье уделяется скорости поперечной волны, формирующейся при ударе, так как только ее можно непосредственно наблюдать и измерять с помощью высокоскоростной съемки или иных методов. Рассматривается влияние предварительного натяжения нити на скорость волны. Данный фактор важен, так как он неизбежно возникает в результатах натурных испытаний в силу того, что надежное закрепление и точное позиционирование нити на экспериментальной установке требует некоторого ее натяжения. В данной работе показано, что предварительная деформация нити существенно влияет на скорость поперечной волны, возникающей в ходе ударного взаимодействия.

    Выполнены расчеты серии постановок для нитей Kevlar 29 и Spectra 1000. Для различных уровней начального натяжения получены скорости поперечных волн. Приведено прямое сравнение численных результатов и аналитических оценок с данными экспериментов. Для рассмотренных постановок скорость поперечной волны в свободной и в нагруженной нити отличалась практически в два раза. Таким образом, показано, что измерения, основанные на высокоскоростной съемке и анализе наблюдаемых поперечных волн, должны учитывать предварительную деформацию нити.

    В работе предложена формула для быстрой оценки скорости поперечной волны в натянутых нитях. Данная формула получена из основных соотношений теории Рахматулина – Смита в предположении большой начальной деформации нити. На примере рассмотренных постановок для Kevlar 29 и Spectra 1000 показано, что полученная формула может давать существенно лучшие результаты, чем классическое приближение. Также показано, что прямой численный расчет дает результаты, которые оказываются значительно ближе к экспериментальным данным, чем любая из рассмотренных аналитических оценок.

    Vasyukov A.V., Beklemysheva K.A., Onuchin E.S., Tovarnova N.A., Petrov I.B.
    Calculation of transverse wave speed in preloaded fibres under an impact
    Computer Research and Modeling, 2022, v. 14, no. 4, pp. 887-897

    The paper considers the problem of transverse impact on a thin preloaded fiber. The commonly accepted theory of transverse impact on a thin fiber is based on the classical works of Rakhmatulin and Smith. The simple relations obtained from the Rakhmatulin – Smith theory are widely used in engineering practice. However, there are numerous evidences that experimental results may differ significantly from estimations based on these relations. A brief overview of the factors that cause the differences is given in this article.

    This paper focuses on the shear wave velocity, as it is the only feature that can be directly observed and measured using high-speed cameras or similar methods. The influence of the fiber preload on the wave speed is considered. This factor is important, since it inevitably arises in the experimental results. The reliable fastening and precise positioning of the fiber during the experiments requires its preload. This work shows that the preload significantly affects the shear wave velocity in the impacted fiber.

    Numerical calculations were performed for Kevlar 29 and Spectra 1000 yarns. Shear wave velocities are obtained for different levels of initial tension. A direct comparison of numerical results and analytical estimations with experimental data is presented. The speed of the transverse wave in free and preloaded fibers differed by a factor of two for the setup parameters considered. This fact demonstrates that measurements based on high-speed imaging and analysis of the observed shear waves should take into account the preload of the fibers.

    This paper proposes a formula for a quick estimation of the shear wave velocity in preloaded fibers. The formula is obtained from the basic relations of the Rakhmatulin – Smith theory under the assumption of a large initial deformation of the fiber. The formula can give significantly better results than the classical approximation, this fact is demonstrated using the data for preloaded Kevlar 29 and Spectra 1000. The paper also shows that direct numerical calculation has better corresponding with the experimental data than any of the considered analytical estimations.

  6. Аксёнов А.А., Калугина М.Д., Лобанов А.И., Каширин В.С.
    Численное моделирование течения жидкости в насосе для перекачки крови в программном комплексе FlowVision
    Компьютерные исследования и моделирование, 2023, т. 15, № 4, с. 1025-1038

    В программном комплексе FlowVision проведено численное моделирование течения жидкости в насосе для перекачки крови. Данная тестовая задача, предоставленная Центром устройств и радиологического здоровья Управления по санитарному надзору за качеством пищевых продуктов и медикаментов США, предусматривала рассмотрение течения жидкости в соответствии с несколькими расчетными режимами. При этом для каждого расчетного случая задавалось определенное значение расхода жидкости и скорости вращения ротора. Необходимые для расчетов данные в виде точной геометрии, условий потока и характеристик жидкости были предоставлены всем участникам исследования, использующим для моделирования различные программные комплексы. Во FlowVision численное моделирование проводилось для шести режимов с ньютоновской жидкостью и стандартной моделью турбулентности $k-\varepsilon$, дополнительно были проведены расчеты пятого режима с моделью турбулентности $k-\omega$ SST и с использованием реологической модели жидкости Каро. На первом этапе численного моделирования была исследована сходимость по сетке, на основании которой выбрана итоговая сетка с числом ячеек порядка 6 миллионов. В связи с большим количеством ячеек для ускорения исследования часть расчетов проводилась на кластере «Ломоносов-2». В результате численного моделирования были получены и проанализированы значения перепада давления между входом и выходом насоса, скорости между лопатками ротора и в области диффузора, а также проведена визуализация распределения скорости в определенных сечениях. Для всех расчетных режимов осуществлялось сравнение перепада давления, полученного численно, с экспериментальными данными, а для пятого расчетного режима также производилось сравнение с экспериментом по распределению скорости между лопатками ротора и в области диффузора. Анализ данных показал хорошее соответствие результатов расчетов во FlowVision с результатами эксперимента и численного моделирования в других программных комплексах. Полученные во FlowVision результаты решения теста от Управления по санитарному надзору за качеством пищевых продуктов и медикаментов США позволяют говорить о том, что данный программный комплекс может быть использован для решения широкого спектра задач гемодинамики.

    Aksenov A.A., Kalugina M.D., Lobanov A.I., Kashirin V.S.
    Numerical simulation of fluid flow in a blood pump in the FlowVision software package
    Computer Research and Modeling, 2023, v. 15, no. 4, pp. 1025-1038

    A numerical simulation of fluid flow in a blood pump was performed using the FlowVision software package. This test problem, provided by the Center for Devices and Radiological Health of the US. Food and Drug Administration, involved considering fluid flow according to several design modes. At the same time for each case of calculation a certain value of liquid flow rate and rotor speed was set. Necessary data for calculations in the form of exact geometry, flow conditions and fluid characteristics were provided to all research participants, who used different software packages for modeling. Numerical simulations were performed in FlowVision for six calculation modes with the Newtonian fluid and standard $k-\varepsilon$ turbulence model, in addition, the fifth mode with the $k-\omega$ SST turbulence model and with the Caro rheological fluid model were performed. In the first stage of the numerical simulation, the convergence over the mesh was investigated, on the basis of which a final mesh with a number of cells of the order of 6 million was chosen. Due to the large number of cells, in order to accelerate the study, part of the calculations was performed on the Lomonosov-2 cluster. As a result of numerical simulation, we obtained and analyzed values of pressure difference between inlet and outlet of the pump, velocity between rotor blades and in the area of diffuser, and also, we carried out visualization of velocity distribution in certain cross-sections. For all design modes there was compared the pressure difference received numerically with the experimental data, and for the fifth calculation mode there was also compared with the experiment by speed distribution between rotor blades and in the area of diffuser. Data analysis has shown good correlation of calculation results in FlowVision with experimental results and numerical simulation in other software packages. The results obtained in FlowVision for solving the US FDA test suggest that FlowVision software package can be used for solving a wide range of hemodynamic problems.

  7. Кокс М.А., Рид Р., Мелладо Б.
    Разработка системы ARM на базе блока обработки данных для вы- числений потока данных, реализованного на основе ИС
    Компьютерные исследования и моделирование, 2015, т. 7, № 3, с. 505-509

    Современные масштабные научные проекты становятся все более информационно ёмкими, и обработка хранимых данных в режиме offline является невозможной. Требуется высокая пропускная способность при вычислениях или Вычисления Потока Данных, чтобы иметь возможность обрабатывать терабайты данных в секунду; такие данные не могут быть элементами длительного хранения. Общепринятые дата-центры, основанные на стандартном аппаратном обеспечении, являются дорогими и настроены на вычислительную мощность. Общая пропускная способность может быть увеличена с помощью массивного параллелизма, чаще всего за счет повышенной вычислительной мощности и потребления энергии. Система ARM на основе ИС (SoC) может решить проблему системы ввода/вывода и соотношение CPU, доступность и эффективность использования энергии, так как ARM SoC являются элементами массового производства и разработаны на основе эффективного использования энергии в мобильных устройствах. На данный момент такой элемент обработки находится в разработке и нацелен на пропускную способность ввода/вывода в 20 Гб/c и значительную вычислительную мощность. Рассмотрены возможности ввода/вывода потребления системы ARM на основе ИС вместе с вычислением производительности и тестами на пропускную способность ввода/вывода.

    Cox M.A., Reed R.G., Mellado B.
    The development of an ARM system on chip based processing unit for data stream computing
    Computer Research and Modeling, 2015, v. 7, no. 3, pp. 505-509

    Modern big science projects are becoming highly data intensive to the point where offline processing of stored data is infeasible. High data throughput computing, or Data Stream Computing, for future projects is required to deal with terabytes of data per second which cannot be stored in long-term storage elements. Conventional data-centres based on typical server-grade hardware are expensive and are biased towards processing power. The overall I/O bandwidth can be increased with massive parallelism, usually at the expense of excessive processing power and high energy consumption. An ARM System on Chip (SoC) based processing unit may address the issue of system I/O and CPU balance, affordability and energy efficiency since ARM SoCs are mass produced and designed to be energy efficient for use in mobile devices. Such a processing unit is currently in development, with a design goal of 20 Gb/s I/O throughput and significant processing power. The I/O capabilities of consumer ARM System on Chips are discussed along with to-date performance and I/O throughput tests.

    Views (last year): 1.
  8. Неверова Г.П., Фрисман Е.Я.
    Режимы динамики популяции с неперекрывающимися поколениями с учетом генетической и стадийной структур
    Компьютерные исследования и моделирование, 2020, т. 12, № 5, с. 1165-1190

    В данной работе рассматривается простейшая модель динамики популяции с неперекрывающимися поколениями, в которой плотностно-зависимые факторы лимитируют интенсивность рождаемости. При этом репродуктивный потенциал определяется генетически, а процессы размножения приурочены к определенному годовому сезону. Исследуемая в работе эколого-генетическая модель представляет собой объединение экологической модели динамики лимитированной популяции с неперекрывающимися поколениями и микроэволюционной модели динамики ее генетической структуры для случая, когда адаптивное разнообразие репродуктивных возможностей в популяции определяется одним аутосомным диаллельным локусом с аллеломорфами $А$ и $а$. В ходе исследования данной модели показано, что генетический состав популяции (а именно, будет ли она полиморфной или мономорфной) определяется значениями репродуктивных потенциалов гетерозиготы и гомозигот. При этом режимы динамики численности популяции определяются величиной среднего репродуктивного потенциала зрелых особей и интенсивностью процессов саморегуляции. В частности, показано, что эволюционный рост среднего значения репродуктивного потенциала при плотностной регуляции рождаемости приводит к дестабилизации динамики численности возрастных групп. В то время как интенсивность процессов саморегуляции определяет характер возникающих колебаний, поскольку от количественной оценки именно этого фактора зависит сценарий потери устойчивости равновесных состояний. Показано, что закономерности возникновения и эволюции циклических режимов динамики в большой степени определяются особенностями жизненного цикла особей, составляющих популяцию. Именно жизненный цикл определяет наличие изолированных субпопуляций разных лет, что, в свою очередь, приводит к возможности независимой микроэволюции этих субпопуляций и возникновения сложных сценариев динамики как численности, так и генетической структуры. Закрепление разных адаптивных мутаций постепенно приведет к генетической (а возможно, и морфологической) дифференциации и к различиям в средних репродуктивных потенциалах субпопуляций и достижению ими разного равновесного уровня численности. Дальнейший эволюционный рост репродуктивных потенциалов экологически лимитированных субпопуляций приводит к колебаниям их численности, которые могут отличаться не только амплитудой, но и фазой. Обнаруженные в предложенной модели сценарии микроэволюции генетического состава популяции, связанные с колебаниями численности, вполне согласуются с результатами исследований популяции тихоокеанской горбуши, которая демонстрирует не только колебания численности, но и наличие генетически дифференцированных субпопуляций смежных поколений.

    Neverova G.P., Frisman E.Y.
    Dynamics regimes of population with non-overlapping generations taking into account genetic and stage structures
    Computer Research and Modeling, 2020, v. 12, no. 5, pp. 1165-1190

    This paper studies a model of a population with non-overlapping generations and density-dependent regulation of birth rate. The population breeds seasonally, and its reproductive potential is determined genetically. The model proposed combines an ecological dynamic model of a limited population with non-overlapping generations and microevolutionary model of its genetic structure dynamics for the case when adaptive trait of birth rate controlled by a single diallelic autosomal locus with allelomorphs A and a. The study showed the genetic composition of the population, namely, will it be polymorphic or monomorphic, is mainly determined by the values of the reproductive potentials of heterozygote and homozygotes. Moreover, the average reproductive potential of mature individuals and intensity of self-regulation processes determine population dynamics. In particularly, increasing the average value of the reproductive potential leads to destabilization of the dynamics of age group sizes. The intensity of self-regulation processes determines the nature of emerging oscillations, since scenario of stability loss of fixed points depends on the values of this parameter. It is shown that patterns of occurrence and evolution of cyclic dynamics regimes are mainly determined by the features of life cycle of individuals in population. The life cycle leading to existence of non-overlapping generation gives isolated subpopulations in different years, which results in the possibility of independent microevolution of these subpopulations and, as a result, the complex dynamics emergence of both stage structure and genetic one. Fixing various adaptive mutations will gradually lead to genetic (and possibly morphological) differentiation and to differences in the average reproductive potentials of subpopulations that give different values of equilibrium subpopulation sizes. Further evolutionary growth of reproductive potentials of limited subpopulations leads to their number fluctuations which can differ in both amplitude and phase.

  9. В работе рассматривается метод исследования панельных данных, основанный на использовании агломеративной иерархической кластеризации — группировки объектов на основании сходства и разли- чия их признаков в иерархию вложенных друг в друга кластеров. Применялись 2 альтернативных способа вычисления евклидовых расстояний между объектами — расстояния между усредненными по интервалу наблюдений значениями и расстояния с использованием данных за все рассматриваемые годы. Сравнивались 3 альтернативных метода вычисления расстояний между кластерами. В первом случае таким расстоянием считается расстояние между ближайшими элементами из двух кластеров, во втором — среднее по парам элементов, в третьем — расстояние между наиболее удаленными элементами. Исследована эффективность использования двух индексов качества кластеризации — индекса Данна и Силуэта для выбора оптимального числа кластеров и оценки статистической значимости полученных решений. Способ оценивания статистической достоверности кластерной структуры заключался в сравнении качества кластеризации, на реальной выборке с качеством кластеризаций на искусственно сгенерированных выборках панельных данных с теми же самыми числом объектов, признаков и длиной рядов. Генерация производилась из фиксированного вероятностного распределения. Использовались способы симуляции, имитирующие гауссов белый шум и случайное блуждание. Расчеты с индексом Силуэт показали, что случайное блуждание характеризуется не только ложной регрессией, но и ложной кластеризацией. Кластеризация принималась достоверной для данного числа выделенных кластеров, если значение индекса на реальной выборке оказывалось больше значения 95%-ного квантиля для искусственных данных. В качестве выборки реальных данных использован набор временных рядов показателей, характеризующих производство в российских регионах. Для этих данных только Силуэт показывает достоверную кластеризацию на уровне $p < 0.05$. Расчеты также показали, что значения индексов для реальных данных в целом ближе к значениям для случайных блужданий, чем для белого шума, но имеют значимые отличия и от тех, и от других. Визуально можно выделить скопления близко расположенных друг от друга в трехмерном признаковом пространстве точек, выделяемые также в качестве кластеров применяемым алгоритмом иерархической кластеризации.

    Kirilyuk I.L., Sen'ko O.V.
    Assessing the validity of clustering of panel data by Monte Carlo methods (using as example the data of the Russian regional economy)
    Computer Research and Modeling, 2020, v. 12, no. 6, pp. 1501-1513

    The paper considers a method for studying panel data based on the use of agglomerative hierarchical clustering — grouping objects based on the similarities and differences in their features into a hierarchy of clusters nested into each other. We used 2 alternative methods for calculating Euclidean distances between objects — the distance between the values averaged over observation interval, and the distance using data for all considered years. Three alternative methods for calculating the distances between clusters were compared. In the first case, the distance between the nearest elements from two clusters is considered to be distance between these clusters, in the second — the average over pairs of elements, in the third — the distance between the most distant elements. The efficiency of using two clustering quality indices, the Dunn and Silhouette index, was studied to select the optimal number of clusters and evaluate the statistical significance of the obtained solutions. The method of assessing statistical reliability of cluster structure consisted in comparing the quality of clustering on a real sample with the quality of clustering on artificially generated samples of panel data with the same number of objects, features and lengths of time series. Generation was made from a fixed probability distribution. At the same time, simulation methods imitating Gaussian white noise and random walk were used. Calculations with the Silhouette index showed that a random walk is characterized not only by spurious regression, but also by “spurious clustering”. Clustering was considered reliable for a given number of selected clusters if the index value on the real sample turned out to be greater than the value of the 95% quantile for artificial data. A set of time series of indicators characterizing production in the regions of the Russian Federation was used as a sample of real data. For these data only Silhouette shows reliable clustering at the level p < 0.05. Calculations also showed that index values for real data are generally closer to values for random walks than for white noise, but it have significant differences from both. Since three-dimensional feature space is used, the quality of clustering was also evaluated visually. Visually, one can distinguish clusters of points located close to each other, also distinguished as clusters by the applied hierarchical clustering algorithm.

  10. Предложен метод отображения промежуточных представлений C-, C++-программ в пространство векторов (эмбеддингов) для оценки производительности программ на этапе компиляции, без необходимости исполнения. Использование эмбеддингов для данной цели позволяет не проводить сравнение графов исследуемых программ непосредственно, что вычислительно упрощает задачу сравнения программ. Метод основан на серии трансформаций исходного промежуточного представления (IR), таких как: инструментирование — добавление фиктивных инструкций в оптимизационном проходе компилятора в зависимости от разности смещений в текущей инструкции обращения к памяти относительно предыдущей, преобразование IR в многомерный вектор с помощью технологии IR2Vec с понижением размерности по алгоритму t-SNE (стохастическое вложение соседей с t-распределением). В качестве метрики производительности предлагается доля кэш-промахов 1-го уровня (D1 cache misses). Приводится эвристический критерий отличия программ с большей долей кэш-промахов от программ с меньшей долей по их образам. Также описан разработанный в ходе работы проход компилятора, генерирующий и добавляющий фиктивные инструкции IR согласно используемой модели памяти. Приведено описание разработанного программного комплекса, реализующего предложенный способ оценивания на базе компиляторной инфраструктуры LLVM. Проведен ряд вычислительных экспериментов на синтетических тестах из наборов программ с идентичными потоками управления, но различным порядком обращений к одномерному массиву, показано, что коэффициент корреляции между метрикой производительности и расстоянием до эмбеддинга худшей программы в наборе отрицателен вне зависимости от инициализации t-SNE, что позволяет сделать заключение о достоверности эвристического критерия. Также в статье рассмотрен способ генерации тестов. По результатам экспериментов, вариативность значений метрики производительности на исследуемых множествах предложена как метрика для улучшения генератора тестов.

    Zavodskikh R.K., Efanov N.N.
    Performance prediction for chosen types of loops over one-dimensional arrays with embedding-driven intermediate representations analysis
    Computer Research and Modeling, 2023, v. 15, no. 1, pp. 211-224

    The method for mapping of intermediate representations (IR) set of C, C++ programs to vector embedding space is considered to create an empirical estimation framework for static performance prediction using LLVM compiler infrastructure. The usage of embeddings makes programs easier to compare due to avoiding Control Flow Graphs (CFG) and Data Flow Graphs (DFG) direct comparison. This method is based on transformation series of the initial IR such as: instrumentation — injection of artificial instructions in an instrumentation compiler’s pass depending on load offset delta in the current instruction compared to the previous one, mapping of instrumented IR into multidimensional vector with IR2Vec and dimension reduction with t-SNE (t-distributed stochastic neighbor embedding) method. The D1 cache miss ratio measured with perf stat tool is considered as performance metric. A heuristic criterion of programs having more or less cache miss ratio is given. This criterion is based on embeddings of programs in 2D-space. The instrumentation compiler’s pass developed in this work is described: how it generates and injects artificial instructions into IR within the used memory model. The software pipeline that implements the performance estimation based on LLVM compiler infrastructure is given. Computational experiments are performed on synthetic tests which are the sets of programs with the same CFGs but with different sequences of offsets used when accessing the one-dimensional array of a given size. The correlation coefficient between performance metric and distance to the worst program’s embedding is measured and proved to be negative regardless of t-SNE initialization. This fact proves the heuristic criterion to be true. The process of such synthetic tests generation is also considered. Moreover, the variety of performance metric in programs set in such a test is proposed as a metric to be improved with exploration of more tests generators.

Pages: « first previous next last »

Indexed in Scopus

Full-text version of the journal is also available on the web site of the scientific electronic library eLIBRARY.RU

The journal is included in the Russian Science Citation Index

The journal is included in the RSCI

International Interdisciplinary Conference "Mathematics. Computing. Education"