Результаты поиска по 'отбор данных':
Найдено статей: 14
  1. От редакции
    Компьютерные исследования и моделирование, 2018, т. 10, № 4, с. 379-381
    Editor's note
    Computer Research and Modeling, 2018, v. 10, no. 4, pp. 379-381
    Views (last year): 36.
  2. От редакции
    Компьютерные исследования и моделирование, 2020, т. 12, № 3, с. 471-473
    Editor's note
    Computer Research and Modeling, 2020, v. 12, no. 3, pp. 471-473
  3. От редакции
    Компьютерные исследования и моделирование, 2021, т. 13, № 1, с. 5-8
    Editor's note
    Computer Research and Modeling, 2021, v. 13, no. 1, pp. 5-8
  4. От редакции
    Компьютерные исследования и моделирование, 2024, т. 16, № 2, с. 245-248
    Editor’s note
    Computer Research and Modeling, 2024, v. 16, no. 2, pp. 245-248
  5. Многомерные данные, при использовании значительно большего количества признаков относительно меньшего числа наблюдений, порождают хорошо известную проблему переопределённой задачи. В связи с этим, представляется целесообразным описание данных в терминах меньшего числа мета-признаков, которые вычисляются при помощи так называемых матричных факторизаций. Такие факторизации способствуют уменьшению случайного шума при сохранении наиболее существенной информации. Три новых и взаимосвязанных метода предложены в этой статье: 1) факторизационный механизм градиентного спуска с двумя (согласно размерности микрочипа) гибкими и адаптируемыми параметрами обучения, включая явные формулы их автоматического пересчета, 2) непараметрический критерий для отбора количества факторов, и 3) неотрицательная модификация градиентной факторизации, которая не требует дополнительных вычислительных затрат в сравнении с базовой моделью. Мы иллюстрируем эффективность предложенных методов в приложении к задаче направляемой классификации данных в области биоинформатики.

    Microarray datasets are highly dimensional, with a small number of collected samples in comparison to thousands of features. This poses a significant challenge that affects the interpretation, applicability and validation of the analytical results. Matrix factorizations have proven to be a useful method for describing data in terms of a small number of meta-features, which reduces noise, while still capturing the essential features of the data. Three novel and mutually relevant methods are presented in this paper: 1) gradient-based matrix factorization with two adaptive learning rates (in accordance with the number of factor matrices) and their automatic updates; 2) nonparametric criterion for the selection of the number of factors; and 3) nonnegative version of the gradient-based matrix factorization which doesn't require any extra computational costs in difference to the existing methods. We demonstrate effectiveness of the proposed methods to the supervised classification of gene expression data.

    Citations: 4 (RSCI).
  6. Распространение устойчивых когерентных образований электромагнитного поля в нелинейных средах с меняющимися в пространстве параметрами может быть описано в рамках итераций нелинейных интегральных преобразований. Показано что для ряда актуальных геометрий задач нелинейной оптики численное моделирование путем сведения к динамическим системам с дискретным временем и непрерывными пространственными переменными, основанное на итерациях локальных нелинейных отображений Фейгенбаума и Икеды, а также нелокальных диффузионно-дисперсионных линейных интегральных преобразований, эквивалентно в довольно широком диапазоне параметров дифференциальным уравнениям в частных производных типа Гинзбурга–Ландау. Такие нелокальные отображения, представляющие собой при численной реализации произведения матричных операторов, оказываются устойчивыми численно-разностными схемами, обеспечивают быструю сходимость и адекватную аппроксимацию решений. Реалистичность данного подхода позволяет учитывать влияние шумов на нелинейную динамику путем наложения на расчетный массив чисел при каждой итерации пространственного шума, задаваемого в виде многомодового случайного процесса, и производить отбор устойчивых волновых конфигураций. Нелинейные волновые образования, описываемые данным методом, включают оптические фазовые сингулярности, пространственные солитоны и турбулентные состояния с быстрым затуханием корреляций. Определенный интерес представляют полученные данным численным методом периодические конфигурации электромагнитного поля, возникающие в результате фазовой синхронизации, такие как оптические решетки и самоорганизованные вихревые кластеры.

    Okulov A.Y.
    Numerical investigation of coherent and turbulent structures of light via nonlinear integral mappings
    Computer Research and Modeling, 2020, v. 12, no. 5, pp. 979-992

    The propagation of stable coherent entities of an electromagnetic field in nonlinear media with parameters varying in space can be described in the framework of iterations of nonlinear integral transformations. It is shown that for a set of geometries relevant to typical problems of nonlinear optics, numerical modeling by reducing to dynamical systems with discrete time and continuous spatial variables to iterates of local nonlinear Feigenbaum and Ikeda mappings and nonlocal diffusion-dispersion linear integral transforms is equivalent to partial differential equations of the Ginzburg–Landau type in a fairly wide range of parameters. Such nonlocal mappings, which are the products of matrix operators in the numerical implementation, turn out to be stable numerical- difference schemes, provide fast convergence and an adequate approximation of solutions. The realism of this approach allows one to take into account the effect of noise on nonlinear dynamics by superimposing a spatial noise specified in the form of a multimode random process at each iteration and selecting the stable wave configurations. The nonlinear wave formations described by this method include optical phase singularities, spatial solitons, and turbulent states with fast decay of correlations. The particular interest is in the periodic configurations of the electromagnetic field obtained by this numerical method that arise as a result of phase synchronization, such as optical lattices and self-organized vortex clusters.

  7. Работа посвящена проблеме создания модели со стационарными параметрами по ретроспективным данным в условиях неизвестных возмущений. Рассматривается случай, когда представительная выборка состояний объекта может быть сформирована с использованием ретроспективных данных, накопленных только в течение значительного интервала времени. При этом допускается, что неизвестные возмущения могут действовать в широком частотном диапазоне и могут иметь низкочастотные и трендовые составляющие. В такой ситуации включение в выборку данных разных временных периодов может привести к противоречиям и чрезвычайно снизить точность модели. В работе дан обзор подходов и способов согласования данных. При этом основное внимание уделено отбору данных. Дана оценка применимости различных вариантов отбора данных как инструмента снижения уровня неопределенности. Предложен метод идентификации модели объекта с самовыравниванием по данным, накопленным за значительный период времени в условиях неизвестных возмущений с широким частотным диапазоном. Метод ориентирован на создание модели со стационарными параметрами, не требующей периодической перенастройки под новые условия. Метод основан на совместном применении отбора данных и представлении данных отдельных периодов времени в виде приращений относительно начального для периода момента времени. Это позволяет уменьшить число параметров, которые характеризуют неизвестные возмущения при минимуме допущений, ограничивающих применение метода. В результате снижается размерность поисковой задачи и минимизируются вычислительные затраты, связанные с настройкой модели. Рассмотрены особенности применения метода при нелинейной модели. Метод использован при разработке модели закрытого охлаждения стали на агрегате непрерывного горячего оцинковании стальной полосы. Модель может использоваться при упреждающем управлении тепловыми процессами и при выборе скорости движения полосы. Показано, что метод делает возможным разработку модели тепловых процессов с секции закрытого охлаждения в условиях неизвестных возмущений, имеющих в том числе низкочастотные составляющие.

    The work is devoted to the problem of creating a model with stationary parameters using historical data under conditions of unknown disturbances. The case is considered when a representative sample of object states can be formed using historical data accumulated only over a significant period of time. It is assumed that unknown disturbances can act in a wide frequency range and may have low-frequency and trend components. In such a situation, including data from different time periods in the sample can lead to inconsistencies and greatly reduce the accuracy of the model. The paper provides an overview of approaches and methods for data harmonization. In this case, the main attention is paid to data sampling. An assessment is made of the applicability of various data sampling options as a tool for reducing the level of uncertainty. We propose a method for identifying a self-leveling object model using data accumulated over a significant period of time under conditions of unknown disturbances with a wide frequency range. The method is focused on creating a model with stationary parameters that does not require periodic reconfiguration to new conditions. The method is based on the combined use of sampling and presentation of data from individual periods of time in the form of increments relative to the initial point in time for the period. This makes it possible to reduce the number of parameters that characterize unknown disturbances with a minimum of assumptions that limit the application of the method. As a result, the dimensionality of the search problem is reduced and the computational costs associated with setting up the model are minimized. It is possible to configure both linear and, in some cases, nonlinear models. The method was used to develop a model of closed cooling of steel on a unit for continuous hot-dip galvanizing of steel strip. The model can be used for predictive control of thermal processes and for selecting strip speed. It is shown that the method makes it possible to develop a model of thermal processes from a closed cooling section under conditions of unknown disturbances, including low-frequency components.

  8. Бистабильность обнаруживается во множестве прикладных и теоретических исследований биологических систем (популяций, сообществ). В простейшем случае бистабильность проявляется в сосуществовании двух альтернативных устойчивых состояний равновесия системы, выбор между которыми зависит от начальных условий. Наличие бистабильности в простых моделях может привести к появлению квадростабильности при усложнении моделей, например при учете генетической, возрастной и пространственной структуры. Это обнаруживается в разных моделях и весьма разных содержательных задачах и, как правило, приводит к весьма интересным, часто контринтуитивным выводам. Обзору таких ситуаций посвящена данная работа. В ней рассмотрены бифуркации, приводящие к би- и квадростабильности в математических моделях следующих биологических объектов: система двух миграционно связанных популяций, находящихся под действием естественного отбора, все генетическое разнообразие которых представлено единственным диаллельным локусом с существенной разницей в приспособленностях для гомо- и гетерозигот; система двух миграционно связанных лимитированных популяций, описываемых моделью Базыкина или моделью Рикера; популяция с двумя стадиями развития и плотностно-зависимой регуляцией рождаемости, которая либо определяется только плотностью, либо дополнительно зависит от генетической структуры смежных поколений. Обнаружено, что все перечисленные модели имеют схожие сценарии рождения состояний равновесий, которые соответствуют формированию пространственно-временной неоднородности либо дифференциации особей разных поколений по признакам (первичной генетической дивергенции). Показано, что такая неоднородность является следствием локальной бистабильности и появляется в результате комбинации бифуркации вил (удвоения периода) и седло-узловой бифуркации.

    Frisman E.Y., Kulakov M.P.
    From local bi- and quadro-stability to space-time inhomogeneity: a review of mathematical models and meaningful conclusions
    Computer Research and Modeling, 2023, v. 15, no. 1, pp. 75-109

    Bistability is a fundamental property of nonlinear systems and is found in many applied and theoretical studies of biological systems (populations and communities). In the simplest case it is expressed in the coexistence of diametrically opposed alternative stable equilibrium states of the system, and which of them will be achieved depends on the initial conditions. Bistability in simple models can lead to quad-stability as models become more complex, for example, when adding genetic, age and spatial structure. This occurs in different models from completely different subject area and leads to very interesting, often counterintuitive conclusions. In this article, we review such situations. The paper deals with bifurcations leading to bi- and quad-stability in mathematical models of the following biological objects. The first one is the system of two populations coupled by migration and under the action of natural selection, in which all genetic diversity is associated with a single diallelic locus with a significant difference in fitness for homo- and heterozygotes. The second is the system of two limited populations described by the Bazykin model or the Ricker model and coupled by migration. The third is a population with two age stages and density-dependent regulation of birth rate which is determined either only by population density, or additionally depends on the genetic structure of adjacent generations. We found that all these models have similar scenarios for the birth of equilibrium states that correspond to the formation of spatiotemporal inhomogeneity or to the differentiation by phenotypes of individuals from different age stages. Such inhomogeneity is a consequence of local bistability and appears as a result of a combination of pitchfork bifurcation (period doubling) and saddle-node bifurcation.

  9. Рамазанов Р.Р., Соколов П.А.
    Молекулярно-динамическое исследование комплексов ДНК-аптамера с АМФ и ГМФ
    Компьютерные исследования и моделирование, 2021, т. 13, № 6, с. 1191-1203

    В данной работе при помощи метода молекулярной динамики проводится сравнительное исследование конформационной стабильности ДНК-аптамера к аденозиновым производным в свободном состоянии и в комплексе с молекулами АМФ и ГМФ. Показано, что в свободном состоянии структура внутренней петли шпильки ДНК-аптамера за счет особой упаковки гуанинов закрывает полость сайта связывания от внешних лигандов, при этомв озникает условие специфичного отбора молекул аденозинового производного в сравнении с гуанином. В дополнение к имеющимся в литературе выявлены новые факторы стабилизации комплекса АМФ и аптамера — водородные связи между О3’ атома рибозы лигандов с кислородом ближайшей фосфатной группы. Также показано, что гуанины, которые образуют водородные связи с АМФ внутри сайта связывания, дополнительно стабилизируются водородными связями с противолежащими по цепи фосфатными группами. Предложенная схема качественно соответствует экспериментальным данным, согласно которым аптамер в растворе обретает конформацию шпильки с формированием сайта связывания, при этом образованный сайт проявляет высокую специфичность при взаимодействии только с аденозиновыми производными.

    Ramazanov R.R., Sokolov P.A.
    Molecular dynamics study of complexes of a DNA aptamer with AMP and GMP
    Computer Research and Modeling, 2021, v. 13, no. 6, pp. 1191-1203

    This study is devoted to a comparative study of the conformational stability of the DNA aptamer to adenosine derivatives in a free state and in a complex with AMP and HMP molecules by use of molecular dynamics. It was shown that, in the free state, the structure of the inner loop of the DNA aptamer hairpin, due to the special packing of guanines, closes the cavity of the binding site from external ligands, and the condition for the specific selection of adenosine derivatives in comparison with guanine arises. New stabilization factors of the AMP and aptamer complex have been revealed — hydrogen bonds between the O3’ of the ribose atom of the ligands with the oxygen of the nearest phosphate group. It was also shown that guanines, which form hydrogen bonds with AMP within the binding site, are additionally stabilized by hydrogen bonds with phosphate groups opposing along the chain. The proposed scheme is in qualitative agreement with the experimental data, according to which the aptamer in solution acquires a hairpin conformation with the formation of a binding site, while the formed site exhibits high specificity when interacting only with adenosine derivatives.

  10. Тиньков О.В., Полищук П.Г., Хачатрян Д.С., Колотаев А.В., Балаев А.Н., Осипов В.Н., Григорьев В.Ю.
    Количественный анализ «структура – противоопухолевая активность» и рациональный молекулярный дизайн бифункциональных VEGFR-2/HDAC-ингибиторов
    Компьютерные исследования и моделирование, 2019, т. 11, № 5, с. 911-930

    Ингибиторы гистондеацетилаз (HDACi) рассматриваются в качестве перспективного класса препаратов для лечения рака из-за их влияния на рост клеток, дифференцировку и апоптоз. Ангиогенез играет важную роль в росте солидных опухолей и развитии метастазов. Фактор роста эндотелия сосудов (VEGF) является ключевым ангиогенным агентом, который секретируется злокачественными опухолями, что индуцирует пролиферацию и миграцию эндотелиальных клеток сосудов. В настоящее время наиболее перспективной стратегией в борьбе с онкологическими заболеваниями является создание гибридных лекарств, одновременно действующих на несколько физиологических мишеней. Значительный интерес с точки зрения создания бифункциональных противоопухолевых средств представляют соединения, содержащие одновременно N-фенил-4-аминохиназолин и гидроксамовую кислоту, так как данные фрагменты по отдельности присутствуют в уже успешно применяемых противоопухолевых лекарственных средствах. В этой связи в ходе литературного анализа была сформирована выборка из 42 соединений, содержащих указанные молекулярные фрагменты и обладающих экспериментальными данными по ингибированию HDAC, VEGFR-2 и росту клеток рака легкого человека MCF-7. С использованием симплексных дескрипторов и метода опорных векторов (Support Vector Machine, SVM) для указанной выборки, предварительно разделенной на обучающий и тестовый наборы, были построены удовлетворительные (R2test = 0.64–0.87) модели количественной связи «структура–активность» (Quantitative Structure- Activity Relationship, QSAR). Для полученных QSAR-моделей была проведена структурная интерпретация. Было оценено согласованное влияние различных молекулярных фрагментов на увеличение противоопухолевой активности исследуемых соединений. Среди заместителей N-фенильного фрагмента можно выделить положительный вклад брома в пара-положении для всех трех видов активности. По результатам интерпретации был проведен рациональный молекулярный дизайн и предложены перспективные соединения. Для сравнительного QSAR-исследования использованы физико-химические дескрипторы, рассчитываемые программой HYBOT, метод случайного леса (Random Forest, RF), а также онлайн-версия экспертной системы OCHEM (https://ochem.eu). При моделировании OCHEM были выбраны PyDescriptor-дескрипторы и метод экстремального градиентного бустинга. Кроме того, полученные с помощью экспертной системы OCHEM модели были использованы для виртуального скрининга 300 соединений с целью отбора перспективных VEGFR-2/HDAC-ингибиторов для последующего синтеза и испытаний.

    Tinkov O.V., Polishchuk P.G., Khachatryan D.S., Kolotaev A.V., Balaev A.N., Osipov V.N., Grigorev B.Y.
    Quantitative analysis of “structure – anticancer activity” and rational molecular design of bi-functional VEGFR-2/HDAC-inhibitors
    Computer Research and Modeling, 2019, v. 11, no. 5, pp. 911-930

    Inhibitors of histone deacetylases (HDACi) have considered as a promising class of drugs for the treatment of cancers because of their effects on cell growth, differentiation, and apoptosis. Angiogenesis play an important role in the growth of most solid tumors and the progression of metastasis. The vascular endothelial growth factor (VEGF) is a key angiogenic agent, which is secreted by malignant tumors, which induces the proliferation and the migration of vascular endothelial cells. Currently, the most promising strategy in the fight against cancer is the creation of hybrid drugs that simultaneously act on several physiological targets. In this work, a series of hybrids bearing N-phenylquinazolin-4-amine and hydroxamic acid moieties were studied as dual VEGFR-2/HDAC inhibitors using simplex representation of the molecular structure and Support Vector Machine (SVM). The total sample of 42 compounds was divided into training and test sets. Five-fold cross-validation (5-fold) was used for internal validation. Satisfactory quantitative structure—activity relationship (QSAR) models were constructed (R2test = 0.64–0.87) for inhibitors of HDAC, VEGFR-2 and human breast cancer cell line MCF-7. The interpretation of the obtained QSAR models was carried out. The coordinated effect of different molecular fragments on the increase of antitumor activity of the studied compounds was estimated. Among the substituents of the N-phenyl fragment, the positive contribution of para bromine for all three types of activity can be distinguished. The results of the interpretation were used for molecular design of potential dual VEGFR-2/HDAC inhibitors. For comparative QSAR research we used physicochemical descriptors calculated by the program HYBOT, the method of Random Forest (RF), and on-line version of the expert system OCHEM (https://ochem.eu). In the modeling of OCHEM PyDescriptor descriptors and extreme gradient boosting was chosen. In addition, the models obtained with the help of the expert system OCHEM were used for virtual screening of 300 compounds to select promising VEGFR-2/HDAC inhibitors for further synthesis and testing.

Pages: next

Indexed in Scopus

Full-text version of the journal is also available on the web site of the scientific electronic library eLIBRARY.RU

The journal is included in the Russian Science Citation Index

The journal is included in the RSCI

International Interdisciplinary Conference "Mathematics. Computing. Education"