All issues
- 2024 Vol. 16
- 2023 Vol. 15
- 2022 Vol. 14
- 2021 Vol. 13
- 2020 Vol. 12
- 2019 Vol. 11
- 2018 Vol. 10
- 2017 Vol. 9
- 2016 Vol. 8
- 2015 Vol. 7
- 2014 Vol. 6
- 2013 Vol. 5
- 2012 Vol. 4
- 2011 Vol. 3
- 2010 Vol. 2
- 2009 Vol. 1
-
О разложении матриц при помощи метода стохастического градиентного спуска в приложении к задаче направляемой классификации микрочипов
Компьютерные исследования и моделирование, 2013, т. 5, № 2, с. 131-140Многомерные данные, при использовании значительно большего количества признаков относительно меньшего числа наблюдений, порождают хорошо известную проблему переопределённой задачи. В связи с этим, представляется целесообразным описание данных в терминах меньшего числа мета-признаков, которые вычисляются при помощи так называемых матричных факторизаций. Такие факторизации способствуют уменьшению случайного шума при сохранении наиболее существенной информации. Три новых и взаимосвязанных метода предложены в этой статье: 1) факторизационный механизм градиентного спуска с двумя (согласно размерности микрочипа) гибкими и адаптируемыми параметрами обучения, включая явные формулы их автоматического пересчета, 2) непараметрический критерий для отбора количества факторов, и 3) неотрицательная модификация градиентной факторизации, которая не требует дополнительных вычислительных затрат в сравнении с базовой моделью. Мы иллюстрируем эффективность предложенных методов в приложении к задаче направляемой классификации данных в области биоинформатики.
Ключевые слова: матричная факторизация, ненаправляемое обучение, количество факторов, непараметрический критерий, неотрицательность, оставить одного извне, классификация.
On the stochastic gradient descent matrix factorization in application to the supervised classification of microarrays
Computer Research and Modeling, 2013, v. 5, no. 2, pp. 131-140Citations: 4 (RSCI).Microarray datasets are highly dimensional, with a small number of collected samples in comparison to thousands of features. This poses a significant challenge that affects the interpretation, applicability and validation of the analytical results. Matrix factorizations have proven to be a useful method for describing data in terms of a small number of meta-features, which reduces noise, while still capturing the essential features of the data. Three novel and mutually relevant methods are presented in this paper: 1) gradient-based matrix factorization with two adaptive learning rates (in accordance with the number of factor matrices) and their automatic updates; 2) nonparametric criterion for the selection of the number of factors; and 3) nonnegative version of the gradient-based matrix factorization which doesn't require any extra computational costs in difference to the existing methods. We demonstrate effectiveness of the proposed methods to the supervised classification of gene expression data.
-
О применении асимптотических критериев для определения числа компонент смеси вероятностных распределений
Компьютерные исследования и моделирование, 2012, т. 4, № 1, с. 45-53В статье демонстрируется практическая эффективность применения асимптотически наиболее мощных критериев проверки гипотез о числе компонент смеси в моделях добавления и расщепления компонент. Тестовые данные представляют собой выборки из различных конечных смесей нормальных законов. Проводится сравнение результатов для разнообразных уровней значимости и весов.
On application of the asymptotic tests for estimating the number of mixture distribution components
Computer Research and Modeling, 2012, v. 4, no. 1, pp. 45-53Views (last year): 1. Citations: 2 (RSCI).The paper demonstrates the efficiency of asymptotically most powerful test of statistical hypotheses about the number of mixture components in the adding and splitting component models. Test data are the samples from different finite normal mixtures. The results are compared for various significance levels and weights.
-
Математическая модель и компьютерный анализ критериев однородности зависимости «доза–эффект»
Компьютерные исследования и моделирование, 2012, т. 4, № 2, с. 267-273Данная работа посвящена сравнению двух критериев однородности: критерия χ2, основанного на таблицах сопряженности признаков 2 × 2, и критерия однородности, основанного на асимптотических распределениях суммируемых квадратичных уклонений оценок функции распределения в модели зависимости «доза–эффект». Оценка мощности критериев производится при помощи компьютерного моделирования. Для построения функций эффективности используется метод ядерной оценки регрессии, основанный на оценке Надарая–Ватсона.
Ключевые слова: модель зависимости «доза–эффект», непараметрический метод ядерной оценки регрессии, оценка Надарая–Ватсона, критерии однородности.
Mathematical model and computer analysis of tests for homogeneity of “dose–effect” dependence
Computer Research and Modeling, 2012, v. 4, no. 2, pp. 267-273Views (last year): 6.The given work is devoted to the comparison of two tests for homogeneity: chi-square test based on contingency tables of 2 × 2 and test for homogeneity based on asymptotic distributions of the summarized square error of a distribution function estimators in the model of ”dose–effect” dependence. The evaluation of test power is performed by means of computer simulation. In order to design efficiency functions the method of kernel regression estimator based on Nadaray–Watson estimator is used.
-
Критерии и сходимость фокусной аппроксимации
Компьютерные исследования и моделирование, 2013, т. 5, № 3, с. 379-394Исследуются методы решения задачи фокусной аппроксимации — приближения по точечно заданной гладкой замкнутой эмпирической кривой многофокусными лемнискатами. Анализируются критерии и сходимость разработанных методов приближения, как в вещественной, так и в комплексной интерпретации. Доказывается топологическая эквивалентность используемых критериев.
Ключевые слова: кривые, аппроксимация, лемнискаты, фокусы, критерий близости кривых, базис, форма, инвариант, алгоритм, степени свободы.
Criteria and convergence of the focal approxmation
Computer Research and Modeling, 2013, v. 5, no. 3, pp. 379-394Methods of the solution of a problem of focal approximation — approach on point-by-point given smooth closed empirical curve by multifocal lemniscates are investigated. Criteria and convergence of the developed approached methods with use of the description, both in real, and in complex variables are analyzed. Topological equivalence of the used criteria is proved.
Keywords: curves, approximation, lemniscates, foci, criterion of curves nearness, basic, shape, invariant, algorithm, freedom degrees.Views (last year): 2.
Indexed in Scopus
Full-text version of the journal is also available on the web site of the scientific electronic library eLIBRARY.RU
The journal is included in the Russian Science Citation Index
The journal is included in the RSCI
International Interdisciplinary Conference "Mathematics. Computing. Education"