10.26102/2310-6018/2019.24.1.033
Базилевский, М.П.
Иркутский государственный университет путей сообщения
СИНТЕЗ МОДЕЛИ ПАРНОЙ ЛИНЕЙНОЙ РЕГРЕССИИ И ПРОСТЕЙШЕЙ EIV-МОДЕЛИ
SYNTHESIS OF LINEAR REGRESSION MODEL AND EIV-MODEL
МОДЕЛИРОВАНИЕ, ОПТИМИЗАЦИЯ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
2019
регрессионная модель
метод наименьших квадратов
метод наименьших полных квадратов
регрессия Деминга
EIV-модель
модель полносвязной линейной регрессии
regression model
ordinary least squares
total least squares
Deming regression
EIV-model
fully connected linear regression model
ru
2019-02-09
Journal Article
https://moit.vivt.ru/wp-content/uploads/2019/01/Bazilevskiy_1_19_1.pdf
2310-6018
Данная работа посвящена синтезу модели парной линейной регрессии и простейшей EiV-модели (Errors-In-Variables model), более известной как регрессия Деминга. EIV-модель – это регрессия, в которой все переменные содержат случайные ошибки. Такие модели имеют ряд существенных недостатков, что затрудняет работу с ними. Предлагаемый в работе синтез, названный двухфакторной моделью полносвязной линейной регрессии, не только лишен этих недостатков, но и имеет определенные достоинства. Рассмотрены основные этапы построения и анализа двухфакторных моделей полносвязной линейной регрессии. Предложенная модель полносвязной линейной регрессии имеет много общего с классической моделью множественной регрессии, однако в основе этих двух видов лежат совершенно разные подходы. Если множественная регрессия строится по принципу «независимые переменные влияют на зависимую», то принципом полносвязной регрессии является «все переменные влияют друг на друга». Установлено, что аппроксимационные способности полносвязных моделей не превосходят способностей множественных регрессий, но зато первые имеют гораздо более разнообразную интерпретацию. Разработанный синтез можно использовать при построении множественных моделей как инструмент для решения задач снижения размерности данных, устранения мультиколлинеарности и отбора информативных регрессоров.
This paper is devoted to a synthesis of pair-wise linear regression model and simplest EiV-model (Errors-In-Variables model), better known as the Deming regression. The EIV model is a regression in which all variables contain random errors. Such models have a number of significant drawbacks, which makes it difficult to work with them. The synthesis proposed in the paper, called the two-factor model of a fully connected linear regression, is not only devoid of these shortcomings, but also has certain advantages. The main stages of the construction and analysis of two-factor models of fully connected linear regression are considered. The proposed fully connected linear regression model has much in common with the classical multiple regression model; however, these two types are based on completely different approaches. If multiple regression is based on the principle “independent variables affect the dependent one”, then the principle of fully connected regression is “all variables influence each other”. It is established that the approximation abilities of fully connected models do not exceed the capabilities of multiple regressions, but the former have a much more diverse interpretation. The developed synthesis can be used in the construction of multiple models as a tool for solving problems of reducing the dimensionality of data, eliminating multicollinearity and selecting informative regressors.
№1(24) (2019)