Лабораторные работы в курсе математической статистики
9
по методу Тейла [8, 9]. Оба метода дают приблизительно одинаковые
модели. Добавив одно «загрязняющее» (резко выпадающее) наблю-
дение, построить обе модели линейной регрессии и сравнить резуль-
таты. Метод наименьших квадратов содержится в «Пакете анализа»,
метод Тейла требует вычислений «вручную», однако использова-
ние таблиц Excel позволяет достаточно легко провести расчеты
коэффициентов линейной модели по обоим методам. Для подсчета
коэффициентов непараметрической модели линейной регрессии по
методу Тейла данные о выборках необходимо расположить так, как
показано в табл. 4, и в ячейку D3 необходимо занести формулу
=(D$2–$B3)/($D1–A$3). Затем скопировать содержимое этой ячейки
во все ячейки, находящиеся над диагональю квадратной таблицы
правее столбца D (можно растянуть на всю квадратную таблицу, но в
этом случае на диагонали будут стоять значения деления 0/0).
Таблица 4
A
B
C
D
T
F
1
X
1
X
2
…
X
n
2
Y
1
Y
2
…
Y
n
3
X
1
Y
1
4
X
2
Y
2
…
…
X
n
Y
n
Еще одна особенность таблиц Excel заключается в том, что аргу-
ментом любой функции является прямоугольный диапазон таблицы.
Поэтому, чтобы найти медиану совокупности чисел, стоящих над
диагональю квадратной матрицы, необходимо предварительно, ис-
пользуя процедуру «Вырезать», превратить эту совокупность в стол-
бец или строку.
Вторая задача
— отбор наиболее информативных параметров.
Обычно при применении модели линейной регрессии исследователь
в качестве факторов использует всю доступную ему информацию.
Однако среди факторов могут оказаться такие, которые на отклик
никак не влияют. Построив такую модель, студент должен научиться
выделять те факторы, которые на отклик не влияют. Он должен по-
нимать, что построение модели линейной регрессии ничто иное, как
ортогональное проектирование вектора отклика
Y
на линейное
пространство, порожденное факторами
1
,...,
,
n
X X
и добавление к
1
,...,
n
X X
еще одного фактора
1
n
X
, ортогонального
,
Y
проекции на
новое линейное пространство не изменит.
В пакете на выходе программы линейной регрессии имеется па-
раметр
Р
-значение, который как раз и говорит о степени влияния