Решение задачи №4 по эконометрике. Таблица дисперсионного анализа

Решение задачи №4 по эконометрике. Таблица дисперсионного анализа

Вернутся к примерам решения задач по эконометрике

Задача №4. Таблица дисперсионного анализа. Условие задачи:

По 20 территориям России изучаются следующие данные (таблица): зависимость среднегодового душевого дохода у (тыс. руб.) от доли занятых тяжелым физическим трудом в общей численности занятых х1(%) и от доли экономически активного населения в численности всего населения x2 (%).

Признак Среднее значение Среднее квадратическое отклонение Характеристика тесноты связи Уравнение связи
y 112,76 31,58 Ryx1x2 = 0,773 Уx1x2 = -130,49 + 6,14 * х1 + 4,13 * х2
x1 5,4 3,34 ryx1 = 0,746 Уx1 = 74,4 + 7,1*x1
x2 50,88 1,74 ryx2 = 0.507
rx1x2 = 0.432
Yx2=-355,3+9,2*x2
 

Требуется:

1. Составить таблицу дисперсионного анализа для проверки при уровне значимости а = 0,05 статистической значимости уравнения множественной регрессии и его показателя тесноты связи.

2. С помощью частных F-критериев Фишера оценить, насколько целесообразно включение в уравнение множественной регрессии фактора х1 после фактора x2 и насколько целесообразно включение х2 после х1.

Решение:

Задача дисперсионного анализа состоит в проверке нулевой гипотезы Но о статистической незначимости уравнения регрессии в целом и показателя тесноты связи.

Анализ выполняется при сравнении фактического и табличного (критического) значений F-критерия Фишера F-табл и Fфакт. Fфакт определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы:

формула расчета F-критерия Фишера для уравнения множественной регрессии
формула расчета F-критерия Фишера для уравнения множественной регрессии

где n - число единиц совокупности;

m - число факторов в уравнении линейной регрессии.

Результаты дисперсионного анализа представлены в табл.:

Вариация результата, у Число степеней свободы Сумма квадратов отклонений, S Дисперсия на одну степень свободы, s2 F факт Fтабл а = 0,05, k1 =2, k2 = 17
Общая df = n-l = l9 19945,9
Факторная k1 = m = 2 11918,3 5959,15 12,62 3,59
Остаточная k2 = n – m - 1 = 17 8027,6 472,21 - -
 

Сравнивая Fтабл и Fфакт, приходим к выводу о необходимости отклонить гипотезу H0 и сделать вывод о статистической значимости уравнения регрессии в целом и значения R2yx1x2, так как они статистически надежны и сформировались под систематическим действием неслучайных причин. Вероятность того, что допускаются ошибки при отклонении нулевой гипотезы, не превышает 5%, и это является достаточно малой величиной.

 

Частный F-критерий Фишера оценивает статистическую целесообразность включения фактора x1 в модель после того, как в нее включен фактор х2. Частный F-критерий Фишера строится как отношение прироста факторной дисперсии за счет дополнительно включенного фактора (на одну степень свободы) к остаточной дисперсии (на одну степень свободы), подсчитанной по модели с включенными факторами х1 и х2.

Включение фактора х1 после фактора х2 оказалось статистически значимым и оправданным: прирост факторной дисперсии (в расчете на одну степень свободы) оказался существенным, т.е. следствием дополнительного включения в модель систематически действующего фактора x1, так как Fчастн x1 = 14.38 > Fтабл = 4.45.

Аналогично проверим целесообразность включения в модель дополнительного фактора х2 после включенного ранее фактора х1. Расчет выполним с использованием показателей тесноты связи R2yx1x2 и r2yx1:

Fчастн х2 = 1.73

В силу того что Fчастн х2 < Fтабл, приходим к выводу, что включение x2 после х1 оказалось бесполезным: прирост факторной дисперсии в расчете на одну степень свободы был несуществен, статистически незначим, т.е. влияние x2 не является устойчивым, систематическим. Вполне возможно было ограничиться построением линейного уравнения парной регрессии y от x1.

 

Вернутся к примерам решения задач по эконометрике

 

Выполнить дисперсионный анализ по эконометрике