Эконометрика. Парная линейная регрессия

По группе предприятий, выпускающих один и тот же вид продукции, построить функцию издержек  y=a+bx+\varepsilon различными способами и исследовать ее (пример взят из учебника И.И. Елисеевой «Эконометрика»). Данные для расчета приведены в таблице:

Номер предприятия Выпуск продукции, тыс. ед., x Затраты, млн. р., y
1 1 30
2 2 70
3 4 150
4 3 100
5 5 170
6 3 100
7 4 150

1. Рассчитайте параметры a, b непосредственно по следующим формулам:

\displaystyle b=\frac{\overline{yx}-\bar y\bar x}{\bar{x^2}-{\bar x}^2}, a=\bar y-b\bar x.

2. Рассчитайте корреляцию по формуле

\displaystyle r_{xy}=\frac{\overline{yx}-\bar y\bar x}{\sigma_x\sigma_y}

и коэффициент детерминации.

3. Постройте на одной диаграмме график парной линейной регрессии и исходные данные в виде набора точек. Пример показан на рисунке ниже.

4. Рассчитайте F-статистику по формулам

\displaystyle F=\frac{D_{fakt}}{D_{ost}}, F=(n-2)\frac{r_{xy}^2}{1-r_{xy}^2}.

Убедитесь, что значения, рассчитанные по разным формулам, совпали.

Сравните с критическим значением F-отношения и сделайте вывод о правильности нулевой гипотезы, что коэффициент регрессии равен нулю.

Для вычисления критического значения можно воспользоваться следующей функцией Excel — =F.ОБР.ПХ(0,05;1;5). Здесь 0,05 — уровень значимости нулевой гипотезы, 1- число степеней свободы при расчете факторной дисперсии, 5 =n-2=7-2 — число степеней свободы при расчете остаточной дисперсии.

5. Вычислите значения t-критерия для коэффициентов a и b, табличное значение  t-критерия, сделайте выводы о существенности коэффициентов регрессии.

\displaystyle m_b=\sqrt{\frac{\sum_{i=1}^n(y_i-{\hat y}_i)^2/(n-2)}{\sum_{i=1}^n(x_i-\bar x)^2}}\displaystyle m_a=\sqrt{\frac{\sum_{i=1}^n(y_i-{\hat y}_i)^2 \sum_{i=1}^n x_i^2}{(n-2)n\sum_{i=1}^n(x_i-\bar x)^2}},

t_b=b/m+b, t_a=a/m_a.

Табличное значение можно вычислить в Excel по формуле =СТЬЮДРАСПОБР(0,05;5). Здесь Здесь 0,05 — уровень значимости нулевой гипотезы, 5 =n-2=7-2 — число степеней свободы.

6. Вычислите коэффициент корреляции и сделайте вывод о его значимости на основе следующих формул:

\displaystyle m_r=\sqrt{\frac{1-r^2}{n-2}}, t_r=\frac{r}{\sqrt{1-r^2}}\sqrt{n-2}.

7. Проверьте полученные расчеты при помощи стандартных средств Excel:

  •  при помощи функции =ЛИНЕЙН
  • при помощи инструмента Регрессия пакета Анализ данных.

Результаты должны совпасть!

8. Постройте точечный прогноз при x=5:

  • используя уравнение регрессии;
  • используя функцию ПРЕДСКАЗ;
  • используя функция ТЕНДЕНЦИЯ.

9. Постройте интервальный прогноз.

Для этого вычисляем при прогнозном значении фактора x_k стандартную ошибку

\displaystyle m_{{\hat y}_x}=\sqrt{\frac{\sum_{i=1}^n(y_i-{\hat y}_i)^2}{(n-2)}}\sqrt{1+\frac 1n+\frac{(x_k-\bar x)^2}{\sum_{i=1}^n(x_i-\bar x)^2}}.

Тогда для прогнозируемого значения  {\hat y}_{x_k} (1-\alpha)*100 % доверительные интервалы при заданном  x_k определяются по формуле

{\hat y}_{x_k}\pm t_\alpha\cdot m_{{\hat y}_{x_k}}.

По представленной формуле найдите границы интервалов и постройте как это показано на рисунке ниже.

 

Поделиться:
  • Добавить ВКонтакте заметку об этой странице
  • Мой Мир
  • Facebook
  • Twitter
  • LiveJournal
  • FriendFeed
  • В закладки Google
  • Google Buzz
  • Яндекс.Закладки
  • StumbleUpon
  • Technorati
  • БобрДобр
  • Memori.ru
  • МоёМесто.ru