Линейная регрессивная модель

       Содержание             1.Описание задания       2     2.Линейная регрессивная модель     3     3.Построение степной регрессивной модели   5     4. Показательная регрессивная модель    7          Выводы         10

  Список литературы       12 

     1. ОПИСАНИЕ ЗАДАНИЯ 

     На  основании данных нижеприведенной таблицы построить линейное и степенное уравнения регрессии.

     Для построенных уравнений вычислить:

  1. коэффициент корреляции;
  2. коэффициент детерминации;
  3. дисперсионное отношение Фишера;
  4. стандартные ошибки коэффициентов регрессии;
  5. t — статистики Стьюдента;
  6. доверительные границы коэффициентов регрессии;
  7. усредненное значение коэффициента эластичности;
  8. среднюю ошибку аппроксимации.

Имеются данные за 5 лет по области об обеспечении жильем вынужденных переселенцев. Y-число семей, получивших жилье(тыс.чел); х- всего нуждающихся(тыс.чел).

Таблица 1.                          1) для характеристики зависимости у от х рассчитываются параметры следующих функций (линейной, степенной, показательной, равносторонней гиперболы).

     2) оценивается каждая модель через  среднюю  ошибку аппроксимации  А и F- критерии Фишера.

                                                                                                                                                                                                                                                                                                            2.ЛИНЕЙНАЯ РЕГРЕССИВНАЯ МОДЕЛЬ

                 Для расчета параметров а и  b линейной регрессии у=а+b∙x  ,решаем  систему нормальных уравнений  относительно а и b:

n∙a+b∙∑x=∑y

                                                        yx- y∙x

a∙∑x+b∙∑x²=∑y∙x  получаем  b=       σ²x

табл.№2

год у х ух ŷx у – ŷx Аi
2001 21.5 28.3 608.45 800.89 462.25 21.96 -0.46 2.1
2002 21.8 31.2 680.16 973.44 475.24 21.35 0.45 2.1
2003 19.2 27.9 535.68 778.41 368.64 22.04 -2.84 14.8
2004 17.6 31.4 552.64 985.96 309.76 21.31 -3.71 21.1
2005 23.8 45.6 1085.28 2079.36 566.44 18.33 5.47 22.9
Итого 103.9 164.4 3462.21 5618.06 2182.33     63
Среднее значение 20.78 32.88 692.44 1123.61 436.47     12.6
σ 2.158 6.5199            
σ² 4.66 42.51            

 

Дисперсия получается, по формуле 

                       1

 σy²= n   ∑(yi-y)²

                                                                                    σy²=437.47-20.782=4.66          σх²=1123.61-32.882=42.51         ух-у∙х

b=     σ²x        =(692.44-20.78*32.88)/ 42.51=0.21                   а= у-b∙x=20.78+0.2164*32.88=27.9        уравнение регрессии ŷ=100,9-0.21х

ŷ2001=27.9-0.21∙28.3=21.96

ŷ2002=27.9-0,21∙31.2=21.35

ŷ2003=27.9-0.21*27.9=22.04

ŷ2004=27.9-0,21*31.4=21.31

ŷ2005=27.99-0,21*45.6=18.33          

Считаем линейный коэффициент парной корреляции

rху=b∙σx ∕ σy=0.21*6.5199/5.5025=0.24                 rху²= 0.242=0.0576 коэффициент детерминации.     Вариация результата на 57% объясняется вариацией фактора х. Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчетные) значения ŷx и занесем их в таблицу. Найдем величину средней ошибки аппроксимации:                   

      |yixi|

  Аi=     yi     *100% 

А2001=|-0.46|/21.5*100%=2.1%

А2002=0.45/21.8*100%=2.1%

А2003=|-2.84| / 19.2*100%=14.8%

А2004=|-3.71|/17.6*100%=21.1%

А2005=5.47 /23.8*100%=22.9% 

          В среднем расчетные значения  отклоняются от фактических на 12.6%

По каждому  наблюдению вычислим величину отклонения. Полученные данные занесем в таблицу.          Рассчитываем F критерий                       ∑(ỹx-y)²/m                                                             r²xy

Fфакт=                                                =                       =0,0576/(1-0,0576)*(5-2)=0.19

                    ∑(y-ỹ)² /(n-m-1)           1-r²xy   (n-2) 

  т.к  Fтабл.α=0,05 =10,13 следовательно Fтабл> Fфакт отсюда следует, что гипотеза Но принимается. Этот результат можно объяснить сравнительно невысокой теснотой выявленной зависимости и небольшим числом наблюдений.                                                                                                                                                                                                                                                                3.ПОСТРОЕНИЕ СТЕПЕННОЙ РЕГРЕССИВНОЙ МОДЕЛИ 

          У=а*х предшествует процедура  линеаризации переменных. Линеаризация  производится путем логарифмирования  обеих частей уравнения:

Lg y=lg a+b* lg x;

Y=C+b*X  где

Y=lg y.,C= lg a., X= lg x

Табл.№3 
 

№ п/п Y X YX ŷx yix (yix)² Ai
2001 1,33 1,45 1,9285 1,7689 2.1025 20,83 0,67 0,449 3,12
2002 1,34 1,49 1,9966 1,7956 2,2201 22.97 -1,17 1,369 5,37
2003 1,28 1,44 1,8432 1,6384 2,0736 20,54 -1,34 1,796 6,98
2004 1,25 1,50 1,875 1,5625 2,25 23,11 -5,51 30,36 31,31
2005 1,38 1,66 2,2908 1,9044 2,7556 33,57 -9,77 95,46 41,05
Итого 6,58 7,54 9,9341 8,6698 11,402     174,97 87,83
Сред.знач 1,316 1,508 1,98682 1,7339 2,2804     34,99 17,57
σ 0,0448 0,0793              
σ² 0,0020 0,0063              

                                                                                                                                                            σ²x= n   ∑(хi-х)²=2,2804-1,5082=0,0063       σy²= n   ∑(yi-y)²=1,7339-1,731892=0,0020       вычислим значения С и b по формуле: 

b=  yx-y∙x    =(1,98682-1,316*1,508)/0,0063=0,36825     С=Y+b∙X=1,316+0,36825*1,508=1,8713                       Получим линейное уравнение  Ỹ=1,8713-0,36825*Х, после потенцировании

                                                             1,8713         0.36825                              0.36825

получим: ŷ=10     *х  =315,7    *х

Подставляя  в данное уравнение фактические  значения х, получаем теоритические  значения результата ŷx. По ним рассчитываем показатели: тесноты связи – индекс корреляции ρxy и среднюю ошибку аппроксимации Аi

          

          1.8713

Ŷ2001=10  *28.3=20,83

         1,8713

Ŷ2002=10   *31,2=22,97

         1,8713

Ŷ2003=10   *27,9=20,54

         1,8713

Ŷ2004=10   *31,4=23,11

         1,8713

Ŷ2005=10   *45,6=33,57 далее рассчитаем Аi 

        l                        (yi-ỹхi)

А=   n    ∑  Аi =          уi           ∙100%

                                                                  А2001=0,67/21,5*100%=3,12%

         А2002=1,17/21,8*100%=5,37%

         А2003=1,34/19,2*100%=6,98%

        А2004=5,51/17,6*100%=31,31%

       А2005=9,77/23,8*100%=41,05% 

ρxy=√ l-(∑(yiх) ² ∕ (∑(y-yср)²=√ l-34,99/4,66=0,27     определим коэффициент по формуле детерминации:

xy=(Pxy)²=(0,27)²=0,0729        Характеристика степенной модели указывают, что она несколько лучше линейной функции описывает взаимосвязь.                                                                                                                                                                             4.ПОКАЗАТЕЛЬНАЯ РЕГРЕССИВНАЯ МОДЕЛЬ

            Построению уравнения показательной  кривой у=а ·bx предшествует процедура  линеаризации переменных при  логарифмировании обеих частей  уравнения:

Lg y=lg a+x*lgb

Y=C+Bx  где,

Y=lg y., C=lg a., B=lgb

Табл.№4

год Y X YX ŷx yix (yix)² Ai
2001 1,33 28,3 37,639 1,7689 800,89 20,18 1,32 1,742 6,14
2002 1,34 31,2 41,808 1,7956 973,44 22,91 -1,11 1,232 5,09
2003 1,28 27,9 35,712 1,6384 778,41 20,24 -1,04 1,081 5,42
2004 1,25 31,4 39,25 1,5625 985,96 22,84 -5,24 27,46 29,77
2005 1,38 45,6 62,928 1,9044 2079,36 33,46 -9,66 93,32 40,93
Итого 6,58 164,4 217,337 8,6698 5618,06 119,63   124,84 87,35
Сред.знач 1,316 32,88 47,467 1,7339 1123,61     24,967 17,47
σ 0,046 6,52              
σ² 0,0021 42,52              

 
 

Значения  параметров регрессии А. и В составили: 

b=   Υ·x - Υ· x   =(47,467-1,316*32,88)/42,52=0,0987     

           σ²x

                                                                              А=Υ-В * х=1,316+0,0987*32,88=4,5612      Получено линейное уравнение : Ỹ=4,516-0,0987* х        рассчитаем Аi 
 

        l                        (yi-ỹхi)

А=   n    ∑  Аi =          уi           ∙100% 
 

А2001=1,32/21,5*100%=6,14%

А2002=1,11/21,8*100%=5,09%

А2003= 1,04/19,2*100%=5,42%

А4=5,24/17,6*100%=29,77%

А2005=9,66/23,8*100%=40,93% 

Аi=17,47% 

Тесноту связи оцениваем через индекс корреляции:

ρxy=√ l-(∑(yiх) ² ∕ (∑(y-yср)²=√l-24,967/4,66=0,26

Связь умеренная, но немного хуже чем в  предыдущем случае.

Коэффициент детерминации : r²xy=(Pxy)²=(0,26)²=0,068    Аi=17,47%. Показательная функция чуть хуже, чем степенная- она описывает изучаемую зависимость.

РЕГРЕССИВНАЯ  МОДЕЛЬ РАВНОСТОРОННЕЙ ГИПЕРБОЛЫ.

                                                                                    1

     Уравнение равносторонней  гиперболы у=а+b х  линеаризуется  при замене 

   

       1

Z=  х   , тогда уравнение равносторонней гиперболы принимает следующий вид: у=а+b*z

Табл.№5

№ п/п Y Z YZ ŷz yiz (yiz)² Ai
1 21,5 0,035 0,75 0,001225 462,25 22,60 -1,1 1,21 5,12
2 21,8 0,032 0,68 0,001024 475,24 21,01 0,79 0,63 3,62
3 19,2 0,036 0,69 0,001296 368,64 23,11 -3,91 15,28 20,36
4 17,6 0,032 0,56 0,001024 309,76 21,01 -3,41 11,62 19,38
5 23,8 0,022 0,52 0,000484 566,44 15,99 7,81 60,99 32,81
Итого 103,9 0,157 3,2 0,005053 2182,33 103,72 0,18 89,73 81,29
Сред

знач

20,78 0,0314 0,64 0,001010 436,47     17,95 16,26
σ 2,16 0,0049              
σ² 4,66 0,0000246              

         1                      

  σy²= n   ∑( yi – y  )²=436.47-20,782=4,66       σ²z=0,0010106-0,03142=0,0000246        значения параметров регрессии а и b составили: 
 

b= y·z   -   y  · z    =(0,64-20,78*0,0314)/0,0000246=508,13    

              σ²z

                                                                                        

а=y  -  b  *  z  =20,78-508,13*0,0314=4,82       получено уравнение                           

ŷ=4,82+508,13*z          ŷ2001=4,82+508,13*0,035=22,60

         ŷ2002=4,82+508,13*0,032=21,01

        ŷ2003=4,82+508,13*0,036=23,11

        ŷ2004=4,82+508.13*,032=21,01

        ŷ2005=4,82+508,13*0,022=15,99

Индекс  корреляции: ρxy=√ l-(∑(yiх) ² ∕ (∑(y-yср)²=√l-17,95/4,66 =0,19  Связь тесная, но хуже чем в предыдущих моделях.

xy=(Pxy)²=(0,19)²=0,361                       

 А=16,26%, т.е остается на допустимом  уровне.

                P²xy           n-m-l          0,361                 0,331

Fфакт=   l-P²xy   *     m        =   l- 0,361  *3  =     0,3184  *3 =3,11 
 

Т.к  Fтабл.α=0,05=10,13 следовательно Fфакт< Fтабл  отсюда следует, что гипотеза Но принимается. Этот результат можно объяснить сравнительно невысокой теснотой выявленной зависимости и небольшим числом наблюдений.

                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          Вывод            В заключении проанализируем полученные в курсовой работе результаты исследований и выберем рабочую модель.

    Экономический анализ моделей, по результатам исследования получил следующие значения:

    Коэффициент парной корреляции rxy= 0,24 у линейной модели;

    Индекса корреляции Pxy =0,27 у степенной модели;

    Индекса корреляции  Pxy =0,26 у показательной модели;

    Индекса корреляции  Pxy =0,19 у модели равносторонней гиперболы.

    Данные  индексы показывают, что связь  у(х) (среднесуточная производительность труда от стоимости основных производственных фондов) прямая, тесная,  высокая.

    С экономической точки зрения, все  модели достаточно хороши, т.е у всех моделей при увеличении расходов на подготовку и освоение производства – производительность труда увеличивается. Это значит что на данных предприятиях есть резервы для расширения производства, резервы для введения новых технологий с целью увеличения прибыли.

     Руководствуясь целью курсовой работы можно сделать вывод, что из всех рассмотренных моделей линейная модель лучше всех отражает  экономический  смысл. А теперь сравним регрессивные модели по средней ошибке аппроксимации  А ,которая показывает, на сколько фактические значения отличаются от теоретических рассчитанных по уравнению регрессии т.е у и ŷx:

    У линейной модели                       А1=12,6%;

     У степенной модели                     А2=17.5%;

    У показательной модели              А3=17,47%;

     У равносторонней гиперболы     А4=16,26%.

Средняя ошибка аппроксимации А1, А2, А3, А4 находятся в допустимом пределе.

    Вывод: чем меньше это отличие, тем ближе  теоретические значения подходят к  эмпирическим данным (лучшее качество модели). По расчетным данным моей работы показательная модель имеет лучшее качество. Сравнивая регрессивные модели по коэффициенту детерминации r²xy линейной, степенной. Показательной и равносторонней гиперболы видим, что статистические характеристики модели равносторонней гиперболы превосходят аналогичные характеристика других моделей, а именно : коэффициент детерминации у линейной модели равен 0,576; у степенной 0,729; у показательной 0,68 и у равносторонней гиперболы 0,361. Это означает, что факторы, вошедшие в модель равносторонней гиперболы. Объясняют изменение в обеспечении жильем на 57.6%, тогда как факторы, вошедшие в линейную модель на 72,9%, в показательную на 68% и в степенную на 36,1%, следовательно, значения, полученные с помощью коэффициента детерминации модели равносторонней гиперболы более близки к фактическим. На основании этого, модель равносторонней гиперболы выбирается за рабочую модель в данном примере.                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          Список литературы

  1. Кравченко Г.В. Эконометрика: Компьютерный практикум: Учебное пособие Барнаул, 2008. - 56 с.
  2. Практикум по эконометрике: Учебное пособие / Под ред. Елисеевой И.И. - М.: Финансы и статистика, 2004. - 192с

Эконометрика: Учебник / Под ред. Елисеевой И.И. - М.: Финансы  и статистика, 2004 . - 344с.

  1. Магнус Я., Катышев П. К., Пересецкий А.А. Эконометрика (начальный курс). М., Изд-во Дело, 2007. – 352 с.
  2. Эконометрика. Методические указания по изучению дисциплины и выполнению контрольной работы и аудиторной работы на ПЭВМ   М.: Вузовский учебник, 2005. - 122 с.

Линейная регрессивная модель