Интервальный вариационный ряд

Содержание:

Введение

  1. Исходные данные
  2. Интервальный вариационный ряд (табл. 1)
  3. Построение гистограммы
  4. Нахождение оценок числовых характеристик генеральной совокупности Х и точечных оценок неизвестных параметров выдвинутого закона (табл. 2)
  5. Нахождение теоретической функции f(x) и ее построение на гистограмме (табл. 3)
  6. Нахождение интегральных оценок математического ожидания и дисперсии.
  7. Проверка критерия Пирсона (табл.4)
  8. Вывод

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение

Математическая статистика – это раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. При этом статистическими данными называются сведения о числе объектов и какой-либо более или менее обширной совокупности, обладающих теми или иными признаками.

Задачи математической статистики:

      • указания методов сбора и группировки опытных данных; различают два способа отбора:

     -простые случайные отборы (повторные  или нет);

     - типичные отборы (видовые, серийные,    

         механические и др.)

      • разработка методов анализа статистических данных.

 

Генеральной совокупностью называется вся подлежащая изучению совокупность объектов (наблюдений) X, Y, …, Z. Выборочной совокупностью, или просто выборкой называется совокупность случайно отобранных из генеральной совокупности объектов и обозначается (x1,…xk), (y1,…yk). Объемом совокупности (выборочной или генеральной) называется число объектов в этой совокупности.

 

 

 

 

 

 

 

 

Исходные данные

Вариант №41

35,1

23,9

36,1

31,2

37,3

27,6

24,0

35,5

30,3

30,9

17,3

21,3

30,1

28,3

32,0

26,5

35,3

22,5

31,8

19,3

18,5

25,4

24,1

37,5

13,1

31,3

25,0

23,0

26,5

25,6

22,9

29,0

35,9

6,0

34,4

26,3

44,0

27,1

17,7

20,2

26,6

40,7

43,2

24,5

27,8

26,0

24,8

26,9

31,3

31,6

32,8

41,3

37,6

27,8

24,7

20,7

30,4

11,2

9,8

22,3

38,3

36,8

26,4

43,5

30,6

27,0

28,1

19,3

35,9

22,8

16,0

45,6

31,1

40,3

27,8

25,5

27,8

25,7

23,2

18,5

37,8

30,1

19,9

31,8

29,2

34,7

19,9

38,1

31,2

38,0


 

Интервальный вариационный ряд

После того, как из генеральной совокупности  извлечена выборка, ее объекты обследуют  по отношению к генеральной совокупности, для этого их подвергают обработке.

Обработка начинается с ранжирования элементов  выборки.

Ранжирование – это процесс преобразования простого статистического ряда на основе упорядочения (группирования) числовых значений элементов ряда по убыванию

x≤x2≤x3≤…≤xn

Различные наблюдаемые значения признака (случайной  величины Х) называют вариантами (обозначаем их через xi). Последовательность вариант, записанных в порядке возрастания или убывания с соответствующими  им частотами называется вариационным рядом. Вариационный ряд называется интервальным  (непрерывным), если его значения могут отличаться одно от другого на сколь угодно малую величину.

6,0

9,8

11,2

13,1

16,0

17,3

17,7

18,5

18,5

19,3

19,3

19,9

19,9

20,2

20,7

20,7

21,3

22,3

22,5

22,8

22,9

23,0

23,2

23,9

24,0

24,1

24,5

24,7

24,8

25,0

25,4

25,5

25,6

25,7

26,0

26,3

26,4

26,5

26,5

26,6

26,9

27,0

27,1

27,6

27,8

27,8

27,8

27,8

28,1

28,3

29,0

29,2

30,1

30,1

30,3

30,4

30,6

30,9

31,1

31,2

31,2

31,3

31,3

31,6

31,8

32,0

32,8

34,4

34,7

35,1

35,3

35,5

35,9

35,9

36,1

36,8

37,3

37,5

37,6

37,8

38,0

38,1

38,3

40,3

40,7

41,3

43,2

43,5

44,0

45,6


 

Для построения интервального  вариационного ряда необходимо:

  1. Найти размах выборки:

R=Xmax – Xmin;

R=45,6-6,0=39,6

  1. Назначить число частичных интервалов k.

k = 10;

  1. Рассчитать шаг разбиения (для одинаковой длины интервалов) по формуле:

∆= R/k

и округляем  до ближайшего целого числа:

∆=4;

α1=6.

Числа показывающие, сколько раз  встречаются варианты из данного  интервала, называются частотами  (обозначаются mi), тогда объем выборки наз. относительными частотами

Pi=mi/n,

где n в данном случае равно 90.

Составляем  таблицу

i

i; αi+1]

mi*

pi*

hi*=pi*/∆

1

         [6,0; 10,0]

2

0,02

0,005

2

[10,0; 14,0]

2

0,02

0,005

3

 [14,0; 18,0]

3

0,03

0,008

4

[18,0; 22,0]

9

0,1

0,025

5

[22,0; 26,0]

17

0,19

0,05

6

[26,0; 30,0]

18

0,2

0,05

7

[30,0; 34,0]

16

0,18

0,045

8

[34,0; 38,0]

13

0,14

0,035

9

[38,0; 42,0]

6

0,07

0,02

10

[42,0; 46,0]

4

0,04

0,01

   

∑ = 90

∑ = 1

 

Табл. 1

где hi – плотность относительной частоты,

Хi – середина частичных интервалов.

 

Построение  гистограммы относительных частот

Графическое изображение зависимости между  величинами дает возможность представить  эту зависимость наглядно. Графики  могут служить основой для  открытия новых свойств, соотношений  и закономерностей.

Наиболее  употребительными графиками для  изображения вариационных рядов, т.е. соотношений между значениями и  соответствующими частотами или  относительными частотами, является гистограмма.

Гистограмма служит для изображения интервальных вариационных рядов и представляет собой ступенчатую фигуру из прямоугольников  с равными интервалами значений признака.

 

 


 

 

 

 

 

 

 

 

По данной гистограмме  можно выдвинуть гипотезу, что  гистограмма подчиняется нормальному закону.

 

Нахождение оценок числовых характеристик  генеральной совокупности Х и  точечных оценок неизвестных параметров выдвинутого закона

Оценкой числовой характеристики или параметра закона распределения называют всякую функцию результатов наблюдений над случайной величиной Х, с помощью которой судят о значении параметра или характеристики.

Оценка  называется точечной, если она рассмотрена одним числом или точкой.

Точечная  оценка является лишь приближенным значением неизвестного параметра и случайной величиной, зависящей от закона распределения случайной величины Х и от объема выборки n.

При вычислении точечных оценок для удобства берут не сами элементы выборки, а  середины частичных интервалов из интервального  вариационного ряда и применяют  формулу:

i*mi*

Составим таблицу

i

=

i*mi*

(

i -
)2*mi*

1

8

16

630,0

2

12

24

378,7

3

16

48

285,8

4

20

180

298,6

5

24

408

52,7

6

28

504

90,3

7

32

512

623

8

36

468

1363,1

9

40

240

1216,7

10

44

176

1330,8

   

∑=2576

∑=6270,5


Табл. 2

=25,76

=70,455

=8,4

 

 

 

 

 

 

 

Нахождение теоретической функции  f(x) и ее построение на гистограмме

i

φ(ti)

1

-2,11

0,0431

0,005

0,02

2

-1,64

0,1040

0,012

0,048

3

-1,16

0,2036

0,024

0,096

4

-0,68

0,3166

0,038

0,152

5

-0,21

0,3902

0,046

0,184

6

0,27

0,3847

0,046

0,184

7

0,74

0,3034

0,036

0,144

8

1,22

0,1895

0,022

0,088

9

1,69

0,0957

0,011

0,044

10

2,17

0,0379

0,004

0,016

 

∑=1


Табл. 3

a*

≈25,76

δ*=

=
≈8,4

Проверка критерия Пирсона

Критерий  применяется в двух целях:

-Для  сопоставления эмпирического распределения  признака с теоретическим распределением (нормальным, показательным, равномерным  либо каким-то иным законом);

-Для  сопоставления двух эмпирических  распределений одного и того  же признака.

Критерий  отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом  распределениях или в двух и более  эмпирических распределениях.

Преимущество  метода состоит в том, что он позволяет  сопоставлять распределения признаков, представленных в любой шкале, начиная  от шкалы наименований.

 

i

pi*

pi

npi*

npi

(npi* - npi)2

1

0,07

0,164

7

14,76

60,22

                4,08

2

0,1

0,152

9

13,68

21,9

1,60

3

0,19

0,184

17

16,56

0,19

0,01

4

0,2

0,184

18

16,56

2,07

0,13

5

0,18

0,144

16

12,96

9,24

0,71

6

0,14

0,088

13

7,92

25,81

3,26

7

0,11

0,06

10

5,4

21,16

3,92

 

∑ = 1

 

∑ =90

   

∑= 13,74    


Табл. 4

c2набл=13,74

c2кр=7-1-2=4, по таблице критических точек c2кр, по уровню значимости a=0,05 и числу степеней свободы c2кр=9,5.

13,74>9,5

Так как cнабл> c2кр, следовательно, произошло событие практически невозможное и гипотезу надо отвергнуть.

Нахождение  интегральных оценок математического ожидания и дисперсии

Оценки параметров позволяют  по выборке вычислить некоторые  значения, которые «приближают» неизвестные  параметры. Существует другой подход к  тому, чтобы извлечь информацию о  неизвестных параметрах. Он состоит  в том, чтобы, основываясь на данных наблюдений, определить границы, в которых  с заданной степенью достоверности  лежит неизвестный параметр.

Таким образом, доверительный интервал- это интервал, построенный с помощью случайной выборки из распределения с неизвестным параметром, такой, что он накрывает данный параметр с заданной вероятностью.

 

Доверительный интервал для математического ожидания:

ty=1,987

=(24;27,52)

Доверительный интервал для дисперсии:

=(53,6;96,8)

где V1; V2 по вероятностям p2=(1- ) и p1=(1-)/2 cсоответственно и числу степеней свободы (n-1);

p1=0,025

p2=0,975

V1=64,793

V2=116,989

 

Вывод

 В ходе расчетно-графической работы я установила, что генеральная совокупность Х распределена по нормальному закону, проверив это по критерию Пирсона. Определила параметры и числовые характеристики закона.


Интервальный вариационный ряд