Статистическая обработка данных о надежности


Министерство  образования и науки Российской Федерации

 

ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

«ОРЕНБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

 

Транспортный факультет

 

Кафедра автомобили и безопасность движения

 

 

 

 

 

ОТЧЕТ

по  расчетно-графической работе

по  дисциплине «Основы теории надежности и диагностика»

Статистическая  обработка данных о надежности

ГОУ ОГУ 190601.6511.08 О

 

 

 

 

 

 

 

 

Руководитель

_________Архирейский  А.А.

«_____»_____________2012г.

Выполнил

студент гр. 09-ААХ2

____________Клоков М.П.

«_____»_____________2012г.


 

 

 

 

 

 

 

Оренбург 2012

 

 

Содержание


 

 

   

1

Оценка характеристик случайной  величины….....………………….……

 

1.1

Точечные  оценки……………………..…….………………………....……

 

2

Графическое представление случайной величины………………………

 

3

Подгонка  теоретических распределений к  эмпирическим... …………...

 

3.1

Определение оценок параметров экспоненциального  закона ………….


 

3.2

Определение оценок параметров нормального закона ………..………...

 

3.3

Определение оценок параметров логарифмически нормального закона ..

 

3.4

Определение оценок параметров закона Вейбулла ……………………

 

4

Проверка  соответствия с помощью критериев  согласия ……………

 

4.1

Проверка  с помощью критерия Пирсона ………………….....…………

 

4.2

Проверка  с помощью критерия Колмогорова …………………………

 
 

Заключение……………………………………………………..…

 
 

Список  используемых источников…………………………………….

 
 

Приложение  А Гистограммы и графики функций  распределения…

 
     

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


1 Оценка характеристик  случайной величины


 

 

Случайную величину можно достаточно полно  охарактеризовать, определив ее наиболее вероятное значение и рассеяние относительно него.

Для описания наиболее вероятного значения случайной величины используют математическое ожидание, которое является положением центра группирования значений случайной величины. Математическое ожидание вычисляют как среднее арифметическое значение случайной величины. В качестве характеристик рассеяния используют дисперсию – сумму квадратов отклонений значений случайной величины от ее математического ожидания.

Математическое  ожидание и дисперсия, ввиду малого объема выборки и ее случайности, являются случайными величинами. Поэтому  на практике выборочные числовые характеристики подвергаются некоторому исправлению. Исправленные числовые характеристики называются оценками.

 

    1. Точечные оценки 

 

Исходные  данные:

248; 214,8; 101; 197,1; 244; 253,5; 161,9; 190,2; 203,1; 326,4; 280,8; 207,4; 230,6; 163,9; 163,3; 216; 229,4; 144,1; 262,2; 158,5; 326,1; 198,8; 319,5; 274,8; 172,1; 209,6; 233; 191,2; 134,4; 170,4; 235,5; 170,2; 97,8; 127,3; 186,7; 259,8; 166,8; 181,6; 183,7; 204,6; 231,8; 295; 223; 292,5; 271,5; 197,2; 214,1; 185,8; 209,2; 249,6; 137,6; 126,9; 282,6; 272,6; 331,2; 304,2; 276,7; 281,8.

Необходимо  найти характеристики случайной величины.

Найдем  оценку математического ожидания с  помощью формулы:

 

                            

                                           (1.1)

 

где: n - объем выборки.

- i-тая реализация случайной величины.

 

 

Оценку  дисперсии можно определить по формуле (1.2), но на практике, для облегчения расчетов, используют следующее соотношение:

 



Таким образом, статистическая дисперсия определяется по формуле:

  

 

                           (1.2)

 

 

Среднее квадратическое отклонение определим  как корень квадратный из дисперсии:

 


                          (1.3)      

 

Коэффициент вариации, оценивающий рассеивание  в относительных единицах определяется по формуле:

 

 

                         (1.4)                         

 

 

Найдем  оценку асимметрии по формуле: 

 

                             

                    (1.5)

 

где:

 

 

Эксцесс, характеризующий плосковершинность  кривой распределения:

 

 

 

 

 

 



 

 

  (1.6)     

 

 

 

Данные числовые характеристики называются точечными, так как они характеризуют  данную случайную величину одним  числом. При небольшом числе испытаний указанные характеристики, как правило, отличаются от их истинных значений.

На  практике, для удобства представления  и обработки, данные, полученные в  результате наблюдений, группируют по интервалам. Группированные данные представляют в виде границ интервалов и количества наблюдений, попавших в каждый интервал.

Вычислим приближенное количество интервалов группирования по формуле:

 

                                  

                                          (1.7)

 

где: n – объем выборки.

 

 

Полученное  значение округляем в меньшую  сторону .

Упорядочим  значения наработки в порядке  возрастания:

97,8; 101; 126,9; 127,3; 134,4; 137,6; 144,1; 158,5; 161,9; 163,3; 163,9; 166,8; 170,2; 170,4; 172,1; 181,6; 183,7; 185,8; 186,7; 190,2; 191,2; 197,1; 197,2; 198,8; 203,1; 204,6; 207,4; 209,2; 209,6; 214,1; 214,8; 216; 223; 229,4; 230,6; 231,8; 233; 235,5; 244; 248; 249,6; 253,5; 259,8; 262,2; 271,5; 272,6; 274,8; 276,7; 280,8; 281,8; 282,6; 292,5; 295; 304,2; 319,5; 326,1; 326,4; 331,2.

Рассчитаем  величину интервала группирования  по формуле (1.8), учитывая следующие принципиальные положения:

  • величина ∆х выбирается постоянной для всех интервалов;
  • выбор величины ∆х зависит от количества наблюдений и разброса их значений, рекомендуется задавать величину интервала такой, чтобы получилось не менее 6 и не более 20 интервалов;
  • рекомендуется определять количество интервалов k при заданном количестве n по формуле Стенжерса:

 

 




                      (1.8)

 


 

 

  При слишком малом числе интервалов разбиения (интервал велик), плохо выявляются характерные особенности распределения. С ростом числа интервалов характерные особенности выявляются все лучше, но лишь до определенно придела. Необходимое количество интервалов должно быть: , , , , .  С помощью таблицы 1.1 подсчитаем число попаданий результатов наблюдений и середину каждого интервала группирования при

Таблица 1.1 – Подсчет ,  

Номер интервала

Границы интервала

Середина  интервала,

Число попаданий, 

1

97,8…136,7

117,25

5

2

136,7…176,5

156,15

10

3

176,5…214,5

195,05

15

4

214,5…253,4

233,95

11

5

253,4…292,3

272,85

10

6

292,3…331,2

311,75

7


 

                                

                                          (2.0)

где - i-тая реализация случайной величины;

- ширина интервала.


 

                                  (2.1)

 

Число инверсий в данном случае .

Далее принимаем число интервалов , ширина интервала .

Таблица 1.2 – Подсчет ,  

Номер интервала

Границы интервала

Середина  интервала,

Число попаданий, 

1

97,8…156,15

126,975

7

2

156,15…214,5

185,325

23

3

214,5…272,8

243,675

16

4

272,8…331,5

302,025

12


Число инверсий .


Принимаем число  интервалов , ширина интервала .

Таблица 1.3 – Подсчет ,  

Номер интервала

Границы интервала

Середина  интервала,

Число попаданий, 

1

97,8…144,48

121,14

7

2

144,48…191,16

167,82

13

3

191,16…237,84

214,5

18

4

237,84…261,18

261,18

13

5

261,18…331,5

307,86

7


 

Число инверсий .

Затем принимаем число интервалов , ширина интервала .

Таблица 1.4 – Подсчет ,  

Номер интервала

Границы интервала

Середина  интервала,

Число попаданий, 

1

97,8…131,143

114,4714

4

2

131,143…164,486

147,8143

7

3

164,486…197,83

181,1571

12

4

197,83…231,17

214,5

12

5

231,17…264,51

247,8429

9

6

264,51…297,86

281,1857

9

7

297,86…331,5

314,5286

5


Число инверсий
           И наконец, принимаем число интервалов , ширина интервала .

Таблица 1.5 – Подсчет ,  

Номер интервала

Границы интервала

Середина  интервала,

Число попаданий, 

1

97,8…126,975

112,3875

3

2

126,975…156,15

141,5625

4

3

156,15…185,325

170,7375

10

4

185,325…214,5

199,9125

13

5

214,5…243,675

229,0875

8

6

243,675…272,85

258,2625

8

7

272,85…302,025

287,4375

7

8

302,025…331,5

316,6125

5


Число инверсий .

Таким образом, принимаем количество интервалов, равное 8, т.к. количество инверсий минимально, а количество интервалов наибольшее.


  1. Графическое представление случайной величины

 

 

Для определения вида закона распределения  случайной величины удобно представить  данные наблюдений в графическом  виде. Для графического представления  данных наблюдения используется специальный  график – гистограмма.

Гистограмма является важным вспомогательным средством при принятии гипотезы о виде функции распределения. Поэтому необходимо извлечь из нее максимум информации.

При построении гистограммы по оси абсцисс  откладывают в выбранном масштабе интервалы, и, взяв их как основания, строят прямоугольники, высота которых равна статистической плотности распределения на интервале. Построенная таким образом ступенчатая функция fj называется гистограммой выборки. Эта функция служит статистическим аналогом плотности распределения вероятности случайной величины и на j-ом интервале определяется по формуле 2.1.

 

fj = mj / (n∙Dx).                                              (2.1)

 

Рассчитаем f для каждого из полученных интервалов, результаты сведем в таблицу 2.1.

Таблица 2.1 – Значения функции распределения fj

Количество интервалов

Значение функции распределения  fj

4

0,0020684

0,006796

0,004728

0,0035458

       

5

0,0025855

0,004802

0,006648

0,0048016

0,002585468

     

6

0,0022161

0,004432

0,006648

0,0048755

0,004432231

0,00310256

   

7

0,0020684

0,00362

0,006205

0,0062051

0,004653843

0,00465384

0,002585

 

8

0,0017729

0,002364

0,00591

0,0076825

0,004727713

0,00472771

0,004137

0,002955


 

При построении нескольких гистограмм с разным количеством интервалов лучшей нужно считать гистограмму, имеющую меньшее число инверсий. Признаком инверсии считается изменение знака приращения высоты прямоугольника. Если число инверсий одинаково, лучшей следует считать ту, которая имеет большее число интервалов.

Таким образом, мы выбираем в качестве наилучшей гистограмму с и числом интервалов .


По данным статистического ряда можно вычислить еще одну характеристику случайной величины - эмпирическую интегральную функцию распределения. Значение эмпирической интегральной функции распределения для j-ого интервала Fj определяется по формуле:

Fj = mi / n.                                                 (2.2)

Функция распределения  может быть представлена в виде графика, который строится подобно гистограмме, только высоты прямоугольников равны значениям функции распределения соответствующих интервалов. Найдем значения функция распределения для наилучшей гистограммы.

Результаты  по которым строится наилучшая гистограмма и сводятся в таблицу 2.2.

Таблица 2.2 – Значения и

0,001773

0,051724

0,002364

0,12069

0,00591

0,293103

0,007683

0,517241

0,004728

0,655172

0,004728

0,793103

0,004137

0,913793

0,002955

1


 

Пример графика приведен в приложении А.

 

 

 

 

 

 

 

 

 

 

 


  1. Подгонка теоретических распределений к эмпирическим

 

Для оценки случайной величины с помощью закона распределения вначале необходимо определить, к какому параметрическому семейству он принадлежит. Предварительно теоретический закон распределения может быть подобран, исходя из следующих рекомендаций:

- принципиальный характер кривой  распределения назначается по  теоретическим соображениям, связанным с существом задачи, или аналогичным задачам;

- в некоторых случаях теоретическую  кривую выбирают, учитывая внешний  вид статистического распределения;

- иногда полезно использовать  систему кривых Джонсона или  Пирсона, каждая из которых зависит от четырех параметров, и выбор нужной кривой можно осуществить с использованием специально разработанных графиков;

- при использование ЭВМ для  расчетов можно определить несколько  законов распределения и выбрать  наилучший.

Для определения параметров выбранного закона распределения в математической статистике разработан ряд методов. Наиболее часто используют метод моментов, согласно которому параметры выбирают с таким расчетом, чтобы важнейшие числовые характеристики теоретического распределения были равны соответствующим статистическим характеристикам.

Для определения точечных оценок используют также метод наименьших квадратов, при котором сумма квадратов  отклонений должна обращаться в минимум.

 

3.1  Определение оценок параметров экспоненциального закона

 

Оценка  параметра распределения, , находится по формуле:

 

= 1 / ,                                                  (3.1.1)

                                               

где   - оценка математического ожидания выборки

Плотность распределения  экспоненциального закона будет  иметь вид:

 

                                                                            (3.1.2)    

 

где х – середина интервала

 

        


Остальные значения сводим в таблицу 3.1.1

Интегральная  функция распределения найдется по формуле:

 

              (3.1.3)      

 

 

        Остальные значения также сводим  в таблицу 3.3.1

Таблица 3.1.1 – Значения и

0,00274151

0,4033236

0,00239758

0,4781781

0,0020968

0,543642

0,00183375

0,6008932

0,0016037

0,6509622

0,00140252

0,6947498

0,00122657

0,7330442


 

 

3.2 Определение оценок параметров нормального закона

 

Оценка  параметра mt, представляющего собой среднее значение случайной величины x, равна оценке математического ожидания выборки.

 

 

Оценка  параметра σ равна оценке среднего квадратического отклонения выборки.

 

Плотность распределения нормального закона будет иметь вид:

 


(3.2.1)

 

 

где х – середина интервала;

- число попаданий на данном  интервале.




        

Интегральная  функция распределения найдется по формуле:

 

 (3.2.2)

 

где - табличный интеграл Лапласа.

Для того, чтобы  найти интеграл Лапласа необходимо рассчитать t:


                                     (3.2.3)

 

 

Значения t приведены в таблице 3.2.1

Таблица 3.2.1 – Значения t

t

Ф(t)

1

-1,81

-0,4649

2

-1,31

-0,4019

3

-0,81

-0,291

4

-0,31

-0,1217

5

0,20

0,0793

6

0,70

0,258

7

1,20

0,3849

8

1,70

0,4554


 

       Тогда :    


 

 

Сведем  все значения и в таблицу 3.2.2

Таблица 3.2.2 – Значения и

0,00132835

0,0351

0,00291167

0,0981

0,00495795

0,209

0,00655834

0,3783

0,00673931

0,5793

0,00537981

0,758

0,00333618

0,8849


 

 

 

 

 

3.3 Определение оценок параметров логарифмически нормального

      закона

 

Параметр m вычисляется по формуле:


                                              ,                                               (3.3.1)

где - значения наработки;

       n - объем выборки.

Параметр S вычисляется по формуле:

 

.                                        (3.3.2)

 

Значения параметров , , сводим в общую таблицу:

Таблица 3.3.1 – Значения ,

5,345

0,2852


 

Параметр t вычисляется по формуле:

                                                                                         (3.3.2)

Значения t приведены в таблице 3.3.2

Таблица 3.3.2 – Значения t

t

Ф(t)

1

-2,18

-0,48537

2

-1,38

-0,4162

3

-0,72

-0,2642

4

-0,17

-0,0675

5

0,31

0,1217

6

0,73

0,2673

7

1,11

0,3665

8

1,45

0,4265


 

Плотность распределения логарифмически нормального закона будет иметь вид:

 

 

 


(3.3.3)

 


где х – середина интервала;

- параметр распределения.

 

 

 

 

Интегральная  функция распределения найдется по формуле:

 

 (3.3.4)

 

где - табличный интеграл Лапласа.

 

       Тогда :    


 

 

Сводим  значения и в таблицу 3.2.2

Таблица 3.3.3 – Значения и

0,001144842

0,0147

0,003837494

0,0838

0,00632957

0,2358

0,006902157

0,4325

0,005815082

0,6217

0,004141032

0,7673

0,002634081

0,8665

Статистическая обработка данных о надежности