Математические основы теории надёжности информационных систем

Математические  основы теории надёжности информационных систем

3.1. Основные  понятия, аксиомы и теоремы  из теории вероятностей

Событие – всякий факт, который в результате опыта может произойти или не произойти.

Если в результате опыта непременно должно появиться  хотя бы одно из нескольких событий, то эти события образуют полную группу событий.

Суммой нескольких событий А1, А2, А3,…, Аназывается событие В, состоящее в появлении хотя бы одного из этих событий:

B=А123+…+Аn. (3.1)

Произведением нескольких событий А1, А2, А3,…, Аназывается событие С, состоящее в совместном появлении всех событий:

С=А1×А2×А3×…×А, (3.2)

Каждому случайному событию А поставлено в соответствие неотрицательное число Р(А), называемое его вероятностью.

Вероятность события  представляет собой численную меру степени объективной возможности (частоты) появления этого события.

В качестве единицы  измерения принимают вероятность  достоверного события. Все другие события – возможные, но недостоверные – будут характеризоваться вероятностями, меньшими единицы, составляющими какую-либо долю единицы.

Вероятность события А, вычисленная при условии, что имело место другое событие В, называется условной вероятностью события А и обозначается как

Русл(А)=Р(А/В)=РВ(А). (3.3)

Теорема сложения вероятностей: для произвольных событий А и В вероятность суммы этих событий выражается формулой

Р(А+В)=Р(А)+Р(В)–Р(А×В). (3.4)

Теорема умножения  вероятностей: вероятность произведения двух событий равна произведению вероятности одного из них на условную вероятность другого, вычисленную  при условии, что первое имело  место:

Р(А×В)=Р(А)Р(В/А)=Р(В)Р(А/В). (3.5)

Из этой теоремы  вытекают два следствия:

если событие А не зависит от события В, то событие В не зависит от события А;

вероятность произведения двух независимых событий равна  произведению вероятностей этих событий.

Формула полной вероятности: если событие В может осуществляться с одним из n несовместимых событий А1, А2, А3,…Аn, образующих полную группу и обычно называемых гипотезами, то полная вероятность события В определяется формулой

. (3.6)

Формула Бернулли: если произошло последовательно n независимых опытов, в каждом из которых событие А может произойти с одной и той же вероятностью q, то вероятность того, что событие А произойдет ровно m раз, определяется по формуле Бернулли или по биноминальному распределению:

, (3.7)

где

. (3.8)

Случайной величиной Х называется величина, которая в результате опыта может принять то или иное значение, причем неизвестно заранее, какое именно.

Дискретная случайная  величина – величина, принимающая только отделенные друг от друга значения, которые можно заранее перечислить.

Непрерывная случайная  величина – величина, возможные значения которой непрерывно заполняют некоторый промежуток.

Если дискретная случайная величина Х принимает значения х1, х2, х3,…, хс заданными вероятностями Р1, Р2, Р3,…, Рm, то соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями, называется законом распределения.

Непрерывная случайная  величина имеет бесчисленное множество  возможных значений, сплошь заполняющих  некоторый промежуток. А так как  сумма вероятностей отдельных значений случайной величины равна единице, то вероятность каждого значения должна стремиться к нулю. Поэтому вводится другая количественная характеристика – функция распределения, показывающая невероятность события Х=хкак закон распределения, а вероятность события Х < х, где х – некоторая текущая переменная.

. (3.9)

Функция F(x) существует как для прерывных, так и непрерывных случайных величин. Она является неубывающей, т.е.

, (3.10)

, (3.11)

, (3.12)

. (3.13)

Плотность распределения:

. (3.14)

Элемент вероятности dP – вероятность того, что случайная величина Х попадает на интервал dx около значения х:

dP = f(x)dx. (3.15)

Наибольшее применение в практических задачах надежности находят показательные (экспоненциальные) и нормальные теоретические функции  распределения для непрерывных  случайных величин и закон  Пуассона для дискретных случайных  величин.

Показательное (экспоненциальное) распределение имеет следующий  вид:

(3.16)

.

Нормальное распределение:

;

(3.17)

.

Закон Пуассона позволяет  определить вероятность того, что  случайная величина, значениями которой  могут быть только целые неотрицательные  числа, примет определенное значение

. (3.18)

Математическое  ожидание (среднее значение) случайной  величины Х, принимающей дискретные значения х1, х2, х3,…, xn, с вероятностями Р1, Р2, Р3,…, Рn определяется как

. (3.19)

Для непрерывной  случайной величины математическое ожидание определяется как

. (3.20)

Так, имеем

для экспоненциального  распределения:

; (3.21)

для нормального:

, (3.22)

для закона Пуассона:

. (3.23)

Основные свойства математического ожидания:

–математическое ожидание постоянной С равно этой же постоянной:

М[С] = С; (3.24)

–постоянный множитель выносится за знак математического ожидания:

М[СХ] = СМ[Х]; (3.25)

–математическое ожидание суммы любых случайных величин (как угодно связанных) равно сумме их математических ожиданий:

М[Х+Y] = M[X]+M[Y]; (3.26)

–математическое ожидание произведения независимых случайных величин равно произведению их математических ожиданий:

М[ХY] = M[X]M[Y]. (3.27)

Дисперсия определяется как математическое ожидание квадрата уклонения случайной величины от ее математического ожидания:

; (3.28)

дисперсия экспоненциального  распределения:

; (3.29)

нормального распределения:

; (3.30)

закона Пуассона:

D= a. (3.31)

Основные  свойства дисперсии:

1) дисперсия постоянной С равна нулю:

; (3.32)

2) постоянный множитель выходит за знак дисперсии в квадрате:

; (3.33)

3) дисперсия суммы попарно независимых случайных величин равна сумме дисперсии слагаемых:

. (3.34)

Среднеквадратичное  отклонение случайной величины определяется как

. (3.35)

Если произведена  серия из n независимых опытов, в каждом из которых могло появиться или не появиться некоторое событие A, то отношение числа опытов m, в которых появилось событие A, к общему числу произведенных опытов называется частотой события А или статистической вероятностью события А:

. (3.36)

Оценку математического  ожидания, удовлетворяющую условию  состоятельности и несмещенности, можно произвести по формуле

. (3.37)

Дисперсия, удовлетворяющая  этим же условиям, оценивается по формуле

. (3.38)

Центральная предельная теорема позволяет определить закон  распределения случайной величины, которая может быть представлена как сумма других величин. Согласно этой теореме, если исследуемая случайная  величина может быть представлена в  виде суммы достаточно большого числа  независимых или слабо зависимых  элементарных слагаемых, каждое из которых  в отдельности сравнительно мало влияет на сумму, то закон распределения  этой случайной величины приближается к нормальному при увеличении числа слагаемых.

Практически центральной  предельной теоремой можно пользоваться и тогда, когда имеет место  сумма сравнительно небольшого числа  случайных величин. Опыт показывает, что когда число слагаемых  порядка десяти (а часто и меньше), закон распределения суммы обычно может быть заменен нормальным.

 

тема 5 

 

5.1. Аналитические  методы расчета надежности систем

Рассмотрим классификацию  и дадим краткую характеристику аналитических методов инженерной оценки надежности системы.

Решение задачи оценки надежности системы при использовании  любого аналитического метода включает три этапа:

1) составление формальной  модели исследуемой системы;

2) анализ модели  и составление расчетных формул;

3) выполнение вычислений, приводящих к искомому результату.

Аналитические методы оценки надежности систем отличаются главным образом видом используемых формальных моделей и математическим аппаратом, применяемым для их анализа  и получения расчетных формул. При классификации аналитических  методов используют два признака:

1) наличие или  отсутствие методической погрешности;

2) применяемый математический  аппарат.

По первому признаку аналитические методы подразделяются на два класса:

1) точные методы;

2) приближенные  методы.

В свою очередь точные методы разделены на две группы:

- методы, использующие  математический аппарат случайных  величин и случайных событий ;

- методы, использующий  математический аппарат теории  случайных процессов.

В первую группу входят два метода на основе аппарата случайных  событий (классический и логико-вероятностный  методы) и два метода, использующие аппарат случайных величин (W-метод и l-метод).

В основе классического  метода заложен вероятностный аппарат  теории случайных событий. Искомая  характеристика надежности (вероятность  отказа P(t) или безотказной работыQ(t) за время (0, t). Затем, применяя основные теоремы теории вероятностей, мы делаем переход к вероятностной мере.

Основу логико-вероятностного метода составляет объединение аппарата теории случайных величин с элементами алгебры логики. Искомая характеристика записывается в виде логического  выражения, над которым по правилам алгебры логики проводятся логические преобразования. Затем, как и в  классическом методе, осуществляется переход к вероятностному выражению.

В отличие от классического и логико-вероятностного методов, W-метод основан на аппарате теории случайных величин и теории функций случайных аргументов.

Искомая характеристика надежности представляется в виде распределения  некоторой случайной величины, имеющей  размерность времени, как функция  некоторого набора других случайных  величин. После этого осуществляется переход к выражению для искомой  характеристики надежности системы. К  основным недостаткам перечисленных  выше методов относится ограниченность их применения в случаях, когда:

1) существуют последействия  отказов;

2) элементы в  системе могут находиться более  чем в двух состояниях;

3) в определении  состояний системы играют роль  временные соотношения;

4) в системе имеются  комбинации видов технического  обслуживания;

5) число состояний  в системе велико.

Вторую группу образуют два метода, использующие аппарат  теории марковских процессов (МП-метод и топологический метод), и два метода, основанные на аппарате полумарковских процессов.

МП-метод и топологический метод просты в обращении и  позволяют получать надежностные характеристики и показатели в явном виде как на начальном (длящемся от момента включения системы до первого отказа), так и на стационарном (потоки отказов и восстановлений системы считаются установившимися) участках функционирования системы. Различие этих методов заключается в том, что топологический метод в ряде случаев позволяет вычислять показатели надежности системы, не прибегая к составлению дифференциальных уравнений, а непосредственно по графу состояний.

Основными недостатками методов, основанных на этом математическом аппарате, является то, что:

1) существуют жесткие  ограничения на законы распределения  времени безотказной работы и  времени восстановления (они должны  быть экспоненциальными);

2) решение на  начальном участке функционирования  системы получается только в  виде преобразования Лапласа,  что исключает возможность дальнейшего  использования результатов в  практике.

ПМП-метод основан  на математическом аппарате теории полумарковских процессов с конечным множеством состояний и является обобщением МП-метода.

Анализ надежностных свойств системы этим методом проводится в предположении произвольности одного из законов распределения: времени безотказной работы или времени восстановления. В этом состоит основное отличие ПМП-метода от МП-метода.

Метод ПМП и ПМС, в свою очередь, является обобщением ПМП-метода и основан на математическом аппарате теории полумарковских процессов  с произвольным множеством состояний. Анализ надежности системы этим методом  можно проводить в предположении  произвольности законов распределения времени безотказной работы элементов и времени восстановления.

Приближенные методы включают большую группу так называемых асимптотических методов, в которых  в качестве расчетных формул для  оценки показателей надежности моделей  реальных систем используются соотношения  для некоторых предельных случаев  в определенных классах случайных  процессов (марковских, полумарковских и др.).

Примером такого метода является метод фазового укрупнения, использующий предельные соотношения, доказанные для полумарковских процессов  с конечным множеством состояний.

Другую группу в  классе приближенных методов образуют методы оценки надежности, использующие специальный прием, состоящий в  составлении на основе реальной исследуемой  системы двух формальных моделей, одна из которых в надежностном смысле лучше, а другая – хуже точной модели и в получении, соответственно, верхней и нижней оценок искомого показателя надежности. Примером метода данной группы является метод усечения графа состояний.

Выбор аналитического метода инженерной оценки надежности системы

При выборе аналитического метода расчета надежности анализируются  следующие признаки:

1) вид соединения  элементов в системе;

2) рассматриваемый  участок времени функционирования  системы;

3) наличие или  отсутствие технического обслуживания;

4) типы законов  распределения времен безотказной  работы и времен восстановления  элементов системы ;

5) количество состояний  в системе.

Выбор метода начинается с анализа вида соединения компонентов. Все возможные виды соединения компонентов  объединяются в две группы. К первой группе относится самое “простое” – последовательное соединение. Все остальные виды соединения считаются “сложными” и относятся ко второй группе.

Такому делению  видов соединения элементов соответствует  первый уровень схемы.

На втором шаге рассматривается  участок времени функционирования, на котором исследуется надежность системы. Здесь различаются начальный  участок (простирающийся от момента  включения системы до ее отказа) и стационарный (когда потоки отказов  и восстановлений системы можно  считать установившимися). Выбор  участка времени функционирования однозначно определяет наличие или  отсутствие восстановления системы  после ее отказа, а также искомые  надежностные характеристики и показатели. Такому делению участков времен функционирования системы соответствует второй уровень схемы.

Далее анализируется, подвергается ли система техническому обслуживанию (ТО) или нет. Здесь  под ТО понимается техническое обслуживание, проводимое на системе с резервированием  компонентов и состоящее в  восстановлении (или замене) отказавших компонентов на еще работоспособной  системе.

Влияние ТО на выбор  метода расчета надежностных показателей системы отражено на третьем уровне.

На следующем  шаге рассматриваются типы законов  распределения времен безотказной  работы и восстановления компонентов. Из всех существующих законов распределения  в одну группу выделяется экспоненциальное распределение (exp), все остальные объединяются в группу под названием “произвольные распределения” (ПР).

Если система  не подвергается ТО и не восстанавливается  после отказа, то для расчета ее надежности задаются только законы распределения  времен безотказной работы компонентов (ехр или ПР). Если система восстанавливаемая или допускает ТО, то наряду с законами распределения времен безотказной работы компонентов должны быть заданы законы распределения времен восстановления компонентов. В этом случае следует различать следующие комбинации законов распределения:

1) все законы  распределения времени безотказной  работы компонентов и времени  восстановления экспоненциальные (ехр, ехр);

2) ряд законов  распределений (законы распределения  времени безотказной работы компонентов  или времени восстановления) экспоненциальны, а остальные относятся к группе “произвольные распределения” (ехр, ПР);

3) все законы  распределения времени безотказной  работы компонентов и времени  восстановления относятся к группе  “произвольные распределения” (ПР, ПР).

Следующий этап анализа  системы состоит в оценке (количественной или качественной) числа состояний, в которых может находиться система  в процессе своего функционирования. В общем случае чем больше состояний в системе, тем труднее анализ ее надежностных свойств аналитическими методами. Поэтому исследуемые системы разбиваются на две группы. К первой группе отнесем схемы, процесс функционирования которых сводится к малому числу состояний (10–15) (“М”), ко второй – процесс функционирования которых задан большим числом состояний (“В”).

Если стрелки, отмеченные буквами “М” и ”В”, сходятся к одной точке, это означает, что  число состояний практического  влияния на выбор метода решения  не оказывает.

На этом выбор  метода решения задачи заканчивается, совокупность признаков исследуемой  системы однозначно определяет метод  решения.

Приведенная схема  выбора метода дает лишь определенную ориентировку и результат выбора не следует считать единственным и окончательным. Окончательное  решение относительно целесообразности применения того или иного метода для анализа расчета надежности конкретной системы может быть принято  лишь после выполнения пробных расчетов.

Помимо указанной  схемы выбора метода примем во внимание также следующие рекомендации.

Некоторые рекомендации к выбору метода и расчету надежности системы

С целью упрощения  и облегчения анализа надежности системы можно использовать таблицы  готовых расчетных формул для  таких показателей, как среднее  время безотказной работы Т, среднее время восстановления Тв, среднее время работы между отказами Т0, коэффициент готовности Кг для нескольких достаточно широко распространенных классов систем. К ним относятся:

1) параллельное  соединение равнонадежных компонентов (нагруженный резерв);

2) резервирование  равнонадежными компонентами при облегченном резерве;

3) резервирование  равнонадежными компонентами при ненагруженном резерве;

4) резервирование  неравнонадежными компонентами при нагруженном резерве;

5) резервирование  неравнонадежными компонентами при облегченном резерве;

6) резервирование  неравнонадежными компонентами при ненагруженном резерве;

7) параллельное  соединение равнонадежных компонентов (нагруженный резерв) с учетом последствий отказов;

8) дублирование  неравнонадежных компонентов (нагруженный резерв) с учетом последствий отказов;

9) резервирование  равнонадежными компонентами с дробной кратностью при нагруженном, облегченном и ненагруженном резерве;

10) резервирование  равнонадежными компонентами с дробной кратностью при нагруженном резерве с учетом последствий отказов;

11) раздельное дублирование  равнонадежных компонентов при нагруженном и облегченном резерве.

Необходимым условием применения указанных расчетных  формул является экспоненциальность распределений времени безотказной работы и времени восстановления всех компонентов системы.

В связи с наличием таблиц при исследовании конкретной системы следует прежде всего проверить, относится ли она к одному из перечисленных классов, и если да, то непосредственно использовать приведенные в таблицах формулы. И лишь в том случае, если исследуемая система не может быть сведена ни к одному из этих классов, следует обратиться к процедуре выбора аналитического метода.

В связи со сложностью и, в частности, с большим числом компонентов при решении задачи аналитической оценки надежности системы  можно использовать все возможности  декомпозиции исследуемой системы. Во многих случаях имеет смысл  исключить из рассмотрения некоторые  взаимосвязи между компонентами системы, препятствующие декомпозиции, даже ценой снижения точности получаемых решений.

Один из наиболее эффективных путей декомпозиции системы –декомпозиция по выполняемым системой функциям, что реализуется естественным образом, если каждый из компонентов системы участвует в выполнении только одной функции. Этот способ декомпозиции бывает целесообразен и в случаях, когда некоторые компоненты участвуют в выполнении нескольких функций, если доля таких компонентов в их общем числе невелика.

При использовании  декомпозиции оценка надежности системы  включает три основных этапа:

1) разбиение структуры  системы на ряд самостоятельных  блоков (каждый из которых соответствует  отдельной функции системы, отдельной  подсистеме или представляет  собой некоторую типовую надежностную структуру: последовательную, параллельную, мажоритарную и т.п.);

2) выбор метода  и аналитическая оценка надежности  всех блоков, полученных в результате  декомпозиции;

3) выбор метода  и аналитическая оценка надежности  системы в целом на основе  полученных данных о надежности  выделенных блоков.

Следует отметить, что этап (3) не всегда может быть выполнен даже при выполнении этапов (1) и (2), так как в результате одноразового использования приема декомпозиции зачастую устраняются не все трудности  расчета надежности системы. В этом случае следует попытаться этапы (1) и (2) применять последовательно до тех пор, пока или не станет возможно выполнить этап (3), или окажется, что дальнейшая декомпозиция системы  нецелесообразна. Если же в результате неоднократного применения этапов (1) и (2) к исследуемой системе оценка надежности системы по результатам  анализа надежности полученных в  результате декомпозиции структур не может быть проверена изложенными  методами, можно использовать методы вероятностного моделирования.

В тех случаях, когда  надежную структуру системы можно  представить в виде ряда последовательно  соединенных (в смысле надежности) блоков, каждый из которых отображает совокупность технических средств, имеющих автономную систему технического обслуживания и восстановления, можно пользоваться модификацией МП-метода.

Если система  содержит большое количество компонентов, имеющих произвольное распределение  времени безотказной работы, и  имеет как неизбыточную, так и избыточную структуру, но в процессе работы не подвергается техническому обслуживанию и может быть представлена как состоящая из одинаковых в надежностном смысле компонентов, можно использовать W-метод.

Если для исследуемой  системы изложенные аналитические методы не позволяют получить требуемую оценку надежности, можно использовать метод статистического моделирования на ЭВМ.

5.4. Оценка  надежности методом марковских процессов

Основные  допущения и ограничения

Методом марковских процессов (МП-методом) называется метод расчета характеристик и показателей надежности по линейным дифференциальным уравнениям типа массового обслуживания. Предполагается, что процессы отказов и восстановления систем являются марковскими случайными процессами. 

 

 

  

 

Основными допущениями  МП-метода являются:

Ä законы распределения  времени безотказной работы и  времени восстановления каждого  элемента, входящего в системы, являются экспоненциальными;

Ä функционирование системы контролируется непрерывно, т.е. момент отказа обнаруживается немедленно после его возникновения;

Ä в процессе ремонта  происходит полное восстановление отказавших элементов, т.е. интенсивности отказов  элементов не зависят от числа  восстановлений;

Ä восстановление элемента начинается немедленно после его  отказа при наличии свободной  ремонтной бригады, обслуживающей  данный элемент; при отсутствии свободной  ремонтной бригады отказавший элемент  становится в очередь на обслуживание.

МП-метод позволяет  рассчитать надежность невосстанавливаемых  и восстанавливаемых, нерезервированных  и структурно-резервированных систем при любом состоянии резерва (ненагруженном, облегченном, нагруженном), при любом  количестве ремонтных бригад и произвольной дисциплине обслуживания с учетом допущений.

Данный метод  позволяет вычислять следующие  характеристики надежности системы:

- вероятность безотказной  работы P(t);

- функцию готовности Кг(t);

- и такие показатели  надёжности системы, как среднюю  наработку до отказа T0, коэффициент готовности Кг, наработку на отказ Т, среднее время восстановления Тв.

Некоторые математические основы 

 

Однородный марковский процесс. Пусть X(t) (t ³ 0) – дискретный случайный процесс с непрерывным временем. Случайный процесс X(t) называется марковским, если для любого n= 1, 2, 3,..., любых моментов t1, t2,…, tn, tn+1, удовлетворяющих условиям 0 £ t£ t£…£ tn, £ tn+1 и любых возможных значений случайного процесса i1, i2,…, in, in+1 выполняется следующее равенство для условных вероятностей:  

Математические основы теории надёжности информационных систем