Контрольная работа по «Информационные системы и технологии»
Министерство образования и науки Украины
Приднепровская государственная академия
строительства и архитектуры
Кафедра прикладной математики
КОНТРОЛЬНАЯ РАБОТА
по дисциплине
«Информационные системы и
Вариант№11
Выполнила:
студентка
Герасименко Светлана Владимировна
Днепропетровск 2012г
Содержание:
1.Дать толкование, понятию информация.
2. Практическая часть.
2. 1.Дисперсионный анализ данных наблюдений. Общие сведенья.
2.2.Задача №11 на однофакторный дисперсионный анализ данных наблюдений.
3. Формирование выборки из выборок малого объема. Задача вариант № 10.
Список литературы.
2. Практическая часть.
2. 1.Дисперсионный анализ данных наблюдений. Общие сведенья.
Дисперсионный анализ — это статистический метод оценки связи между факторными и результативным признаками в различных группах, отобранный случайным образом, основанный на определении различий (разнообразия) значений признаков. В основе дисперсионного анализа лежит анализ отклонений всех единиц исследуемой совокупности от среднего арифметического. В качестве меры отклонений берется дисперсия— средний квадрат отклонений.
Отклонения, вызываемые
воздействием факторного
Для того, чтобы вычислить дисперсию значения отклонений каждой варианты (каждого зарегистрированного числового значения признака) от среднего арифметического возводят в квадрат. Тем самым избавляются от отрицательных знаков. Затем эти отклонения (разности) суммируют и делят на число наблюдений, т.е. усредняют отклонения. Таким образом, получают значения дисперсий.
Важным методическим значением для применения дисперсионного анализа является правильное формирование выборки. В зависимости от поставленной цели и задач выборочные группы могут формироваться случайным образом независимо друг от друга (контрольная и экспериментальная группы для изучения некоторого показателя, например, влияние высокого артериального давления на развитие инсульта). Такие выборки называются независимыми.
Нередко результаты воздействия факторов исследуются у одной и той же выборочной группы (например, у одних и тех же пациентов) до и после воздействия (лечение, профилактика, реабилитационные мероприятия), такие выборки называются зависимыми.
Дисперсионный анализ, в котором проверяется влияние одного фактора, называется однофакторным (одномерный анализ). При изучении влияния более чем одного фактора используют многофакторный дисперсионный анализ (многомерный анализ).
Факторные признаки — это те признаки, которые влияют на
изучаемое явление.
Результативные признаки
— это те признаки, которые изменяются
под влиянием факторных признаков.
Для проведения дисперсионного анализа могут использоваться как качественные (пол, профессия), так и количественные признаки (число инъекций, больных в палате, число койко-дней).
Для учета в расчетах качественных признаков необходимо их ранжировать. Например, местоположение объекта можно учитывать, присвоив следующие номера:
- центр города – 4;
- вблизи центра – 3;
- середина города – 2;
- окраина – 1.
Дисперсионный анализ предназначен
для количественного
Методы дисперсионного анализа позволяют формировать единую базу данных объектов-аналогов и оценивать величину влияния конкретных факторов на исследуемый результативный признак.
2.2.Задача №11 на однофакторный дисперсионный анализ данных наблюдений.
Для сравнения влияния факторов на результативный признак необходим определенный статистический материал – каждому уровню фактора должна соответствовать определенная выборка значений результативного признака.
Статистический материал удобно представлять в виде таблицы 1.
Т а б л и ц а 1
Матрица экспериментов для однофакторного анализа
Уровни фактора |
Номер выборки | |||
1 |
2 |
… |
| |
Значения результативного признака |
…
|
…
|
…
| |
Объем выборки |
|
|
| |
Общее число наблюдений .
Прежде чем судить о количественном влиянии фактора, необходимо установить наличие такого влияния. Возможно, расхождение значений результативного признака для различных уровней фактора объясняется действием чистой случайности.
На статистическом языке это предположение означает проверку однородности всех выборок таблицы 1, т.е. проверку принадлежности всех значений результативного признака одной генеральной совокупности. Основной процедурой дисперсионного анализа является проверка этой гипотезы с помощью статистических критериев.
Основная идея однофакторного
дисперсионного анализа заключается
в сравнении дисперсии
Пусть фактор имеет различных уровней, на каждом из которых выполнено наблюдений. Следовательно, наблюдалось значений признака (свойства) , где - номер наблюдения ( ), - номер уровня фактора ( ).
Дисперсионный анализ основан на предположении об однородности рядов измерений, нормальном распределении и независимости этих рядов.
Чем существеннее влияние фактора на признак , тем сильней будут различаться между собой средние значения групп наблюдений на разных уровнях фактора .
Существуют понятия:
- общая сумма квадратов - сумма квадратов отклонений всех возможных значений признака от их общего среднего значения
- сумма квадратов между группами или по факторам - взвешенная сумма квадратов отклонений средних значений по группам от общего среднего значения
- сумма квадратов внутри групп - сумма квадратов отклонений возможных значений признака каждой группы (уровня фактора) от среднего значения этой группы
где - соответственно среднее значение группы и общее среднее значение результативного признака, определяемые по формулам
Для оценки влияния фактора следует разложить общую сумму квадратов на составляющие: сумму квадратов между группами (по факторам) и сумму квадратов внутри групп. Следовательно,
Сумма отражает влияние на результативный признак уровней фактора, а сумма - влияние погрешностей измерений. Так как , то сумму называют еще остаточной суммой квадратов.
Суммы квадратов , , , деленные на соответствующие числа степеней свободы, дают три несмещенные оценки дисперсии генеральной совокупности:
Первая оценка называется общей оценкой дисперсии (или выборочной дисперсией), вторая – оценкой дисперсии по факторам (оценкой дисперсии между группами или факторной дисперсией) и третья – остаточной оценкой дисперсии (оценкой дисперсии внутри групп или остаточной дисперсией).
Число степеней свободы представляет собой число независимых отклонений значений признака от его среднего значения. Сумма имеет = степень свободы, так как из отклонений групповых средних от общей средней независимых будет ( ), а последнее отклонение выражается через все предыдущие. Сумма имеет = ( ) ( ) степеней свободы, так как вычисляется по отклонениям наблюдений от средних. Число степеней свободы проверяется путем сложения тем же способом, что и сумма квадратов (5), т.е. = .
Если факторная дисперсия окажется меньше остаточной , то фактор оказывает несущественное влияние на признак .
Проверка значимости оценок дисперсии выполняется с помощью – критерия Фишера, расчетное значение которого определяется дисперсионным отношением
Если расчетное значение критерия окажется меньше критического, то нет оснований считать, что рассматриваемый фактор влияет на изменчивость средних значений случайной величины. Если , то на принятом уровне значимости делается вывод о существенном влиянии фактора на признак .
После того как выполнена оценка влияния фактора на изменчивость средних значений случайной величины в целом и установлено, что фактор влияет на изменчивость средних значений, то переходят к подробному исследованию отдельных уровней фактора. Для этого проводится оценка расхождения средних значений, полученных при наблюдениях по отдельным уровням фактора.
Для сравнения двух выборочных средних используют - статистику. Вычисляют общую дисперсию двух выборок и расчетное значение - статистики по формулам:
Критическое значение - статистики определяется с помощью статистической функции СТЬЮДРАСПОБР. Число степеней свободы . Гипотеза о равенстве выборочных средних подтверждается, если .
Задача №11
Группа, разрабатывающая новую подписную политику, решила проверить влияние прямого маркетинга по телефону на количество подписчиков. Было принято решение повысить продолжительность телефонных разговоров с потенциальными подписчиками, поскольку при более продолжительном разговоре вероятность оформления подписки повышается. Группа решила исследовать влияние разновидности презентации на продолжительность разговора. Для этого была создана случайная группа из 24 женщин, разделенная на три подгруппы по 8 женщин. В каждой подгруппе использовалась структурированная, полуструктурированная и совершенно неструктурированная презентация. Все звонки выполнялись с 19 до 21 часа. Женщины знали, что исследователи внимательно следят за их работой, но не знали, какой именно разговор будет прослушан. Продолжительность разговора измерялась в секундах, прошедших от момента, когда абонент ответил на вопрос, до момента, когда он положил трубку. Результаты приведены в таблице 2.
Т а б л и ц а 1
Продолжительность разговора
План презентации | |||
Структури рованный |
Полуструкту рированный |
Неструктури рованный | |
Продолжи тельность разговора, с |
38,8 |
41,8 |
32,9 |
42,1 |
36,4 |
36,1 | |
45,2 |
39,1 |
39,2 | |
34,8 |
28,7 |
29,3 | |
48,3 |
36,4 |
41,9 | |
37,8 |
36,1 |
31,7 | |
41,1 |
35,8 |
35,2 | |
43,6 |
33,7 |
38,1 | |
Решение
По условию задачи: n = 8, p = 3.
По исходным данным из таблицы 2 делаю однофакторный дисперсионный анализ в среде ЭТ. Для этого открываю надстройку Сервис Анализ данных Однофакторный дисперсионный анализ. Результаты приведены в таблице 3:
Таблица 3
Однофакторный дисперсионный анализ
ИТОГИ |
||||||
Группы |
Счет |
Сумма |
Среднее |
Дисперсия |
||
38,8 |
7 |
292,9 |
41,84286 |
20,43619048 |
||
41,8 |
7 |
246,2 |
35,17143 |
10,62571429 |
||
32,9 |
7 |
251,5 |
35,92857 |
18,90904762 |
||
Дисперсионный анализ |
||||||
Источник вариации |
SS |
df |
MS |
F |
P-Значение |
F критическое |
Между группами |
186,8066667 |
2 |
93,40333 |
5,607457666 |
0,012794133 |
3,554557146 |
Внутри групп |
299,8257143 |
18 |
16,65698 |
|||
Итого |
486,632381 |
20 |
||||
В таблице 3 обозначено: - суммы квадратов; - степени свободы; - дисперсии; - расчетное значение - критерия Фишера; - значение. Так, как < =0,05, то исследуемый фактор статистически значим.
Из таблицы 3 видно, что и из этого можно сделать вывод, что маркетинг влияет на увеличение количества подписчиков.
План презентации более структурирован это видно из таблицы итогов, так как 38,8 - наибольшее значение, а дисперсия- 20.
Численные характеристики легко получить с помощью инструмента «Описательная статистика» пакета анализа:
Таблица 4
38,8 |
41,8 |
32,9 |
|||
Среднее |
41,84285714 |
Среднее |
35,17143 |
Среднее |
35,92857143 |
Стандартная ошибка |
1,708641502 |
Стандартная ошибка |
1,232055 |
Стандартная ошибка |
1,643560926 |
Медиана |
42,1 |
Медиана |
36,1 |
Медиана |
36,1 |
Мода |
#Н/Д |
Мода |
36,4 |
Мода |
#Н/Д |
Стандартное отклонение |
4,520640494 |
Стандартное отклонение |
3,259711 |
Стандартное отклонение |
4,348453474 |
Дисперсия выборки |
20,43619048 |
Дисперсия выборки |
10,62571 |
Дисперсия выборки |
18,90904762 |
Эксцесс |
-0,256849233 |
Эксцесс |
2,875675 |
Эксцесс |
-0,624625696 |
Асимметричность |
-0,260953931 |
Асимметричность |
-1,406701 |
Асимметричность |
-0,309480352 |
Интервал |
13,5 |
Интервал |
10,4 |
Интервал |
12,6 |
Минимум |
34,8 |
Минимум |
28,7 |
Минимум |
29,3 |
Максимум |
48,3 |
Максимум |
39,1 |
Максимум |
41,9 |
Сумма |
292,9 |
Сумма |
246,2 |
Сумма |
251,5 |
Счет |
7 |
Счет |
7 |
Счет |
7 |
Описательная статистика
По итогам таблицы4 данные однородные: средние значения и медианы имеют один порядок, а асимметричность и эксцесс стремятся к нулю, то влияние прямого маркетинга по телефону на количество подписчиков подчиняются нормальному закону распределения.
3. Формирование выборки из выборок малого объема.Задача вариант № 10
Сформировать выборку признака Y (стоимость 1 м2 внутренней площади, у.е.с. (условных единиц стоимости)) из выборок малого объема, соответствующих варианту:
Таблица 5
Вариант 10 |
|||
Выборки | |||
№ |
|||
набл. |
1 |
2 |
3 |
1 |
101,1 |
115,6 |
154,4 |
2 |
98,45 |
107,6 |
82,74 |
3 |
63,15 |
111 |
73,92 |
4 |
80,46 |
80 |
107,5 |
5 |
154,4 |
111,7 |
83,56 |
По исходным данным из таблицы 5 делаю однофакторный дисперсионный анализ в среде ЭТ. Для этого открываю надстройку Сервис Анализ данных Однофакторный дисперсионный анализ. Результаты приведены в таблице 6:
Таблица 6
Однофакторный дисперсионный анализ
ИТОГИ |
||||||
Группы |
Счет |
Сумма |
Среднее |
Дисперсия |
||
1 |
5 |
497,56 |
99,512 |
1175,37897 |
||
2 |
5 |
525,9 |
105,18 |
206,212 |
||
3 |
5 |
502,12 |
100,424 |
1065,76468 |
||
Дисперсионный анализ |
||||||
Источник вариации |
SS |
df |
MS |
F |
P-Значение |
F критическое |
Между группами |
92,62917 |
2 |
46,31459 |
0,056773015 |
0,94506072 |
3,885293835 |
Внутри групп |
9789,423 |
12 |
815,7852 |
|||
Итого |
9882,052 |
14 |
||||
В результате расчета получено:.F=0,057 Fkp=3,89, следовательно, элементы выборок однородны и их можно представить, одной выборкой объемом .
Для получения численных
характеристик пользуюсь
Таблица 7
Описательная статистика
1 |
2 |
3 |
|||
Среднее |
99,512 |
Среднее |
105,18 |
Среднее |
100,424 |
Стандартная ошибка |
15,33218 |
Стандартная ошибка |
6,422025 |
Стандартная ошибка |
14,5997581 |
Медиана |
98,45 |
Медиана |
111 |
Медиана |
83,56 |
Мода |
#Н/Д |
Мода |
#Н/Д |
Мода |
#Н/Д |
Стандартное отклонение |
34,2838 |
Стандартное отклонение |
14,36008 |
Стандартное отклонение |
32,6460515 |
Дисперсия выборки |
1175,379 |
Дисперсия выборки |
206,212 |
Дисперсия выборки |
1065,76468 |
Эксцесс |
1,913276 |
Эксцесс |
4,251337 |
Эксцесс |
2,08336347 |
Асимметричность |
1,141233 |
Асимметричность |
-2,01846 |
Асимметричность |
1,54082852 |
Интервал |
91,25 |
Интервал |
35,6 |
Интервал |
80,48 |
Минимум |
63,15 |
Минимум |
80 |
Минимум |
73,92 |
Максимум |
154,4 |
Максимум |
115,6 |
Максимум |
154,4 |
Сумма |
497,56 |
Сумма |
525,9 |
Сумма |
502,12 |
Счет |
5 |
Счет |
5 |
Счет |
5 |
Из результата расчета видно, что данные однородные: средние значения и медианы имеют один порядок, а эксцесс и асимметричность близки к нулю.

- Контрольная работа по "Информационные системы и технологии в учете"
- Контрольная работа по «Информационные системы маркетинга»
- Контрольная работа по «Информационные системы маркетинга»
- Контрольная работа по “Информационные технологии”
- Контрольная работа по «Информационные технологии»
- Контрольная работа по «Информационные технологии»
- Контрольная работа по «Информационные технологии»
- Контрольная работа по "Информационные системы в экономике"
- Контрольная работа по "Информационные системы в экономике"
- Контрольная работа по "Информационные системы в экономике"
- Контрольная работа по "Информационные системы в экономике"
- Контрольная работа по «Информационные системы в экономике»
- Контрольная работа по «Информационные системы в экономике»
- Контрольная работа по «Информационные системы в экономике»