Контрольная работа по "Интеллектуальной информационой системе"
ЧОУ ВПО Институт экономики, управления и права (г. Казань)
Набережночелнинский филиал
Экономический факультет
Кафедра «Информационные технологии»
Вариант 4
(контрольная работа
по дисциплине «
Исполнитель студент:
группы 1091ДУ _________________ Ахтя
Проверил:старший
преподаватель _______________
Набережные Челны – 2011
Задание 1
Код |
Возраст |
Пол |
Состоит в браке |
Иждивенцы |
Доход |
Опыт работы |
Срок проживания |
Недвижимость |
Месячный платеж |
Класс заемщика |
1 |
26 |
мужской |
Да |
0 |
12100 |
8 |
6 |
0 |
3024 |
хороший |
2 |
32 |
мужской |
Да |
2 |
27600 |
14 |
8 |
0 |
2358 |
хороший |
3 |
44 |
женский |
Нет |
1 |
12800 |
22 |
11 |
40 |
6252 |
хороший |
4 |
57 |
мужской |
Да |
0 |
7500 |
28 |
17 |
34 |
3758 |
плохой |
5 |
30 |
мужской |
Да |
1 |
20700 |
12 |
6 |
0 |
8200 |
хороший |
6 |
33 |
мужской |
Да |
1 |
14500 |
15 |
25 |
13 |
4100 |
хороший |
7 |
39 |
женский |
Да |
1 |
7000 |
21 |
4 |
0 |
5842 |
плохой |
8 |
24 |
женский |
Да |
2 |
12700 |
6 |
6 |
0 |
3485 |
хороший |
9 |
26 |
женский |
Да |
0 |
4700 |
8 |
3 |
34 |
2306 |
плохой |
10 |
29 |
женский |
Да |
1 |
14500 |
11 |
27 |
47 |
1025 |
хороший |
11 |
33 |
мужской |
Да |
2 |
10000 |
11 |
19 |
0 |
3417 |
плохой |
12 |
32 |
мужской |
Нет |
0 |
8500 |
14 |
9 |
0 |
5022 |
плохой |
13 |
28 |
женский |
Да |
0 |
7500 |
10 |
15 |
0 |
2392 |
плохой |
14 |
36 |
женский |
Да |
2 |
6500 |
18 |
30 |
0 |
5432 |
плохой |
15 |
39 |
мужской |
Нет |
1 |
15500 |
19 |
2 |
39 |
4100 |
хороший |
16 |
39 |
женский |
Да |
1 |
14600 |
17 |
39 |
0 |
3998 |
хороший |
17 |
29 |
женский |
Нет |
1 |
9200 |
11 |
16 |
0 |
2460 |
хороший |
18 |
26 |
мужской |
Да |
1 |
15500 |
8 |
5 |
0 |
2255 |
хороший |
19 |
39 |
мужской |
Нет |
0 |
7600 |
19 |
6 |
0 |
3007 |
хороший |
20 |
32 |
мужской |
Нет |
3 |
11000 |
14 |
17 |
0 |
3827 |
плохой |
21 |
36 |
мужской |
Да |
3 |
11500 |
15 |
25 |
32 |
3998 |
плохой |
22 |
34 |
мужской |
Нет |
1 |
12000 |
6,5 |
5 |
0 |
3588 |
хороший |
23 |
32 |
мужской |
Нет |
2 |
7500 |
14 |
2 |
36 |
6048 |
плохой |
24 |
34 |
мужской |
Да |
2 |
8800 |
16 |
3 |
12 |
2870 |
хороший |
25 |
37 |
мужской |
Нет |
1 |
15000 |
13 |
2 |
0 |
7175 |
плохой |
26 |
34 |
мужской |
Нет |
2 |
12500 |
6 |
7 |
41 |
4408 |
плохой |
27 |
33 |
женский |
Да |
1 |
34300 |
15 |
3 |
0 |
5330 |
хороший |
28 |
39 |
женский |
Да |
1 |
13000 |
21 |
21 |
0 |
3895 |
плохой |
29 |
34 |
женский |
Нет |
2 |
11500 |
13 |
2 |
38 |
4237 |
плохой |
30 |
26 |
мужской |
Нет |
3 |
8000 |
4 |
7 |
0 |
4305 |
плохой |
31 |
38 |
женский |
Нет |
0 |
9000 |
14 |
12 |
40 |
5535 |
плохой |
32 |
37 |
мужской |
Да |
1 |
17500 |
13 |
8 |
0 |
5535 |
плохой |
33 |
32 |
мужской |
Да |
1 |
30000 |
14 |
24 |
34 |
7175 |
хороший |
34 |
24 |
мужской |
Нет |
0 |
10500 |
6 |
3 |
0 |
5842 |
хороший |
35 |
37 |
мужской |
Нет |
3 |
13000 |
14 |
21 |
0 |
7585 |
плохой |
36 |
27 |
мужской |
Да |
1 |
12800 |
5 |
3 |
10 |
7482 |
плохой |
37 |
37 |
женский |
Нет |
0 |
2500 |
8 |
7 |
39 |
3075 |
плохой |
38 |
54 |
мужской |
Да |
0 |
14100 |
26 |
2 |
38 |
3998 |
хороший |
39 |
40 |
женский |
Да |
2 |
7800 |
19 |
3 |
0 |
3382 |
плохой |
40 |
28 |
мужской |
Нет |
0 |
4500 |
10 |
4 |
0 |
3178 |
плохой |
41 |
35 |
мужской |
Да |
0 |
8000 |
13 |
15 |
0 |
5330 |
плохой |
42 |
32 |
мужской |
Да |
1 |
14500 |
14 |
16 |
35 |
4612 |
хороший |
43 |
26 |
мужской |
Да |
2 |
12500 |
8 |
4 |
34 |
4818 |
плохой |
44 |
36 |
мужской |
Да |
0 |
8500 |
8 |
3 |
29 |
3382 |
хороший |
45 |
37 |
мужской |
Нет |
2 |
26500 |
16 |
31 |
30 |
820 |
хороший |
46 |
31 |
женский |
Да |
1 |
11400 |
13 |
3 |
35 |
5842 |
хороший |
47 |
35 |
мужской |
Да |
1 |
8500 |
16 |
28 |
0 |
4408 |
плохой |
48 |
38 |
мужской |
Да |
2 |
11000 |
4,5 |
8 |
24 |
6458 |
хороший |
49 |
51 |
мужской |
Да |
0 |
12000 |
15 |
2 |
36 |
2870 |
хороший |
50 |
36 |
женский |
Да |
0 |
19100 |
8,5 |
32 |
64 |
6560 |
хороший |
51 |
30 |
женский |
Нет |
2 |
10500 |
12 |
8 |
0 |
6970 |
плохой |
52 |
37 |
мужской |
Да |
2 |
9000 |
16 |
4 |
0 |
6560 |
плохой |
53 |
36 |
мужской |
Нет |
1 |
16000 |
14 |
19 |
39 |
6355 |
хороший |
54 |
27 |
мужской |
Нет |
1 |
10000 |
9 |
23 |
33 |
4920 |
плохой |
55 |
27 |
мужской |
Да |
0 |
6500 |
9 |
23 |
0 |
4818 |
плохой |
56 |
34 |
мужской |
Нет |
0 |
11300 |
16 |
34 |
21 |
3844 |
хороший |
57 |
34 |
женский |
Да |
1 |
9000 |
4,5 |
3 |
0 |
4100 |
плохой |
58 |
32 |
мужской |
Да |
1 |
32500 |
14 |
7 |
0 |
3007 |
хороший |
59 |
33 |
мужской |
Да |
0 |
24000 |
13 |
15 |
0 |
4920 |
хороший |
60 |
36 |
мужской |
Нет |
0 |
6500 |
18 |
6 |
0 |
3588 |
плохой |
61 |
32 |
мужской |
Да |
1 |
10500 |
11 |
16 |
30 |
3639 |
хороший |
62 |
45 |
женский |
Да |
0 |
14000 |
2 |
4 |
0 |
7278 |
плохой |
63 |
22 |
мужской |
Нет |
0 |
13000 |
4 |
5 |
0 |
2306 |
хороший |
64 |
29 |
мужской |
Да |
2 |
11000 |
11 |
9 |
0 |
4510 |
плохой |
65 |
35 |
мужской |
Да |
0 |
11500 |
5 |
28 |
36 |
1589 |
хороший |
66 |
32 |
женский |
Да |
1 |
27000 |
14 |
2 |
0 |
3792 |
хороший |
67 |
34 |
мужской |
Да |
1 |
13500 |
6 |
3 |
0 |
3758 |
плохой |
68 |
35 |
женский |
Да |
1 |
9500 |
8,5 |
16 |
0 |
4408 |
плохой |
69 |
27 |
женский |
Нет |
2 |
19500 |
9 |
22 |
0 |
9840 |
хороший |
70 |
40 |
мужской |
Нет |
1 |
5500 |
8,5 |
11 |
0 |
3553 |
плохой |
71 |
40 |
женский |
Нет |
0 |
12000 |
21 |
8 |
0 |
5125 |
хороший |
72 |
35 |
мужской |
Да |
1 |
7000 |
16 |
32 |
0 |
6458 |
плохой |
73 |
24 |
мужской |
Да |
2 |
22000 |
6 |
5 |
0 |
820 |
хороший |
74 |
31 |
мужской |
Да |
1 |
21500 |
13 |
27 |
0 |
3690 |
хороший |
75 |
26 |
женский |
Да |
1 |
14000 |
5 |
24 |
0 |
4715 |
хороший |
76 |
32 |
женский |
Да |
1 |
9500 |
14 |
31 |
0 |
3792 |
плохой |
77 |
24 |
мужской |
Нет |
3 |
14000 |
6 |
20 |
0 |
5022 |
плохой |
78 |
40 |
мужской |
Да |
2 |
15500 |
19 |
9 |
0 |
5945 |
плохой |
79 |
30 |
мужской |
Да |
0 |
16900 |
12 |
19 |
0 |
6252 |
хороший |
80 |
24 |
мужской |
Да |
3 |
14500 |
6 |
3 |
0 |
1538 |
хороший |
81 |
40 |
мужской |
Нет |
2 |
33500 |
18 |
11 |
0 |
5125 |
хороший |
82 |
23 |
мужской |
Нет |
2 |
7500 |
5 |
16 |
0 |
7175 |
плохой |
83 |
25 |
мужской |
Да |
1 |
3400 |
7 |
23 |
34 |
5638 |
плохой |
84 |
59 |
женский |
Да |
0 |
18100 |
15 |
2 |
30 |
2819 |
хороший |
85 |
31 |
мужской |
Да |
2 |
21000 |
12 |
18 |
32 |
4715 |
хороший |
86 |
37 |
женский |
Да |
1 |
7000 |
14 |
22 |
0 |
2323 |
плохой |
87 |
25 |
женский |
Да |
0 |
11500 |
7 |
16 |
0 |
4408 |
хороший |
88 |
33 |
мужской |
Да |
1 |
4000 |
15 |
5 |
0 |
2204 |
плохой |
89 |
38 |
женский |
Да |
1 |
11000 |
19 |
32 |
0 |
3895 |
хороший |
90 |
42 |
мужской |
Да |
3 |
15000 |
13 |
3 |
39 |
359 |
хороший |
91 |
28 |
мужской |
Нет |
0 |
8500 |
10 |
25 |
0 |
2733 |
хороший |
Этап 1
Выбор атрибута разбиения
Энтропия множества:
Info (T)=-(46/91)*log2(46/91)-(45/
Разбиение по атрибуту А 2 :
InfoS2 (T)= 30/91*((15/30*LOG(15/30;2)+15/
Таким образом прирост
информации при использовании атрибута
А , для разбиения исходного
Gain (S2) = 0,999-0,554=0,445
Разбиение по атрибуту А 3 :
При использовании разбиения на основе атрибута А , проведя аналогичные вычисления получим:
ES3 (T)= =32/91*((17/32*LOG(17/32;2)+
Тогда прирост информации обеспечиваемый разбиением исходного подмножества на основе атрибута А3 будет:
Gain (S3) =0,999-0,577=0,422 бит
Разбиение по атрибуту А1 :
Проверка по числовым атрибутам.
После сортировки примеров множества
по возрастанию значений атрибута получим
следующий порядок: {23,24,25,26,27,28,29,30,31,
z={23,24,25,26,27,28,29,30,31,
Из 22 значений оптимальным будет то, которое обеспечивает наибольший прирост информации. Лучшим значением порога будет z=30
Соответствующий процесс вычисления прироста информации для разбиения S1 (А2<= 30 или А2>30 ) производится следующим образом:
InfoS1 (T)= 28/91*(13/28*LOG(13/28;2)+15/
Gain (S1) = 0,999-0,554=0,445 бит
Разбиение по атрибуту А4 :
Проверка по числовым атрибутам.
После сортировки примеров множества по возрастанию значений атрибута получим следующий порядок: {0,1,2,3} и множество возможных пороговых значений
z={0,1,2,3}
Из 4 значений оптимальным будет то, которое обеспечивает наибольший прирост информации. Лучшим значением порога будет z=1 (СРЗНАЧ(0;3)=1)
Соответствующий процесс вычисления прироста информации для разбиения S4 (А2<= 1 или А2>1 ) производится следующим образом:
InfoS4 (T)=62/91*((26/62*LOG(26/62;2)
;
Gain (S4) = 0,999-0,881=0,117 бит
Разбиение по атрибуту А5 :
Проверка по числовым атрибутам.
Лучшим значением порога будет z=10000
Соответствующий процесс вычисления прироста информации для разбиения S5 (А2<= 10000 или А2>10000 ) производится следующим образом:
InfoS5 (T)= =32/91*((28/32*LOG(28/32;2)+4/
;Gain (S5) = 0,999-0,383=0,616 бит
Разбиение по атрибуту А6 :
Проверка по числовым атрибутам.
Лучшим значением порога будет z=10
Соответствующий процесс вычисления прироста информации для разбиения S6 (А2<= 10 или А2>10 ) производится следующим образом:
InfoS6 (T)= =(36/91*(12/36*LOG(12/36;2)+
Gain (S6) = 0,999-0,605=0,394 бит
Разбиение по атрибуту А7 :
Проверка по числовым атрибутам.
Лучшим значением порога будет z=10
Соответствующий процесс вычисления прироста информации для разбиения S7 (А2<= 10 или А2>10 ) производится следующим образом:
InfoS7 (T)= =47/91*((23/47*LOG(23/47;2)+
Gain (S7) = 0,999-0,766=0,233 бит
Разбиение по атрибуту А8 :
Проверка по числовым атрибутам.
Лучшим значением порога будет z=0
Соответствующий процесс вычисления прироста информации для разбиения S8 (А2<= 0 или А2>0) производится следующим образом:
InfoS8 (T)= =58/91*((32/58*LOG(32/58;2)+
Gain (S8) = 0,999-0,851=0,148 бит
Разбиение по атрибуту А9 :
Проверка по числовым атрибутам.
Лучшим значением порога будет z=5000
Соответствующий процесс вычисления прироста информации для разбиения S9 (А2<= 5000или А2>5000) производится следующим образом:
InfoS9 (T)= =60/91*((26/60*LOG(26/60;2)+
Gain (S9) = 0,999-0,871=0,128 бит
Таким образом, рассчитан прирост информации по всем атрибутам. Теперь необходимо выбрать тот атрибут разбиения, по которому прирост информации максимален.
A1 Gain(S1)= 0,445 бит |
|
A2 Gain(S2)= 0,445 бит |
|
A3 Gain(S3)= 0,422 бит |
|
A4 Gain(S4)= 0,117 бит |
|
A5 Gain(S5)= 0,616бит |
наибольший прирост информации |
A6 Gain(S6)= 0,394 бит |
|
A7 Gain(S7)= 0,233 бит |
|
A8 Gain(S8)= 0,148 бит |
|
A9 Gain(S9)= 0,128 бит |
Корневой узел по атрибуту А5 создаст 2 ветвей – по одной для каждого значения атрибута:
а1 |
а2 |
а3 |
а4 |
а6 |
а7 |
а8 |
а9 |
Класс |
37 |
женский |
Нет |
0 |
8 |
7 |
39 |
3075 |
плохой |
25 |
мужской |
Да |
1 |
7 |
23 |
34 |
5638 |
плохой |
33 |
мужской |
Да |
1 |
15 |
5 |
0 |
2204 |
плохой |
28 |
мужской |
Нет |
0 |
10 |
4 |
0 |
3178 |
плохой |
26 |
женский |
Да |
0 |
8 |
3 |
34 |
2306 |
плохой |
40 |
мужской |
Нет |
1 |
8,5 |
11 |
0 |
3553 |
плохой |
36 |
женский |
Да |
2 |
18 |
30 |
0 |
5432 |
плохой |
27 |
мужской |
Да |
0 |
9 |
23 |
0 |
4818 |
плохой |
36 |
мужской |
Нет |
0 |
18 |
6 |
0 |
3588 |
плохой |
39 |
женский |
Да |
1 |
21 |
4 |
0 |
5842 |
плохой |
35 |
мужской |
Да |
1 |
16 |
32 |
0 |
6458 |
плохой |
37 |
женский |
Да |
1 |
14 |
22 |
0 |
2323 |
плохой |
57 |
мужской |
Да |
0 |
28 |
17 |
34 |
3758 |
плохой |
28 |
женский |
Да |
0 |
10 |
15 |
0 |
2392 |
плохой |
32 |
мужской |
Нет |
2 |
14 |
2 |
36 |
6048 |
плохой |
23 |
мужской |
Нет |
2 |
5 |
16 |
0 |
7175 |
плохой |
39 |
мужской |
Нет |
0 |
19 |
6 |
0 |
3007 |
плохой |
40 |
женский |
Да |
2 |
19 |
3 |
0 |
3382 |
плохой |
26 |
мужской |
Нет |
3 |
4 |
7 |
0 |
4305 |
плохой |
35 |
мужской |
Да |
0 |
13 |
15 |
0 |
5330 |
плохой |
32 |
мужской |
Нет |
0 |
14 |
9 |
0 |
5022 |
плохой |
36 |
мужской |
Да |
0 |
8 |
3 |
29 |
3382 |
плохой |
35 |
мужской |
Да |
1 |
16 |
28 |
0 |
4408 |
плохой |
28 |
мужской |
Нет |
0 |
10 |
25 |
0 |
2733 |
плохой |
34 |
мужской |
Да |
2 |
16 |
3 |
12 |
2870 |
плохой |
38 |
женский |
Нет |
0 |
14 |
12 |
40 |
5535 |
плохой |
37 |
мужской |
Да |
2 |
16 |
4 |
0 |
6560 |
плохой |
34 |
женский |
Да |
1 |
4,5 |
3 |
0 |
4100 |
плохой |
29 |
женский |
Нет |
1 |
11 |
16 |
0 |
2460 |
плохой |
35 |
женский |
Да |
1 |
8,5 |
16 |
0 |
4408 |
плохой |
32 |
женский |
Да |
1 |
14 |
31 |
0 |
3792 |
плохой |
33 |
мужской |
Да |
2 |
11 |
19 |
0 |
3417 |
плохой |
27 |
мужской |
Нет |
1 |
9 |
23 |
33 |
4920 |
плохой |
а1 |
а2 |
а3 |
а4 |
а6 |
а7 |
а8 |
а9 |
Класс |
24 |
мужской |
Нет |
0 |
6 |
3 |
0 |
5842 |
хороший |
30 |
женский |
Нет |
2 |
12 |
8 |
0 |
6970 |
плохой |
32 |
мужской |
Да |
1 |
11 |
16 |
30 |
3639 |
хороший |
32 |
мужской |
Нет |
3 |
14 |
17 |
0 |
3827 |
плохой |
38 |
мужской |
Да |
2 |
4,5 |
8 |
24 |
6458 |
хороший |
29 |
мужской |
Да |
2 |
11 |
9 |
0 |
4510 |
плохой |
38 |
женский |
Да |
1 |
19 |
32 |
0 |
3895 |
хороший |
34 |
мужской |
Нет |
0 |
16 |
34 |
21 |
3844 |
хороший |
31 |
женский |
Да |
1 |
13 |
3 |
35 |
5842 |
хороший |
36 |
мужской |
Да |
3 |
15 |
25 |
32 |
3998 |
плохой |
34 |
женский |
Нет |
2 |
13 |
2 |
38 |
4237 |
плохой |
35 |
мужской |
Да |
0 |
5 |
28 |
36 |
1589 |
хороший |
25 |
женский |
Да |
0 |
7 |
16 |
0 |
4408 |
хороший |
34 |
мужской |
Нет |
1 |
6,5 |
5 |
0 |
3588 |
хороший |
51 |
мужской |
Да |
0 |
15 |
2 |
36 |
2870 |
хороший |
40 |
женский |
Нет |
0 |
21 |
8 |
0 |
5125 |
хороший |
26 |
мужской |
Да |
0 |
8 |
6 |
0 |
3024 |
хороший |
34 |
мужской |
Нет |
2 |
6 |
7 |
41 |
4408 |
плохой |
26 |
мужской |
Да |
2 |
8 |
4 |
34 |
4818 |
плохой |
24 |
женский |
Да |
2 |
6 |
6 |
0 |
3485 |
хороший |
44 |
женский |
Нет |
1 |
22 |
11 |
40 |
6252 |
хороший |
27 |
мужской |
Да |
1 |
5 |
3 |
10 |
7482 |
плохой |
39 |
женский |
Да |
1 |
21 |
21 |
0 |
3895 |
плохой |
37 |
мужской |
Нет |
3 |
14 |
21 |
0 |
7585 |
плохой |
22 |
мужской |
Нет |
0 |
4 |
5 |
0 |
2306 |
хороший |
34 |
мужской |
Да |
1 |
6 |
3 |
0 |
3758 |
плохой |
45 |
женский |
Да |
0 |
2 |
4 |
0 |
7278 |
плохой |
26 |
женский |
Да |
1 |
5 |
24 |
0 |
4715 |
хороший |
24 |
мужской |
Нет |
3 |
6 |
20 |
0 |
5022 |
плохой |
54 |
мужской |
Да |
0 |
26 |
2 |
38 |
3998 |
хороший |
33 |
мужской |
Да |
1 |
15 |
25 |
13 |
4100 |
хороший |
29 |
женский |
Да |
1 |
11 |
27 |
47 |
1025 |
хороший |
32 |
мужской |
Да |
1 |
14 |
16 |
35 |
4612 |
хороший |
24 |
мужской |
Да |
3 |
6 |
3 |
0 |
1538 |
хороший |
39 |
женский |
Да |
1 |
17 |
39 |
0 |
3998 |
хороший |
37 |
мужской |
Нет |
1 |
13 |
2 |
0 |
7175 |
плохой |
42 |
мужской |
Да |
3 |
13 |
3 |
39 |
359 |
хороший |
39 |
мужской |
Нет |
1 |
19 |
2 |
39 |
4100 |
хороший |
26 |
мужской |
Да |
1 |
8 |
5 |
0 |
2255 |
хороший |
40 |
мужской |
Да |
2 |
19 |
9 |
0 |
5945 |
плохой |
36 |
мужской |
Нет |
1 |
14 |
19 |
39 |
6355 |
хороший |
30 |
мужской |
Да |
0 |
12 |
19 |
0 |
6252 |
хороший |
37 |
мужской |
Да |
1 |
13 |
8 |
0 |
5535 |
плохой |
59 |
женский |
Да |
0 |
15 |
2 |
30 |
2819 |
хороший |
36 |
женский |
Да |
0 |
8,5 |
32 |
64 |
6560 |
хороший |
27 |
женский |
Нет |
2 |
9 |
22 |
0 |
9840 |
хороший |
30 |
мужской |
Да |
1 |
12 |
6 |
0 |
8200 |
хороший |
31 |
мужской |
Да |
2 |
12 |
18 |
32 |
4715 |
хороший |
31 |
мужской |
Да |
1 |
13 |
27 |
0 |
3690 |
хороший |
24 |
мужской |
Да |
2 |
6 |
5 |
0 |
820 |
хороший |
33 |
мужской |
Да |
0 |
13 |
15 |
0 |
4920 |
хороший |
37 |
мужской |
Нет |
2 |
16 |
31 |
30 |
820 |
хороший |
32 |
женский |
Да |
1 |
14 |
2 |
0 |
3792 |
хороший |
32 |
мужской |
Да |
2 |
14 |
8 |
0 |
2358 |
хороший |
32 |
мужской |
Да |
1 |
14 |
24 |
34 |
7175 |
хороший |
32 |
мужской |
Да |
1 |
14 |
7 |
0 |
3007 |
хороший |
40 |
мужской |
Нет |
2 |
18 |
11 |
0 |
5125 |
хороший |
33 |
женский |
Да |
1 |
15 |
3 |
0 |
5330 |
хороший |
После начального разбиения все узлы потомки будут содержать по несколько наблюдений из исходного множества, и для каждого узла затем будет повторен процесс выбора атрибута разбиения. Поскольку узел-потомок Т1, полученной в ветви для значения А, содержит 33 наблюдения, которые относятся к одному классу, то энтропия равна 0, узел объявляется листом и дальнейшее ветвление для него не проводится.
Этап 2 . Для узла Т2, включающего 58 наблюдений, может быть сделана проверка по оставшимся атрибутам. Оптимальное разбиение будет достигнуто с помощью атрибута А4 для альтернативных вариантов А4<=1 или А4>1. В соответствии с формулой энтропии можно записать:
InfoS3 (T1)=-(39/58)*log2(39/58)-(19/
При использовании атрибута А4 для разбиения Т2 с порогом 1 получим чистые узлы, поэтому InfoS4 (T2) =0. Прирост информации, обеспеченный данным разбиением составит Gain(S4)= 0,14-0 = 0,14 бит и будет максимальным.
Т2 |
Info (T2) | |
А4 |
Gain(S4(А4))=0,14 |
0 |
А1=А
А1=С
A4<=1 А4>1
Задача 2
Разбиение |
левый потомок |
правый потомок |
1 |
возраст<=30 |
возраст>=30 |
2 |
пол = женский |
пол=мужской |
3 |
брак=нет |
брак=да |
4 |
иждивенцы<=1 |
иждивенцы>=1 |
5 |
доход<=10000 |
доход>=10000 |
6 |
опыт работы<=10 |
опыт работы>=10 |
7 |
срок проживания<=10 |
срок проживания>=10 |
8 |
недвижимость<=0 |
недвижимость>=0 |
9 |
месячный платеж<=5000 |
месячный платеж>=5000 |
Результаты расчета компонентов
№ |
PL |
PR |
P(j/tL) |
P(j/tR) |
2* PL* PR |
W(s/t) |
Q(s/t) | ||
плохой |
хороший |
плохой |
хороший | ||||||
1 |
0,33 |
0,67 |
0,4 |
0,6 |
0,508 |
0,492 |
0,442 |
0,216 |
0,096 |
2 |
0,33 |
0,67 |
0,5 |
0,5 |
0,475 |
0,525 |
0,442 |
0,05 |
0,022 |
3 |
0,352 |
0,648 |
0,531 |
0,469 |
0,458 |
0,542 |
0,456 |
0,144 |
0,066 |
4 |
0,681 |
0,319 |
0,419 |
0,581 |
0,586 |
0,414 |
0,434 |
0,334 |
0,145 |
5 |
0,352 |
0,648 |
1 |
0 |
0,271 |
0,729 |
0,456 |
1,208 |
0,551 |
6 |
0,374 |
0,626 |
0,529 |
0,471 |
0,456 |
0,544 |
0,468 |
0,146 |
0,068 |
7 |
0,517 |
0,483 |
0,489 |
0,511 |
0,477 |
0,523 |
0,499 |
0,024 |
0,012 |
8 |
0,637 |
0,363 |
0,552 |
0,448 |
0,364 |
0,636 |
0,462 |
0,376 |
0,173 |
9 |
0,659 |
0,341 |
0,433 |
0,567 |
0,581 |
0,419 |
0,449 |
0,296 |
0,133 |
Доход
да
хороший класс
плохой класс
Тридцать три записи, в которых доход <=10000 и по этой причине оказавшиеся в правом узле, содержат одну и ту же целевую переменную, указывающую на плохой класс заемщика. Т.о. узел является чистым. узел будет объявлен листом, и дальнейшее разбиение по данной ветви проводится не будет. Записи в левом узле относятся к различным классам. Потребуется дальнейшее их разбиение.
№ |
PL |
PR |
P(j/tL) |
P(j/tR) |
2* PL* PR |
W(s/t) |
Q(s/t) | ||
плохой |
хороший |
плохой |
хороший | ||||||
1 |
0,31 |
0,69 |
0,278 |
0,722 |
0,275 |
0,725 |
0,428 |
0,012 |
0,005 |
2 |
0,31 |
0,69 |
0,222 |
0,778 |
0,3 |
0,7 |
0,428 |
0,156 |
0,067 |
3 |
0,31 |
0,69 |
0,389 |
0,611 |
0,225 |
0,775 |
0,428 |
0,328 |
0,14 |
4 |
0,655 |
0,345 |
0,158 |
0,842 |
0,5 |
0,5 |
0,452 |
0,684 |
0,309 |
6 |
0,328 |
0,672 |
0,316 |
0,684 |
0,256 |
0,744 |
0,441 |
0,12 |
0,053 |
7 |
0,552 |
0,448 |
0,344 |
0,656 |
0,192 |
0,808 |
0,496 |
0,304 |
0,151 |
8 |
0,586 |
0,414 |
0,324 |
0,676 |
0,208 |
0,792 |
0,485 |
0,232 |
0,113 |
9 |
0,638 |
0,362 |
0,216 |
0,784 |
0,381 |
0,619 |
0,462 |
0,33 |
0,152 |
Доход <= 10000
нет
Иждивенцы<=1
плохой класс
нет
иждивенцы>1
№ |
PL |
PR |
P(j/tL) |
P(j/tR) |
2* PL* PR |
W(s/t) |
Q(s/t) | ||
плохой |
хороший |
плохой |
хороший | ||||||
1 |
0,33 |
0,67 |
1 |
0 |
0,75 |
0,25 |
0,442 |
0,5 |
0,221 |
2 |
0,167 |
0,833 |
1 |
0 |
0,8 |
0,2 |
0,278 |
0,4 |
0,111 |
3 |
0,33 |
0,67 |
1 |
0 |
0,75 |
0,25 |
0,442 |
0,5 |
0,221 |
6 |
0,25 |
0,75 |
1 |
0 |
0,778 |
0,222 |
0,375 |
0,444 |
0,167 |
7 |
0,67 |
0,33 |
0,75 |
0,25 |
1 |
0 |
0,442 |
0,5 |
0,221 |
8 |
0,75 |
0,25 |
0,889 |
0,111 |
0,67 |
0,33 |
0,375 |
0,222 |
0,083 |
9 |
0,67 |
0,33 |
0,75 |
0,25 |
1 |
0 |
0,442 |
0,5 |
0,221 |
Доход <= 10000
нет
Иждивенцы<=1 плохой класс
да
месячный платеж<= 5000
плохой класс заемщика
да
месячный платеж<=5000 плохой класс заемщика
№ |
PL |
PR |
P(j/tL) |
P(j/tR) |
2* PL* PR |
W(s/t) |
Q(s/t) | ||
плохой |
хороший |
плохой |
хороший | ||||||
1 |
0,375 |
0,625 |
1 |
0 |
0,6 |
0, 4 |
0,469 |
0,8 |
0,375 |
2 |
0,125 |
0,875 |
1 |
0 |
0,714 |
0,286 |
0,219 |
0,572 |
0,125 |
3 |
0,25 |
0,75 |
1 |
0 |
0,67 |
0,33 |
0,375 |
0,66 |
0,248 |
6 |
0,25 |
0,75 |
1 |
0 |
0,67 |
0,33 |
0,375 |
0,66 |
0,248 |
7 |
0,75 |
0,25 |
0,67 |
0,33 |
1 |
0 |
0,375 |
0,66 |
0,248 |
8 |
0,75 |
0,25 |
0,833 |
0,167 |
0,5 |
0,5 |
0,375 |
0,666 |
0,25 |
Доход <= 10000
нет
Иждивенцы<=1 плохой класс
да
месячный платеж<= 5125
плохой класс заемщика
да
плохой класс заемщика
возраст<=30
нет
плохой класс заемщика
возраст<=30
№ |
PL |
PR |
P(j/tL) |
P(j/tR) |
2* PL* PR |
W(s/t) |
Q(s/t) | ||
плохой |
хороший |
плохой |
хороший | ||||||
2 |
0,2 |
0,8 |
1 |
0 |
0,5 |
0,5 |
0,32 |
1 |
0,32 |
3 |
0,2 |
0,8 |
1 |
0 |
0,5 |
0,5 |
0,32 |
1 |
0,32 |
7 |
0,6 |
0,4 |
0,33 |
0,67 |
1 |
0 |
0,48 |
1,34 |
0,643 |
8 |
0,8 |
0,2 |
0,75 |
0,25 |
0 |
1 |
0,32 |
1,5 |
0,48 |
Доход <= 10000
нет
Иждивенцы<=1
да нет заемщика
месячный платеж<= 5000
плохой класс заемщика
да
плохой класс заемщика
возраст<=30 нет
да
плохой класс заемщика
срок прожив<=10 нет
да плохой класс заемщика
срок прожив<=10
№ |
PL |
PR |
P(j/tL) |
P(j/tR) |
2* PL* PR |
W(s/t) |
Q(s/t) | ||
плохой |
хороший |
плохой |
хороший | ||||||
2 |
0,33 |
0,67 |
1 |
0 |
0 |
1 |
0,442 |
2 |
0,884 |
8 |
0,67 |
0,33 |
0,4 |
0,6 |
0,5 |
0,5 |
0,442 |
1 |
0,442 |

- Контрольная работа по "Интеллектуальной собственности"
- Контрольная работа по " Интеллектуальной собственности"
- Контрольная работа по "Интеллектуальной собственности"
- Контрольная работа по «Интеллектуальные информационные системы»
- Контрольная работа по "Интеллектуальные информационные системы"
- Контрольная работа по «Интернет-журналистике»
- Контрольная работа по "Интернет-маркетингу"
- Контрольная работа по "Институциональной экономике"
- Контрольная работа по "Институциональной экономике"
- Контрольная работа по "Институциональной экономике"
- Контрольная работа по «Институциональной экономике»
- Контрольная работа по "Интеграционные процессы в торговле"
- Контрольная работа по «Интеллектуальная собственность»
- Контрольная работа по "Интеллектуальное право"