Машинное представление знаний и данных. Методы хранения, поиска и обработки данных, методы естественно-языкового человеко-машинного общен
Ростовский государственный
Кафедра экономической информатики и автоматизации управления
ИНДИВИДУАЛЬНОЕ ЗАДАНИЕ
На тему: Машинное представление знаний и данных. Методы хранения, поиска и обработки данных, методы естественно-языкового человеко-машинного общения.
Факультет: Учетно-экономический
По дисциплине: Информатика
Курс:
Группа:
Направление подготовки:
Вариант:
Выполнила:
студентка Зламан Анастасия Геннадьевна
Проверил:
Старший преподаватель И.И.Мирошниченко
Город Ростов-на-Дону
Содержание
1 Машинное представление знаний и данных. Методы хранения, поиска и обработки данных, методы естественно-языкового человеко-машинного общения.
2 Системы счисления
2.1 Задача 1
2.2 Задача 2
2.3 Задача 3
2.4 Задача 4
2.5 Задача 5
3 Основы
алгоритмизации и
3.2 Задача 2
3.3 Задача 3
4 Формы
представления информации в
5 Алгебра логики
Библиографический список
Приложения
Машинное представление знаний и данных.
Для представления информации в памяти ЭВМ (как числовой так и не числовой) используется двоичный способ кодирования.
Элементарная ячейка памяти ЭВМ имеет длину 8 бит (1 байт). Каждый байт имеет свой номер (его называют адресом). Наибольшую последовательность бит, которую ЭВМ может обрабатывать как единое целое, называют машинным словом. Длина машинного слова зависит от разрядности процессора и может быть равной 16, 32 битам и т.д.
Для кодирования символов достаточно одного байта. При этом можно представить 256 символов (с десятичными кодами от 0 до 255). Набор символов персональных компьютеров чаще всего является расширением кода ASCII (American Standart Code of Information Interchange - стандартный американский код для обмена информацией).
В некоторых случаях при
Другой способ представления целых чисел - дополнительный код. Диапазон значений величин зависит от количества бит памяти отведенных для их хранения. Например, величины типа Integer лежат в диапазоне от
-32768 (-215) до 32677 (215-1) и для их хранения отводится 2 байта: типа LongInt - в диапазоне от -231 до 231-1 и размещаются в 4 байтах: типа Word - в диапазоне от 0 до 65535 (216-1) используется 2 байта и т.д.
Как видно из примеров, данные могут быть интерпретированы как числа со знаком, так и без знаков. В случае представления величины со знаком самый левый (старший) разряд указывает на положительное число, если содержит нуль, и на отрицательное, если - единицу.
Вообще, разряды нумеруются справа налево, начиная с нуля.
Дополнительный код
Дополнительный код целого отрицательного числа может быть получен по следующему алгоритму:
записать прямой код модуля числа;
инвертировать его (заменить единицы нулями, нули - единицами);
прибавить к инверсионному коду единицу.
Например, запишем дополнительный код числа -37, интерпретируя его как величину типа LongInt:
прямой код числа 37 есть 000000000000000000000000000100
инверсный код 111111111111111111111111110110
дополнительный код 111111111111111111111111110110
При получении по дополнительному коду числа, прежде всего, необходимо определить его знак. Если число окажется положительным, то просто перевести его код в десятичную систему исчисления. В случае отрицательного числа необходимо выполнить следующий алгоритм:
вычесть из кода 1;
инвертировать код;
перевести в десятичную систему счисления. Полученное число записать со знаком минус.
Несколько иной способ применяется
для представления в памяти персонального
компьютера действительных чисел. Рассмотрим
представление величин с
Любое действительное число можно записать в стандартном виде M*10p, где 1 ≤ M < 10, р- целое число. Например, 120100000 = 1,201*108. Поскольку каждая позиция десятичного числа отличается от соседней на степень числа 10, умножение на 10 эквивалентно сдвигу десятичной запятой на 1 позицию вправо. Аналогично деление на 10 сдвигает десятичную запятую на позицию влево. Поэтому приведенный выше пример можно продолжить: 120100000 = 1,201*108 = 0,1201*109 = 12,01*107... Десятичная запятая плавает в числе и больше не помечает абсолютное место между целой и дробной частями.
В приведённой выше записи М называют мантиссой числа, а р - его порядком. Для того чтобы сохранить максимальную точность, вычислительные машины почти всегда хранят мантиссу в нормализованном виде, что означает, что мантисса в данном случае есть число, лежащее между 1(10) и 2(10) (1 ≤ М < 2). Основные системы счисления здесь, как уже отмечалось выше,- 2. Способ хранения мантиссы с плавающей точкой подразумевает, что двоичная запятая находится на фиксированном месте. Фактически подразумевается, что двоичная запятая следует после первой двоичной цифры, т.е. нормализация мантиссы делает единичным первый бит, помещая тем самым значение между единицей и двойкой. Место, отводимое для числа с плавающей точкой, делится на два поля. Одно поле содержит знак и значение мантиссы, а другое содержит знак и значение порядка.
Персональный компьютер IBM PC с математическим сопроцессором 8087 позволяет работать со следующими действительными типами (диапазон значений указан по абсолютной величине):
Тип Диапазон Мантисса Байты
Real 2,9*10-39..1,7*1038 11-
Single 1,5*10-45..3,4*1038
Double
5,0*10-324..1,7*10308 15-16
Extended 3,4*10-4932..1,1*104932 19-20
Методы хранения, поиска и обработки данных
Как только вычислительные
машины начали использоваться
для обработки экономической
информации, разработчики обнаружили,
что под каждую программу (или
комплекс программ) разрабатывается
своя структура данных, позволяющая
оптимизировать вычислительный
процесс (выполнить его
База данных (БД) - это
хранящаяся во внешней памяти
ЭВМ совокупность
Информация, хранящаяся
в БД, как правило, относится
к какой-то определенной
Базы данных бывают
фактографическими и
Базы данных в третьем
и четвертом примерах
Сама по себе база
данных не может обслужить
запросы пользователя на поиск
и обработку информации. БД - это
только "информационный склад".
Обслуживание пользователя
Информационная система (ИС) - это
совокупность базы данных и всего
комплекса аппаратно-
Устройства внешней памяти, на которых хранятся БД, должны иметь высокую информационную емкость и малое время доступа к хранимой информации. Для хранения БД может использоваться как один компьютер, так и множество взаимосвязанных компьютеров.
Если различные части
одной базы данных хранятся
на множестве компьютеров,
Известны три основных типа организации данных и связей между ними:
-иерархический (в виде дерева)
-сетевой
-реляционный.
В иерархической БД
существует упорядоченность
Сетевая БД отличается большей гибкостью,
так как в ней существует возможность
устанавливать дополнительно к
вертикальным иерархическим связям
горизонтальные связи. Это облегчает
процесс поиска нужных элементов
данных, так как уже не требует
обязательного прохождения
Наиболее распространенным
способом организации данных
является реляционный способ. Реляционными
БД (от английского слова relation
- "отношение") называются БД, содержащие
информацию, организованную в виде
прямоугольных таблиц. Согласно
этому подходу, такая таблица
называется отношением. Каждая строка
таблицы содержит информацию
об одном отдельном объекте
описываемой в БД системы (о
конкретной книге, сотруднике
учреждения и пр.), а каждый
столбец - определенные характеристики
(свойства, атрибуты) этих объектов.
Например, атрибутами объектов могут
быть автор книги, должность
сотрудника, отдел, в котором он
работает, и пр. Строки такой таблицы
называются записями, а столбцы
- полями. Каждая запись должна
отличаться от других
Методы естественно-языкового
Развитие языков человеко-машинного
общения началось в 40-х гг. вместе
с появлением ЭВМ. Первыми языками
этого типа были языки описания вычислит,
процессов путем задания
К 80-м гг. существовало, по-видимому, св. 500 различных языков программирования, многочисленные версии (диалекты) некоторых наиболее распространенных языков (фортрана, алгола-60, ПЛ/I, кобола). Языки программирования обладают в определенной степени свойством саморазвития (расширяемостью) за счет возможности определения в них бесконечного числа функций; существуют языки с определяемыми типами значений (алгол-68, паскаль, ада). Это свойство дает возможность пользователю определять свой язык программирования средствами данного.
Близки к языкам программирования и др. средства человеко-машинного общения: языки операционных систем, с помощью которых пользователи организуют свое взаимодействие с вычислит, машиной и ее программным обеспечением; языки взаимодействия с базами данных и информационными системами, с помощью которых пользователи определяют и вводят информацию в систему, запрашивают в системе различные данные. Частной (и первоначально возникшей) формой запросных языков являются информационно-поисковые языки, задаваемые информационно-поисковыми тезаурусами, классификаторами понятий и предметов или просто словарями, автоматически составленными системой при вводе в нее информации. Текст на информационно-поисковом языке имеет форму назывного предложения, в котором перечисляются понятия, являющиеся признаками искомых данных. Информационно-поисковые языки могут быть чисто словарными (без грамматики), но могут обладать и грамматическими средствами выражения синтагматических и парадигматических. отношений между понятиями. Они служат не только для формулирования запросов к информационной системе, но и средством индексирования (т. е. отображения содержания) текстов, вводимых в ЭВМ.
Для взаимодействия с ЭВМ используется также строго формально определимая часть (подмножество) естественного языка, так называемый ограниченный естественный, или специализированный естественный язык, занимающий промежуточное положение между естественными и искусственными языками. Выражения на ограниченном естественном языке подобны выражениям на естественном языке, но в них не используются слова, значения которых лежат вне данной предметной области, сложные для анализа или нерегулярные грамматические формы и конструкции.
Приложение Б
2 Системы счисления
2.1 Задача 1
Перевести десятичное число из десятичной в двоичную, восьмеричную и шестнадцатеричную систему счисления.90,4
1) Перевод десятичного числа в двоичную систему счисления
90,4 = 1011010,01100
А) Перевод целой части числа:
Б) Перевод дробной части числа:
2) Перевод десятичного числа
в восьмеричную систему
90,4 = 132,31463
А)
Перевод целой части числа:
3) Перевод десятичного числа в шестнадцатеричную систему счисления
90,4 = 10,66
А)
Перевод целой части числа:
2.2 Задача 2
Перевести в десятинную систему счисления двоичное, восьмеричное и шестнадцатеричное числа.
Решение:
1) Перевод двоичного числа в десятичную систему:
1100,102 = 12,510
А) 1100 = 0*20+0*21+1*22+1*23 = 12
Б)
10,112 = 2,7510
А)
Б) 11 = 1*2-1+1*2-2 = 0,75
2) Перевод восьмеричного числа в десятичное:
7012,048 = 3594,062510
А) 7012 = 2*80+1*81+0*82+7*83 = 3594
Б) 0,04 = 0*8-1+4*8-2 = 0,0625
3) Перевод
шестнадцатеричного числа в
431,0B16 = 1073,0429687510
А) 431 = 1*160+3*161+4*162 = 1073
Б) 0B = 0*16-1+B*16-2 = 0,04296875
2.3 Задача 3
Перевести двоичное число в восьмеричную и шестнадцатеричную системы счисления. 1011010,011001
Решение:
1) Перевод двоичного числа в восьмеричное осуществляется в соответствии с таблицей А.2.
001011010,011001 = 132,318
Таблица А.2 - Перевод восьмеричного числа двоичную в систему счисления
0 |
000 |
1 |
001 |
2 |
010 |
3 |
011 |
4 |
100 |
5 |
101 |
6 |
110 |
7 |
111 |
2)
Перевод двоичного числа в
шестнадцатеричное
1011010,011001102 = 5A,6616
Таблица А.3 - Перевод из десятичной системы в шестнадцатеричную систему счисления
0 |
0000 |
1 |
0001 |
2 |
0010 |
3 |
0011 |
4 |
0100 |
5 |
0101 |
6 |
0110 |
7 |
0111 |
8 |
1000 |
9 |
1001 |
10 = А |
1010 |
11 = В |
1011 |
12 = С |
1100 |
13 = D |
1101 |
14 = E |
1110 |
15 = F |
1111 |
2.4 Задача 4
Перевести в двоичную систему счисления заданные восьмеричное и шестнадцатеричное число.
Решение:
1) Перевод
восьмеричного числа в
7012,048 = 111000001010,0001002
2) Перевод
шестнадцатеричного числа в
431,0B16 = 010000110001,000010112
2.5 Задача 5
Выполнить сложение и умножение двоичных чисел.
Решение:
1) Сложение двоичных чисел
2) Умножение двоичных чисел
Приложение В
3 Основы
алгоритмизации и
Составить блок-схему и программу, по которой меньшее из двух чисел будет умножено на большее, а большее разделено на меньшее.
Блок-схема решения задачи 1 представлена на рисунке 3.
1
Рисунок 3 – Блок-схема к задаче 1
Программный код
Результат выполнения задачи
3.2 Задача 2
Вычислить значение S.
S=
Блок-схема решения задачи 2 представлена на рисунке 4.
3
5
7
Рисунок 4 - Блок-схема к задаче 2
10
Продолжение рисунка 4
Программный код
Результат выполнения задачи
3.3 Задача 3
Дана последовательность из n целых чисел. Найти номер максимального элемента в этой последовательности.
Программный код
Результат выполнения задачи
Блок-схема по решению задачи 3 на рисунке 5
Приложение Г
4 Формы
представления информации в
Даны три числа: А= , В= и С= .
Найти произведение их дополнительных кодов и сумму их прямых кодов.
35,1210 100011 2
25,18 1001012
1С316 1110000112
Умножение дополнительных кодов

- Машинное производство
- Машинный перевод
- Машинный перевод
- Машиностроение
- Машиностроение
- Машиностроение в Кузбассе
- Машиностроение в России
- Машина как объект производства
- Машина комбинированная МДК-48462 (шасси КАМАЗ-43253 4х2). Назначение, технические характеристики автомобиля. Конструкция, принцип работы, техни
- Машина Тьюринга
- Машина Тьюринга и проблемы остановки
- Машини і механізми для обробки та нарізання овочів
- Машинист башенного крана
- Машинная графика в дактилоскопии