Інформаційний пошук
ЗМІСТ
ВСТУП |
4 |
Розділ 1. ТЕОРЕТИЧНІ АСПЕКТИ ПРОБЛЕМИ ДОСІЛДЖЕННЯ |
|
1.1. Аналіз терміносистеми дослідження |
6 |
1.2. Електронні інформаційні середовища: сутність , аналіз |
9 |
1.3. Інформаційний пошук: сутність |
17 |
ВИСНОВКИ |
23 |
СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ |
25 |
ВСТУП
Актуальність теми дослідження.
Нині спостерігається експонентне
зростання кількості джерел інформації
у світі, що зумовлено збільшенням
чисельності її споживачів, обсягу
створеної і доступної
Значний внесок у розробку теоретичних і прикладних питань підвищення ефективності інформаційного пошуку здійснили Г. Селтон, Дж. Солтон, Е. Ф. Скороходько, Л. Е. Пшенична, В. В. Сидоренко, В. М. Дріянський, О. Г. Дубінський, Ю. В. Рогушина та ін. Однак розроблені методи інформаційного пошуку, такі як зворотній зв’язок за релевантністю, різні методи модифікації запитів користувачів, недостатньою мірою враховують специфіку інформаційного пошуку в Інтернеті.
Визначальну роль у вирішенні питань користувачів інформаційних систем відіграли праці В. М. Глушкова, А. М. Довгялло, Т. А. Гаврилової, О. В. Піскуна, В. І. Дракіна, А. П. Беня та ін. Однак інформаційний пошук в Інтернеті має свої обмеження і висуває певні вимоги до моделювання користувачів, що потребує додаткових теоретичних і практичних досліджень у цій галузі. Актуальність теми зумовлена необхідністю розробки теоретичної бази довкола поняття особливостей інформаційного пошщуку.
Мета і завдання дослідження. Метою роботи є аналіз і характеристика особливостей інформаційного пошуку.
Реалізація поставленої мети передбачає вирішення таких завдань:
– зробити аналіз терміносистеми дослідження;
– проаналізувати сутність електронного інформаційного середовища;
– зазначити сутність інформаційного пошуку.
Об’єкт дослідження становить процес інформаційного пошуку.
Предметом дослідження є теоретичні особливості довкола проблеми процесу інформаційного пошуку.
Методи дослідження
Робота складається зі
вступу, одного розділу, висновків та списку
використаних джерел. Основний текст містить
26 сторінок, список використаних джерел
налічує 17
найменувань
Розділ 1. ТЕОРЕТИЧНІ АСПЕКТИ ПРОБЛЕМИ ДОСІЛДЖЕННЯ
1.1. Аналіз терміносистеми дослідження
У загальному розумінні організаційні системи, в яких оброблення інформації відбувається за допомогою засобів обчислювальної техніки, називають (автоматизованими) інформаційними системами управління. Можна також керуватися одним із таких визначень:
Інформаційна система (ІС) — це людино-машинна система, яка збирає, нагромаджує, зберігає, обробляє та видає за запитом або на замовлення користувача інформацію у вигляді даних і знань, необхідних для виконання функцій управління;
Інформаційна система — це організаційно-технічна система, яка забезпечує вироблення рішень на основі автоматизації інформаційних процесів у різних сферах людської діяльності.
Початок створення
ІС у нашій країні датують
1963 роком, коли на великих
Поняття "інформація" використовується в багатьох побутових висловах і теоретичних концепціях із різними значеннями. Найпростіші тлумачення "інформації" такі: "повідомлення про щось" [1]; "певні відомості, сукупність якихось даних, знань" [2]. У деяких визначеннях інформації йдеться про її зміст: "відомості про навколишній світ, процеси, які в ньому відбуваються, про події, ситуації, чию-небудь діяльність, що їх сприймають людина і живі організми, керуючі машини та інші системи" [3]. Є ще й інші значення поняття "інформація", що пов'язані з тим чи іншим конкретним випадком слововживання, з традицією певної галузі знань і людської діяльності [4].
Сучасне філософське розуміння поняття "інформація" свідчить про те, що воно є певною категорією, тобто таким поняттям, яке відображає найбільш загальні й істотні властивості, сторони, відношення явищ дійсності та об'єктів пізнання. Застосовування категорії "інформація" означає, що в пізнанні певного явища використана так звана "теорія інформації'" або "теорія інформаційної комунікації'", або, що теж саме, комунікаційно-інформаційний підхід. Це означає, що ті чи інші явища дійсності розглядаються людиною (суб'єктом пізнання) як складові певного комунікаційно-інформаційного процесу чи "комунікаційної системи".
Теорія комунікації, більш відома як "теорія інформації", виникла наприкінці 40-х років XX ст. при вивченні процесів передачі інформації в технічних системах, таких як телеграф, радіо, телебачення чи ЕОМ [5, c. 73]. Біля її витоків стояли Клод Шеннон і Норберт Вінер, засновники кібернетики. У цій теорії було запропоновано розглядати комунікацію як систему, що складається з елементів, які знаходяться один з одним у певних відношеннях.
Головні елементи комунікаційної системи такі:
– джерело інформації, яке виробляє "сиру" інформацію або повідомлення, що має бути переданим;
– передавач, який кодує чи модулює (змінює певні параметри), цю інформацію у форму, що підходить до каналу передачі;
– канал, по якому закодована інформація або "сигнал" передається в точку одержання. Під час передачі сигнал може бути змінений "шумом", який надходить від джерела "шуму";
– одержувач, який декодує або перемодулює одержуваний сигнал для того, щоб відкрити початкове повідомлення;
– призначення, або кінцева мета інформації.
Ця структура є основою для всіх досліджень інформаційного процесу, де б він не відбувався: у соціальній сфері, тобто в суспільстві, в процесі комунікації між людьми; чи в біологічній, між живими істотами, які не володіють свідомістю; чи в неживій природі або у фізичних та хімічних процесах.
Інформація при цьому
Властивості інформації.
Найважливішими, з практичної точки зору, властивостями інформації є цінність, достовірність та актуальність [10, c.54].
Цінність інформації — визначається забезпеченням можливості досягнення мети, поставленої перед отримувачем інформації.
Достовірність
— відповідність отриманої
Актуальність — це міра відповідності цінності та достовірності інформації поточному часу (певному часовому періоду).
Електронний ресурс — це інформаційні ресурси, які керуються комп'ютером, у тому числі ті, які потребують використання периферійного пристрою, підключеного до комп'ютера.
Електронними ресурсами є електронні дані (інформація у вигляді чисел, букв, символів, зображень, включаючи графічну інформацію, відеоінформацію тощо, або їхні комбінації), електронні програми або об'єднання цих видів в одному ресурсі.
Інформація — абстрактне поняття, що має різні значення залежно від контексту. Походить від латинського слова «informatio», яке має декілька значень:
- роз'яснення; виклад фактів, подій; витлумачення;
- представлення, поняття;
- ознайомлення, просвіта.
Загальне поняття інформації подано у філософії, де під нею розуміють відображення реального світу.
Як філософську категорію її розглядають як один з атрибутів матерії, що відбиває її структуру. Погляд на інформацію з точки зору її споживачів окреслює таке поняття:
Інформація — це нові відомості, які прийняті, зрозумілі і оцінені її користувачем як корисні.
Іншими словами, інформація — це нові знання, які отримує споживач (суб'єкт) у результаті сприйняття і переробки певних відомостей.
Отже, поняття "інформація" свідчить тільки про те, що певний процес розглядається дослідником як комунікаційно-інформаційний.
"Інформація" тут не має
ніякого конкретного
Комунікація, яка відбувається між людьми, тобто в суспільстві, зветься "соціальною". У процесі соціальної комунікації передається "соціальна інформація". Інакше кажучи, соціальна інформація — це та інформація, що функціонує в суспільстві, коли комунікаторами, тобто особами, що знаходяться в комунікаційній взаємодії, є люди.
"Нооінформація" — це інформація, яка створюється, передається і приймається людським розумом. Тобто знову йдеться про комунікацію між людьми. Отже, "нооінформація" — це синонім поняття "соціальна інформація".
1.2. Електронні інформаційні середовища: сутність , аналіз
У сучасну епоху інформаційного вибуху та інформаційної революції людство змушене за обмежений час здійснити пристосування до нових умов свого буття. Це різко актуалізує необхідність філософського обговорення самої проблеми взаємодії людини з інформаційним середовищем. На перший план виходить проблема успішної адаптації людини в сучасній інформаційному середовищі. Проблема адаптації людини невіддільна від питання про саму його сутності, актуального для філософів у всі часи. Інформаційна середа, стаючи все більш важливою і невід'ємною частиною навколишнього середовища, пред'являє до людини зростаючі адаптивні вимоги. Людство було змушене адаптуватися до природного і штучно створеного інформаційного середовища на всьому протязі свого розвитку, проте, життя сучасної людини визначається новими реаліями, новими екологічними і соціальними обставинами. Тому зараз дуже актуальна задача аналізу позитивних і негативних аспектів процесу адаптації, осмислення нових шляхів адаптації людини до середовища проживання і нових форм побудови інформаційного середовища, які повинні максимально відповідати запитам суспільства і особистості.
На зорі людства інформаційна середа збігалася з навколишнім природним середовищем. Основним джерелом інформації була природа, від якої повністю залежало життя людей. З розвитком суспільства відбувалося накопичення вторинної, соціальної інформації, яка на сьогодні відіграє визначальну роль у розвитку окремої особистості і суспільства в цілому.
Сучасне інформаційне середовище можна визначити як сукупність інформаційних умов існування суб'єкта (наявність інформаційних ресурсів і їх якість, розвиненість інформаційної інфраструктури), а також соціально-економічних і культурних умов реалізації процесів інформатизації.
Інформаційна середа з усіма своїми складовими (електронні засоби масової комунікації - радіо, телебачення, Інтернет; комп'ютеризація всіх сфер життя) стала настільки глобальним явищем у житті сучасної людини, що нинішню епоху можна з повним правом назвати інформаційною епохою [15, c.92].
Кінцевим результатом
інформаційно-комп'ютерної
– посиленням ролі інформації і знань в житті суспільства і людини, матеріалізацією інформації і перетворенням її в провідний чинник економічного розвитку, в основну економічну цінність;
– інтеграцією різних способів комунікації (усних, письмових та аудіовізуальних) в інтерактивні інформаційні мережі. Інформаційне суспільство — це мережеве суспільство: воно створено мережами виробництва, влади і досвіду, які формують «культуру реальної віртуальності».
– зосередженням на технологіях поліпшення обробки інформації, тому процес впливу знання на саме знання є специфічним для інформаційного суспільства.
– розвитком творчого потенціалу особистості і зростанням ролі свідомості в історичному процесі.
Інформаційне суспільство - це «високоорганізоване креативне суспільство».
Можна виділити наступні ключові етапи розвитку інформаційного середовища, що розрізняються по основних способах адаптування інформації: безписемне товариство, товариство з появою писемності і сучасне інформаційне суспільство. До винаходу алфавітного письма інформація зберігалася у вигляді образів, з винаходом алфавітного письма європейська культура віддала перевагу кодуванню інформації в символьному вигляді. З настанням інформаційно-технічної революції для запису, зберігання і передачі інформації використовуються обидва способи (образний і символьний). Таким чином, в усі часи людина намагалася максимально використовувати доступні для нього способи накопичувати інформацію. Використання накопиченої інформації стало одним з факторів, що дали можливість людині, як біологічного виду, вижити в боротьбі за існування.
Розвиток аудіовізуальних засобів передачі інформації (телефон, радіо, кіно, телебачення) і, особливо, комп'ютерних технологій у багато разів розширило та якісно змінило інформаційний потік який є невід’ємною складовою нашого суспільства. Засоби інформаційного впливу роблять величезний впливу на свідомість людини і культуру. У нашому суспільстві діти значною мірою засвоюють ролі і правила поведінки в суспільстві з телевізійних передач, газет, фільмів та інших засобів масової інформації.
Електронна інформаційна середа — сукупність технічних і програмних засобів зберігання, обробки і передачі інформації, а також соціально-економічних і культурних умов реалізації процесів інформатизації [8, c.94].
Складові електронної інформаційної середовища - комп'ютерні мережі і цифрові технології - дозволяють якісно змінити традиційні підходи до інформаційного обслуговування. Найбільшому впливу в цьому відношенні схильні такі технологічні елементи:
1) організація процесів обслуговування;
2) організація доступу до ресурсів;
3) організація окремих форм обслуговування.
Однією з основних тенденцій
ери інформаційних технологій є
перехід на електронний документообіг.
Це проявляється у побутовій та професійній
сфері і виражається в
Робота з інформацією в електронній формі має цілу низку переваг. Ось тільки деякі з них:
Спрощена процедура
Спрощена процедура зберігання і резервування інформації;
Можливість ефективного автоматизованого пошуку та аналізу;
Більш висока швидкість обміну даними між віддаленими офісами;
Можливість одночасного редагування і читання одного документа або бази даних кількома користувачами, які перебувають на видаленні.
Нові інформаційні технології призвели до подальшого розвитку систем електронного інформаційного середовища.
Сьогодні до кожного виробу або компоненту можна «прив'язати» практично необмежену кількість інформації, зокрема:
Історію виробництва даного виробу;
Різні технічні параметри, вимоги щодо умов зберігання, номер партії і т.д.
Список компонентів
Інформація про працівників, причетних до виготовлення та тестування продукції;
І багато іншого.
При цьому немає необхідності переміщати з кожним виробом товсту папку паперів і витрачати безліч часу на ведення записів вручну. Сьогодні досить забезпечити друковану плату 1D/2D-кодом або виріб RFID-міткою з унікальним номером вироби і зіставити це з записами в базі даних підприємства, в яких зберігається вся інформація, і реєструються всі технологічні операції і переміщення матеріальних цінностей.
Такі системи вже встигли
стати галузевим стандартом в
економічно розвинених країнах. Є ціла
маса рішень, які дозволяють підвищити
прозорість виробничих процесів, розширити
можливості контролю якості, підвищити
оперативність паспортизації та
аналізу причинно-наслідкових
Інформаційні технології та телекомунікаційний зв'язок, завдячуючи яким людство має таке явище, як електронне інформаційне середовище, дають змогу здійснювати комплексне обслуговування абонентів бібліотек на якісно новому рівні, відкриваючи інформаційний кладезь книгозбірень широкому колу споживачів, незалежно від їх місцезнаходження. Однак при цьому загострюється проблема захисту авторського права в глобальній мережі, невизначеність якої сьогодні гальмує розвиток багатьох напрямів інформаційно-бібліотечного сервісу [7, c.56].
Пропоную більше ретельно розглянути Інтернет, як набільше електронне інформаційне середовище.
Інтерне́т (від англ. Internet)
— всесвітня система
В повсякденній мові слово Інтернет найчастіше вживається в значенні Всесвітньої павутини і доступної в ній інформації, а не у значенні самої фізичної мережі. Також вживаються терміни Всесвітня мережа, Глобальна мережа чи навіть одне слово Мережа, Іне́т, Тенета, Міжмережжя, Інтерне́трі або Не́трі. Все частіше Інтернет вживається і з малої літери, що можна пояснити паралелями з термінами «радіо», «телебачення», які пишуть з малої.
Історія Інтернету сягає досліджень 1960-х років, які проводилися на замовлення уряду США і мали на меті створення надійних розподілених комп'ютерних мереж, стійких до пошкоджень. Попередницею Інтернету стала мережа ARPANET (англ. Advanced Research Projects Agency Network), яка почавши функціонувати в кінці 1960-х, в кінці 1970-х об'єднувала близько 200 вузлів [7, c.43].
Урядове фінансування магістральної мережі Національного наукового фонду США в 1980-х, а також приватне фінансування для інших комерційних магістральних мереж в усьому світі призвело до участі в розробці нових мережевих технологій і злиття багатьох мереж. Комерціалізація в 1990-х міжнародної мережі привела до її популяризації та впровадження в практично кожен аспект сучасного життя людини. З 2011 року більше 2,1 мільярда людей користуються послугами Інтернету.
Інтернет не має централізованого управління, правил використання чи доступу. Кожна складова мережа встановлює свої власні стандарти. Централізовано визначаються правила використання адресного простору Інтернет-протоколу та Системи доменних імен. Керує цим Інтернет корпорація з присвоєння імен та номерів (англ. Internet Corporation for Assigned Names and Numbers, або ICANN), міжнародна некомерційна організація з головним офісом у США. Технічне обґрунтування і стандартизацію основних протоколів (IPv4 та IPv6) проводить Internet Engineering Task Force (IETF), некомерційна організація, відкрите міжнародне співтовариство проектувальників, учених, мережевих операторів і постачальників послуг.
Усі комп'ютери, що підключені до Internet, повинні використовувати однаковий протокол.
Інтернет складається з багатьох тисяч корпоративних, наукових, урядових та домашніх мереж. Об'єднання різнорідних за архітектурою мереж стало можливо завдяки протоколу IP (англ. Internet Protocol) і принципу маршрутизації пакетів даних. Протокол ІР був спеціально створений агностичним у відношенні до фізичних каналів зв'язку. Тобто будь-яка мережа передачі цифрових даних може передавати інтернет-трафік [9, c.82].
Мережа побудована на використанні протоколу IP і маршрутизації пакетів даних. В наш час Інтернет відіграє важливе значення у створенні інформаційного простору глобального суспільства, слугує фізичною основою доступу до веб-сайтів і багатьох систем (протоколів) передачі даних.
У основі роботи Інтернет лежить
мережевий протокол TCP/IP - загальноприйнята
система кодування, що дозволяє комп'ютерам
обмінюватися даними по мережі в зрозумілій
один для одного формі. Як неважко
відмітити, термін TCP/IP складається
з двох частин: TCP (Transmission Control Protocol -
протокол управління передачею даних)
і IP (Internet Protocol - протокол Інтернет). Кожен
комп'ютер в мережі «розуміє» ці
два протоколи і використовує
їх для передачі даних за певним
маршрутом. Спочатку TCP розбиває інформацію
- електронний лист, HTML-документ або
що-небудь ще - на невеликі фрагменти, які
називають пакетами. Кожний з пакетів
поміщується в «електронний конверт»
з адресами одержувача і відправника.
Тепер до справи береться IP-протокол,
який повинен визначити, як краще
всього доставити електронний пакет
з пункту А в пункт В. Для
кожного пакету окремо він знаходить
шлях, що проходить через ряд
Маршрутизатор аналізує адресу одержувача і передає пакет наступному маршрутизатору, розташованому в потрібному напрямі. Якщо ваш електронний лист було розбито на декілька пакетів, кожний з них міг дістатися до місця призначення по своєму маршруту. Проте ви про це так і не дізнаєтеся, оскільки при їх отриманні в кінцевому пункті знову вступає в справу TCP-протокол. Він переконується, що всі пакети дійшли непошкодженими, а потім збирає з них первинне повідомлення.
TCP/IP - це найважливіший
зі всієї безлічі протоколів
Інтернет.Часто термін TCP/IP використовується
для опису додаткових
1.3. Інформаційний пошук: сутність
Під інформаційним пошуком розуміють сукупність логічних та технічних операцій, кінцева мета яких – пошук документів, відомостей про них, фактів, релевантних із запитом користувача [8].
Головним поняттям інформаційного пошуку є релевантність документів, тобто ступінь відповідності документа запиту споживача.
Серед видів інформаційного пошуку розрізняють:
• документальний (пошук відомостей про документ – реферат, бібліографічний опис, анотацію; власне документ)
• фактографічний (пошук даних, фактів – характеристики приладів, матеріалів).
У кожному виді пошуку по-різному використовується семантика документа. За цією ознакою відрізняють такі типи пошуків:
– формально-механічний (при роботі з картковими каталогами);
– семантичний (зміст документа скорочують у різні способи, утворюючи пошуковий образ документа);
– ситуаційний (в інформаційно-логічних системах), який передбачає глибоку переробку змісту документів.
Автоматичні системи інформаційного
пошуку використовують для зменшення
так званого «інформаційного
перевантаження». Багато університетів
та публічних бібліотек
Об’єктом інформаційного пошуку є текстова інформація, зображення, аудіо, відео інформація.
З інформаційним пошуком змикаються проблеми:
- розсилки інформації (information routing);
- сортування інформації (information filtering);
- упорядкування (класифікація) інформації (information categorization);
- відбір інформації (information extraction).
Для інформаційного пошуку розробляють:
- алгоритми інформаційного пошуку (retrieval algorithms);
- підходи інформаційного пошуку(retrieval approaches);
- стратегії інформаційного пошуку (retrieval strategies).
Для його здійснення створюють:
- методи інформаційного пошуку (retrieval utilities);
- засоби інформаційного пошуку (information retrieval systems);
- комп’ютерні пошукові програми (search engines).
До проблем інформаційного пошуку належать питання:
- представлення даних, інформації, знань (data, information, knowledge);
- представлення інформації в сучасних інформаційних сховищах (representation of information);
- багатомовний інформаційний пошук (cross-language information retrieval);
- одночасний інформаційний пошук (parallel information retrieval);
- розподілений інформаційний пошук (distributed information retrieval);
- суспільний інформаційний пошук (social information retrieval).
Напрям інформаційний пошук відносять до проблем:
- застосовної (прикладної) лінгвістики (applied linguistics);
- обробки природної мови (natural language processing);
Завданням інформаційного пошуку
є знаходження відповідних (до пошукового
запиту) інформаційних об’єктів, або
документів серед доступного для
пошуку матеріалу. Завдання для інформаційного
пошуку задається у вигляді
Пошукова система переглядає всі доступні інформаційні одиниці (документи) зі збірки і відбирає документи відповідні до інформаційного запиту. Оскільки реальні пошукові системи знаходять не всі відповідні документи, говорять про точність пошукових систем (system accuracy). Результатом роботи пошукової системи є список відібраних документів (retrieved documents list), серед яких є відповідні до запиту документи (relevant documents). Для ідеальної пошукової системи список відібраних документів та відповідних документів повинні збігатися. В реальних пошукових системах в списках відібраних документів знаходяться і невідповідні до запиту документи. Тому говорять про ефективність пошукових систем. Ефективність пошукових систем оцінюється двома параметрами: пошукова відповідність (precision) та пошукова якість (recall). Пошукова відповідність визначає частку відповідних документів серед відібраних на запит. Пошукова відповідність визначає якість отриманого результату інформаційного пошуку. Пошукова якість визначає частку отриманих системою відповідних до запиту документів серед загального числа відповідних до запиту документів у збірці. Загальне число відповідних до запиту документів завжди є невідомим і може бути встановлене лише при повному перегляді збірки людиною. Крім того роботу пошукових систем оцінюють швидкодією — часом, за який отримують список відповідних до запиту документів.

- Інформаційних революцій у контексті управлінської діяльності
- Інформаційні війни
- Інформаційні війни
- Інформаційні ресурси бібліотеки
- Інформаційні ресурси електронних бібліотек
- інформаційні системи бухгалтерського обліку
- Інформаційні системи і технології в обліку
- Інформаційне забезпечення функціонування операційної системи
- Інформаційне забезпечення як фактор підтримки розвитку малого підприємництва
- Інформаційне матиматичне забезпечення
- Інформаційне обслуговування та технічне забезпечення процесу документації управління навчальним закладом
- Інформаційне обслуговування та технічне забезпечення процесу документації управління навчальним закладом
- Інформаційне обслуговування та технічне забезпечення процесу управління
- Інформаційне суспільство