Информационно-поисковые системы. 5
Оглавление
Введение 3
Исторические предпосылки развития поисковых систем. 4
Информационно-поисковые системы. 6
Классификация ИПС: 7
Документальные (документографические) 8
Фактографическая информационная поисковая система. 9
Основные определения ИПС 10
Заключение. 13
Введение
Современный этап развития цивилизации характеризуется переходом наиболее развитой части человечества от индустриального общества к информационному. Одним из наиболее ярких явлений этого процесса является возникновение и развитие глобальной информационной компьютерной сети. С появлением Интернета проблема поиска становилась более актуальной. Интернет- это единая информационная среда, также это большое количество полезной информации, для поиска которой необходимо затратить много времени.
Основные
протоколы, используемые в Интернет,
не обеспечены достаточными встроенными
функциями поиска, не говоря уже о миллионах
серверах, находящихся в ней. Протокол
HTTP, используемый в Интернет, хорош лишь
в отношении навигации, которая рассматривается
только как средство просмотра страниц,
но не их поиска. То же самое относится
и к протоколу FTP, который даже более примитивен,
чем HTTP. Из-за быстрого роста информации,
доступной в Сети, навигационные методы
просмотра быстро достигают предела их
функциональных возможностей, не говоря
уже о пределе их эффективности. Не указывая
конкретных цифр, можно сказать, что нужную
информацию уже не представляется возможным
получить сразу, так как в Сети сейчас
находятся миллиарды документов и все
они в распоряжении пользователей Интернет,
к тому же сегодня их количество возрастает.
Количество изменений, которым эта информация
подвергнута, огромно и, самое главное,
они произошли за очень короткий период
времени. Основная проблема заключается
в том, что единой полной функциональной
системы обновления и занесения подобного
объема информации, одновременно доступного
всем пользователям Интернет во всем мире,
никогда не было. Для того, чтобы структурировать
информацию, накопленную в сети Интернет,
и обеспечить ее пользователей удобными
средствами поиска необходимых им данных,
были созданы поисковые системы.
Исторические предпосылки развития поисковых систем.
Возникновение сети Internet было связанно необходимостью совместного использования информационных ресурсов, распределенных между различными компьютерными системами. Большинство первых приложений, включая FTP и электронную почту, были разработаны исключительно для обмена данными между хост-компьютерами Internet.
Другие приложения, такие как Telnet, создавались для того, чтобы пользователь получил возможность доступа не только к информации, но и к рабочим ресурсам удаленной системы. По мере развития Internet (увеличения пользователей и хост-компьютеров) прежние методы обмена данными перестали отвечать возросшим потребностям пользователей. Возникла необходимость разработки новых способов поиска сетевых ресурсов и доступа к ним, которые позволяли бы использовать информацию независимо от ее формата и расположения.
Для удовлетворения таких потребностей сначала были созданы поисковая система Archie, решающая задачу локализации ресурсов на FTP-сервере, и система Gopher, упрощающая доступ к различным сетевым ресурсам. Затем были разработаны сетевые информационные системы WWW и WAIS, предлагающие абсолютно новые методы получения информации. Принципы работы этих систем позволяют легко ориентироваться в огромном количестве информационных ресурсов без необходимости предоставления механизмов работы самой сети Internet. Такой подход позволяет говорить уже не просто о ресурсах взаимосвязанных компьютерных систем, а об особых информационных пространствах сети.
Система Archie представляет собой комплекс программных средств, работающих со специальными базами данных. В этих базах данных содержится постоянно пополняющаяся информация о файлах, к которым можно получить доступ через сервис FTP. Пользуясь услугами системы Archie, можно осуществить поиск файла по шаблону его имени. При этом пользователь получит список файлов с точным указанием места их хранения в сети, а также с информацией о типе, времени создания и размере файлов. Доступ к информационно-поисковой системе Archie может осуществляться различными путями, начиная от запросов по электронной почте и с помощью сервиса Telnet и заканчивая использованием графических Archie-клиентов.
Система Gopher была разработана для упрощения процесса локализации FTP-ресурсов Internet и для более удобного представления сведений о содержании хранящихся на FTP-серверах файлов. Система Gopher дает возможность в удобной форме (в виде меню) представлять пользователям об имеющихся файлах и их содержании. Меню Gopher-серверов могут содержать ссылки на другие Gopher- и FTP-серверы. Таким образом, пользователь получает возможность “путешествовать” по Internet, не обращая внимания на местонахождение интересующих его ресурсов, и получать доступ к этим ресурсам.
Система Veronica используется для поиска информации в Gopher-пространстве по заголовкам пунктов меню. После ввода ключевого слова, система Veronica выясняет, встречается ли оно в меню на каком-либо Gopher-сервере, и в качестве результатов поиска выдает список заголовков пунктов меню, содержащих ключевое слово. Поскольку система Veronica не является автономной поисковой программой, а тесно связана с системой Gopher, она обладает тем же, что и система Gopher, недостатком: далеко не всегда по заголовку можно сказать, что собой представляет тот или иной информационный ресурс. Достоинства системы заключается в том, что нет необходимости узнавать, где расположена найденная информация, достаточно выбрать требуемую запись из списка.
Информационно-поисковые системы.
Информационно-поисковая система – это прикладная компьютерная среда для обработки, хранения, сортировки, фильтрации и поиска больших массивов структурированной информации.
Еще одно определение:
ИПС
(информационно-поисковая
система) - это система, обеспечивающая
поиск и отбор необходимых данных в специальной
базе с описаниями источников информации
(индексе) на основе информационно-поискового
языка и соответствующих правил поиска.
Информационно-поисковая система выполняет следующие функции:
- хранения больших объемов информации;
- быстрого поиска требуемой информации;
- добавления, удаления и изменения хранимой информации;
- вывода информации в удобном для человека виде.
Создание
и использование информационно-
Классификация ИПС:
1.
Документографические (документальные).
В документографических ИПС все хранимые
документы индексируются специальным
образом, т. е. каждому документу присваивается
индивидуальный код, составляющий поисковый
образ. Поиск идет не по самим документам,
а по их поисковым образам. Именно так
ищут книги в больших библиотеках. Сначала
отыскивают карточку в каталоге, а затем
по номеру, указанному на ней, отыскивается
и сама книга.
2.
Фактографические.
В фактографических ИПС хранятся не документы,
а факты, относящиеся к какой-либо предметной
области. Поиск осуществляется по образцу
факта.
Документальные (документографические)
Это системы, в которой объектом сохранения и обработки есть собственно документы. В такой ИПС все хранимые документы индексируются некоторым специальным образом. Каждому документу (статье, отчету, протоколу и т.п.) присваивается индивидуальный код, составляющий поисковый образ документа. Поиск идет не по самим документам, а по их поисковым образам, которые содержат информацию (адрес) о местонахождении документа. Именно так ищут книги по заказам читателя в больших библиотеках (в маленьких библиотеках библиотекарь обычно ищет книги сам). По требованию читателя сначала находят карточку в каталоге, а потом по шифру, указанному на ней, отыскивается и сама книга. Различия документографических ИПС определяются тем, как устроен поисковый образ документа. В простейшем случае это просто его индивидуальное название (например, название, автор, год издания книги). В более сложных случаях нет однозначного соответствия между поисковым образом документа и самим документом. Вполне возможен случай, когда поисковый образ документа соответствует нескольким различным документам и, наоборот, один и тот же документ соответствует не одному, а нескольким поисковым образам.
Фактографическая информационная поисковая система.
Это
система, где, объектом или сущностью
есть то, что представляет для проблемной
сферы многосторонний интерес (сотрудник,
договор, изделие и т.п.). Ведомости
об этих сущностях могут находиться
во множестве разных входных и
исходных сообщений.. В отличие от документографических
ИПС в ИПС такого типа хранятся не документы,
а факты, относящиеся к какой-либо предметной
области. Хранимые факты могут быть извлечены
из различных документов. В базе фактов
они связываются между собой системой
разнообразных отношений. Такая сеть в
ИПС носит название тезауруса предметной
области. Запросы, поступающие в фактографические
ИПС, используют тезаурус для поиска ответов
на запросы. Поиск осуществляется методом
поиска по образцу, широко применяющемуся
в базах знаний систем искусственного
интеллекта. ИПС фактографического типа
постепенно приближаются по своей организации
и функционированию к развитым базам данных
и знаний.
Основные определения ИПС
Главной задачей любой ИПС является поиск информации релевантной информационным потребностям пользователя. Очень важно в результате проведенного поиска ничего не потерять, то есть найти все документы, относящиеся к запросу, и не найти ничего лишнего. Поэтому вводится качественная характеристика процедуры поиска - релевантность. Релевантность - это соответствие результатов поиска сформулированному запросу.
Тезаурус - полный систематизированный набор терминов, слов, данных, семантических понятий в какой-либо области знаний с указанием на их практическое применение.
Основными целями разработки традиционных ИПТ являются следующие:
- обеспечение перевода естественного языка документов и пользователей на контролируемый словарь, применяемый для индексирования и поиска;
- обеспечение последовательного использования единиц индексирования;
- описание отношений между терминами;
- использование как поискового средства при поиске документов.
Основными показателями ИПС для WWW являются пространственный масштаб и специализация. По пространственному масштабу ИПС можно разделить на локальные, глобальные, региональные и специализированные. Локальные поисковые системы могут быть разработаны для быстрого поиска страниц в масштабе отдельного сервера. Региональные ИПС описывают информационные ресурсы определенного региона. Глобальные поисковые системы в отличие от локальных стремятся объять необъятное - по возможности наиболее полно описать ресурсы всего информационного пространства сети Интернет.
В общем случае, можно выделить следующие поисковые инструменты для WWW: каталоги, поисковые системы, метапоисковые системы.
Каталог - поисковая система с классифицированным по темам списком аннотаций со ссылками на web-ресурсы. Классификация, как правило, проводится людьми.
Поиск
в каталоге очень удобен и проводится
посредством последовательного уточнения
тем. База данных ссылок (индекс) каталога
обычно имеет ограниченный объем, заполняется
вручную персоналом каталога. Некоторые
каталоги используют автоматическое обновление
индекса.
Результат поиска в каталоге представляется
в виде списка, состоящего из краткого
описания (аннотации) документов с гипертекстовой
ссылкой на первоисточник.
Адреса
популярных каталогов:
Зарубежные каталоги:
Yahoo - www.yahoo.com
Magellan - www.mckinley.com
Российские каталоги:
@Rus - www.aport.ru
Weblist - www.weblist.ru
Улитка - www.ulitka.ru
Поисковая
машина - поисковая система с формируемой
роботом базой данных, содержащей информацию
об информационных ресурсах.
Отличительной чертой поисковых машин
является тот факт, что база данных, содержащая
информацию об Web-страницах, статьях Usenet
и т.д., формируется программой-роботом.
Поиск в такой системе проводится по запросу, составляемому пользователем, состоящему из набора ключевых слов или фразы, заключенной в кавычки. Индекс формируется и поддерживается в актуальном состоянии роботами-индексировщиками.
В описании документа чаще всего содержится несколько первых предложений или выдержки из текста документа с выделением ключевых слов. Как правило, указана дата обновления (проверки) документа, его размер в килобайтах, некоторые системы определяют язык документа и его кодировку (для русскоязычных документов).
Многие поисковые системы позволяют проводить поиск в найденных документах, причем вы можете уточнить ваш запрос введением дополнительных терминов. Если интеллектуальность системы высока, вам могут предложить услугу поиска похожих документов. Однако, автоматизация определение похожести - весьма нетривиальная задача, и зачастую эта функция работает неадекватно вашим надеждам. Некоторые поисковики позволяют провести пересортировку результатов. Для экономии вашего времени можно сохранить результаты поиска в виде файла на локальном диске для последующего изучения в автономном режиме.
Адреса наиболее
популярных поисковых
машин за рубежом
и в России.
Зарубежные
поисковые машины:
Google - www.google.com
Altavista - www.altavista.com
Excite - www.excite.com
HotBot - www.hotbot.com
Nothern Light - www.northernlight.com
Go (Infoseek) - www.go.com (infoseek.com)
Fast - www.alltheweb.com
Российские поисковые машины:
Яndex - www.yandex.ru (или
www.ya.ru)
Рэмблер - www.rambler.ru
Апорт - www.aport.ru
Метапоисковая система. Различные поисковые системы описывают разное количество источников информации в Интернет. Поэтому нельзя ограничиваться поиском только в одной из указанных поисковых системах. Существуют инструментами поиска, которые не формируют собственный индекс, но умеют использовать возможности других поисковых систем.
Это метапоисковые системы (поисковые службы) - системы, способные послать запросы пользователя одновременно нескольким поисковым серверам, затем объединить полученные результаты и представить их пользователю в виде документа со ссылками.
Адреса известных
метапоисковых систем:
MetaCrawler - www.metacrawler.com SavvySearch - www.savvysearch.c
Заключение.
Масштабы информационных ресурсов и их количество постоянно расширяется. Становится ясно, что база данных не является совершенной. Интеллектуальные агенты – новое направление, лежащее в основе нового поколения поисковых машин, которые могут фильтровать информацию и получать более точный результат. Internet продолжает развиваться с неослабевающей интенсивностью, по сути дела стирая ограничение на распространение и получение информации в мире. Однако в этом информационном океане бывает не очень легко найти необходимый документ следует также иметь в виду, что в сети наряду с давно действующими серверами возникают новые. Поисковые системы Интернета, пожалуй, один из способов двигаться вперед по направлению развития и совершенствования. Развиваясь, сами поисковые системы, развивают все остальное вокруг себя выгодно принуждая совершенствовать качество самого Интернета, а так же технологий связанных с этим. Как и во всех других отраслях, в Интернете существуют свои лидеры, которые прошли испытание временем и добились каких либо значимых результатов, что в свою очередь позволило занять определенные ниши и позиции в мировой паутине. Поисковые системы Интернета, словно огромные столпы на которых держится весь процесс движения. Конечно, много может быть несовершенно как в поиске, так и в технологиях, и в наши дни, несмотря на то, что уже достаточная доля Интернет трафика имеет свои предпочтения все же в Интернете появляются новые поисковые системы, которые, к сожалению так и остаются неизвестными.
Имеется ли альтернатива для Поисковых систем Интернета? На этот вопрос однозначно ответить, пожалуй, не получится, так же как не получится ответить на вопрос имеется ли альтернатива автотранспорту. Возможно, и есть и в случае приложения, каких либо умственных усилий в поисках альтернативного направления Поисковым системам можно создать нечто новое, однако стоит ли изобретать колесо повторно... Конечно, в том виде, в котором существуют поисковые системы сейчас в Интернете долго продержаться не смогут, так как подгоняемый технологическим процессом Интернет заставляет считаться с нововведениями и отставание от этого может пагубно отразиться на Поисковых системах, поэтому происходит постоянное совершенствование и развитие, как самих поисковых систем, так и всех остальных участников Интернета.

- Информационно-поисковые системы
- Информационно-поисковые системы
- Информационно-поисковые системы
- Информационно-поисковые системы
- Информационно-поисковые системы в торговле
- Информационно-поисковые тезаурусы
- Информационно-поисковые тезаурусы
- Информационно консультационная служба в Германии
- Информационно – консультационная служба во Франции
- Информационно-поисковая система «Norma»
- Информационно поисковые системы
- Информационно-поисковые системы
- Информационно-поисковые системы
- Информационно-поисковые системы