Области применения современных информационных технологий

          Введение 

     В прошлом информация считалась сферой бюрократической работы и ограниченным инструментом для принятия решений. Сегодня информацию рассматривают  как один из основных ресурсов развития общества, а информационные системы  и технологии как средство повышения  производительности и эффективности  работы людей.

     Наиболее  широко информационные системы и  технологии используются в производственной, управленческой и финансовой деятельности, хотя начались подвижки в сознании людей, занятых и в других сферах, относительно необходимости их внедрения  и активного применения. Это определило угол зрения, под которым будут  рассмотрены основные области их применения. Главное внимание уделяется  рассмотрению информационных систем и  технологий с позиций использования  их возможностей для повышения эффективности  труда работников информационной сферы  производства и поддержки принятия решений в организациях (фирмах).

     Информатизация  в области управления экономическими процессами предполагает, прежде всего, повышение производительности труда  работников за счет снижения соотношения  стоимость/производство, а также  повышения квалификации и профессиональной грамотности занятых управленческой деятельностью специалистов. В развитых странах проходят одновременно две  взаимно связанные революции: в  информационных технологиях и в  бизнесе.

     Информационные  технологии существовали давно, поэтому  с развитием компьютеров и  средств связи начали появляться различные вариации: «информационные  и коммуникационные технологии», «компьютерные  информационные технологии» и др. В настоящей работе под информационными  технологиями будем понимать современное  значение, то есть интеграцию компьютеров, электроники и средств связи.

     Переход к рыночным отношениям в экономике  и научно-технический прогресс чрезвычайно  ускорили темпы внедрения во все  сферы социально-экономической жизни  российского общества последних  достижений в области информатизации. Термин «информатизация» впервые появился при создании локальных многотерминальных  информационно-вычислительных систем и сетей массового обслуживания.

     Одна  из причин, почему информационные системы  играют большую роль в организациях и почему они влияют на большое  количество людей, - возрастающая мощность и уменьшающаяся стоимость компьютеров, которые являются основой информационных систем. Вычислительная мощность компьютеров  удваивается каждые 18 месяцев, поэтому  возможности микропроцессоров увеличились  в 25 000 раз, начиная с их изобретения 25 лет тому назад.

     Революция в компьютерной технологии породила мощные сети связи, которые организации  могут использовать для доступа  к крупным складам информации во всем мире и координировать действия вне зависимости от места и  времени. Эти сети преобразуют форму  деловых предприятий и даже наше общество.

     Всемирная самая большая и наиболее широкоиспользуемая сеть -Интернет (Internet). Интернет - международная  сеть сетей, которые являются и коммерческими, и публичными. Интернет соединил более 100 000 различных сетей почти из 200 стран во всем мире. Больше 50 млн  представителей науки, образования, правительства  и деловых организаций используют Интернет, чтобы обмениваться информацией  или поддерживать деловые отношения  с другими организациями земного  шара.

     Технологические основы для этих всепроникающих информационных технологий (ИТ) - не только персональные компьютеры, стоящие на рабочем столе, но и компьютеры, подключенные к  сетям. Действительно, некоторые авторы указали на эту всепроникаемость как ясный признак, что мы перешли  от индустриальной революции к информационной революции. Эти авторы объявили начало века информации, в котором именно информация (знания), а не сырье или  человеческая рабочая сила является наиболее важным средством производства.

     Уровень изменений в ИТ также затрудняет предсказание долгосрочного воздействия  на предпринимателей и работников. Однако информационная революция уже  изменила способы работы многих людей  сегодня.

     Хотя  точная дата зари этого века информации является дискуссионной, существует широкое  мнение, что информационная революция  является "подводной". Ясно, мы вошли  в мир, в котором самый большой  книжный магазин физически не существует на terra firma, но находится  в киберпространстве. Это - также  мир, в котором традиционные средства массовой информации - напечатанные газеты, новости телевидения и радиопередачи - обеспечивают источники новостей века информации и услуги по Интернету.

     Новые технологии, основанные на компьютерной технике, требуют радикальных изменений  организационных структур менеджмента, его регламента, кадрового потенциала, системы документации, фиксирования и передачи информации. Особое значение имеет внедрение информационного  менеджмента, значительно расширяющее  возможности использования компаниями информационных ресурсов. Развитие информационного  менеджмента связано с организацией системы обработки данных и знаний, последовательного их развития до уровня интегрированных автоматизированных систем управления, охватывающих по вертикали  и горизонтали все уровни и  звенья производства и сбыта. 
 
 
 
 
 
 
 
 
 
 

          1. Понятие информационной технологии 

    1. Что такое информационная технология
 

     Технология1 — это комплекс научных и инженерных знаний, реализованных в приемах труда, наборах материальных, технических, энергетических, трудовых факторов производства, способах их соединения для создания продукта или услуги, отвечающих определенным требованиям. Поэтому технология неразрывно связана с машинизацией производственного или непроизводственного, прежде всего управленческого процесса. Управленческие технологии основываются на применении компьютеров и телекоммуникационной  техники.

     Согласно  определению, принятому ЮНЕСКО, информационная технология — это комплекс взаимосвязанных, научных, технологических, инженерных дисциплин, изучающих методы эффективной  организации труда людей, занятых  обработкой и хранением информации; вычислительную технику и методы организации и взаимодействия с  людьми и производственным оборудованием, их практические приложения, а также  связанные со всем этим социальные, экономические и культурные проблемы. Сами информационные технологии требуют  сложной подготовки, больших первоначальных затрат и наукоемкой техники. Их введение должно начинаться с создания математического  обеспечения, формирования информационных потоков в системах подготовки специалистов. 

     1.2 Этапы развития  информационных технологий 

     Существует  несколько точек зрения на развитие информационных технологий с использованием компьютеров, которые определяются различными признаками деления. Общим для всех изложенных ниже подходов является то, что с появлением персонального компьютера начался новый этап развития информационной технологии. Основной целью становится удовлетворение персональных информационных потребностей человека как для профессиональной сферы, так и для бытовой.

     Признак деления - вид задач и процессов обработки информации:

     1-й этап (60 - 70-е гг.) — обработка данных в вычислительных центрах в режиме коллективного пользования. Основным направлением развития информационной технологии являлась автоматизация операционных рутинных действий человека.

     2-й этап (с 80-х гг.) — создание информационных технологий, направленных на решение стратегических задач.

     Признак деления — проблемы, стоящие на пути информатизации  общества:

     1-й этап (до конца 60-х гг.) характеризуется проблемой обработки больших объемов данных в условиях ограниченных возможностей аппаратных средств.

     2-й этап (до конца 70-х гг.) связывается с распространением ЭВМ серии 1ВМ/360. Проблема этого этапа - отставание программного обеспечения от уровня развития аппаратных средств.

     3-й этап (с начала 80-х гг.) - компьютер становится инструментом непрофессионального пользователя, а информационные системы - средством поддержки принятия его решений. Проблемы- максимальное удовлетворение потребностей пользователя и создание соответствующего интерфейса работы в компьютерной среде.

     4-й  этап (с начала 90-х гг.) - создание современной технологии межорганизационных связей и информационных систем. Проблемы этого этапа весьма многочисленны. Наиболее существенными из них являются:

     - выработка соглашений и установление стандартов, протоколов для компьютерной связи;

     - организация доступа к стратегической информации;

     - организация защиты и безопасности информации.

     Признак деления — преимущество, которое приносит компьютерная технология.

     1 -й этап (с начала 60-х г.г..) характеризуегся довольно эффективной обработкой информации при выполнении рутинных операций с ориентацией на централизованное коллектив-ное использование ресурсов вычислительных центров. Основным критерием оценки эффективности создаваемых информационных систем была разница между затраченными на разработку и сэкономленными в результате внедрения средствами. Основной проблемой на этом этапе была психологическая - плохое взаимодействие пользователей, для которых создавались информационные системы, и разработчиков из-за различия их взглядов и пони-мания решаемых проблем. Как следствие этой проблемы, создавались системы, которые пользователи плохо воспринимали и, несмотря на их достаточно большие возможности, не использовали в полной мере.

     2-й этап (с середины 70-х гг.) связан с появлением персональных компьютеров. Изменился подход к созданию информационных систем-ориентация смещается в сторону индивиду-ального пользователя для поддержки принимаемых им решений. Пользователь заинтересован в проводимой разработке, налаживается контакт с разработчиком, возникает взаимопонимание обеих групп специалистов. На этом этапе используется как централизованная обработка данных, характерная для первого этапа,. так и децентрализованная, базирующаяся на решении локальных задач и работе с локальными базами данных на рабочем месте пользователя.

     3-й этап (с начала 90-х гг.) связан с понятием анализа стратегических преимуществ в бизнесе и основан на достижениях телекоммуникационной технологии распределенной   обработки информации. Информационные системы имеют своей целью не просто увеличение эффективности обработки данных и помощь управленцу. Соответствующие информационные технологии должны помочь организации выстоять в конкурентной борьбе и получить преимущество.

     Признак деления - виды инструментария технологии

     1-й этап (до второй половины XIX в.) — "ручная" информационная технология инструментарий которой составляли: перо. чернильница, книга Коммуникации осуществлялись ручным способом путем переправки через почту писем, пакетов, депеш. Основная цель технологии - представление информации в нужной форме.

     2-й этап (с конца XIX в.) — "механическая" технология, инструментарий которой составляли: пишущая машинка, телефон, диктофон, оснащенная более совершенными средствами доставки почта. Основная цель технологии - представление информации в нужной форме более удобными средствами,

     3-й этап (40 — 60-е гг. XX в.) — "электрическая" технология, инструментарий которой составляли: большие ЭВМ и соответствующее программное обеспечение, электрические пишущие машинки, ксероксы, портативные диктофоны.

     Изменяется  цель технологии. Акцент в информационной технологии начинает перемещаться с формы представления информации на формирование ее содержания.

     4-й  этап (с начала 70-х гг.) — "электронная" технология, основным инструментарием которой становятся большие ЭВМ и создаваемые на их базе автомати-зированные системы управления (АСУ) и информационно-поисковые системы (ИПС), оснащенные широким спектром базовых и специализированных программных комплексов. Центр тяжести технологии еще более смещается на формирование содержательной стороны информации для управлснчсскон среды различных сфер общественной жизни, особенно на организацию аналитической работы. Множество объективных и субьекгивных факторов не позволили решить стоящие перед новой концепцией информационной технологии поставленные задачи, Однако был приобретен опыт формирования содержательной стороны управленческой информации и подготовлена профессиональная, психологическая и социальная база для перехода на новый этап  развитии технологии,

     5-й  этап (с середины 80-х гг.) — "компьютерная" ("новая") технология, основным инструментарием которой является персональный компьютер с широким спектром стандартных программных продуктов разного назначения. На этом этапе происходит процесс персонализации АСУ, который проявляется в создании систем поддержки принятия решений определенными специалистами. Подобные системы имеют встроенные элементы анализа и интеллекта для разных уровней управления, реализуются на персональном компьютере и используют телекоммуникации. В связи с переходом на микропроцессорную базу существенным изменениям подвергаются и технические средства бытового, культурного и прочего назначений.

     Начинают  широко использоваться в различных  областях глобальные и локальные компьютерные сети. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

  1. Функции информационных технологий и их классификация
 

    2.1 Функции современных  информационных технологий 

     Информационная  технология обеспечивает следующие функции по обработке и анализу текстовой информации на естественных языках:

     - вычислительное формирование системы  наукоемких вторичных информационных  ресурсов, характеризующих тематику  и содержание текстовых документов  – словарей лемм – идентификаторов  грамматически нейтральных форм  слов документов (словарные лингвистические  модели текстов) и списков ключевых  слов с весами (словарные модели  семантики текстов), характеризующих  тематику и содержание документов;

     - контекстный поиск документов  по заданному числу слов из  сформированного пользователем  списка слов. Возможен поиск по  трем категориям слов – словам, входящим в текст, ключевым  словам текста, «главным» ключевым словам текста;

     - вычислительное построение модели  семантики текста в форме аннотации,  сформированной из фрагментов анализируемого документа;

     - поиск текстов, содержательно  и тематически сходных с выбранным пользователем образцом;

     - вычислительное формирование моделей  семантики текстовых коллекций  (групповых – вычислительное  определение наличия и состава  тематически однородных групп  документов в текстовой коллекции  при отсутствии априорной информации  о наличии и составе таких  групп, так называемая кластеризация  текстовых коллекций, и словарных  семантических моделей в форме  списков слов, тематически связанных  в рамках конкретной анализируемой  коллекции),

     - вычислительная категоризация документов  на основании моделей семантики  текстовых коллекций и моделей семантики отдельных текстов;

     - семантическая навигация в рамках  текстовых коллекций на основании  моделей семантики коллекций.

     Анализ  и поиск текстовой информации в технологии основан на использовании  наукоемких вторичных информационных ресурсов – моделей семантики  отдельных документов, вычислительно  сформированных в форме списков  «ключевых» слов по первичным информационным ресурсам – текстам на естественных языках. Как это делается?

     1.Лемматизация  документов: Информационная технология использует в качестве исходного «материала» для построения семантических моделей текстовых документов лемматизированный словарный состав документа.

     Лемма слова – это идентификатор  грамматически нейтральной формы  слова. В наших проектах используется оригинальный алгоритмический лемматизатор, основанный на формальном описании знаний о морфологии языка в определенном стандарте представления соответствующих  знаний. Поэтому процесс «подключения»  новых европейских языков требует  только создания необходимого описания соответствующего языка.

     2.Вычислительное  построение ключевых слов текстов  на естественных языках: Эффективная организация поиска и анализа информации в рамках информационной технологии основана на использовании  наборов ключевых слов, являющихся носителями основной тематики и содержания текстов – результатах автоматического смыслового индексирования – наукоемкого вычислительного анализа текстов на естественных языках.

     Наборы  ключевых слов документов являются основным типом наукоемких вторичных информационных ресурсов, автоматически формируемых  в ходе загрузки текстовых документов в хранилище данных, используемое информационной технологией.

     Задача  вычислительного определения ключевых слов текстов на естественных языках с пятидесятых годов двадцатого века привлекала математиков, программистов, специалистов в области анализа  данных, лингвистов и психологов. К сожалению, господствующие сегодня подходы к решению проблемы извлечения смысла текста, сформировавшиеся в эпоху кибернетического романтизма, не дают достаточно надежного и универсального предметно независимого решения.

     Информационная  технология основана на оригинальном вычислительном решении этой классической задачи: на формировании моделей семантики  отдельных документов в форме  списков «ключевых» слов с весами. Слова, входящие в такие списки слов, в нашей технологии формально  определяются как наиболее сильно связанные  в конкретном документе в некотором  комбинаторном смысле. Оказалось, что  вычисляемые множества слов являются уникальными, устойчивыми и воспроизводимыми характеристиками документа, а разумный читатель воспринимает их в качестве носителей основной тематики и содержания текста.

       Последнее свойство наборов «ключевых»  слов, формируемых в результате  формальных вычислений, доказывает  их содержательность (так называемое  свойство интерпретируемости) и  обосновывает возможность именовать  их ключевыми словами без кавычек.

     Основные  свойства моделей семантики отдельных  документов в форме списков «ключевых» слов:

     - Уникальность – содержательно  близким текстам соответствуют  близкие списки ключевых слов с весами;

     - Устойчивость – при незначительных  изменениях текста списки ключевых  слов с весами меняются незначительно;

     - Воспроизводимость – для произвольного  текста вычисленный при неизменных  условиях список ключевых слов с весами всегда неизменен;

     Для вычислительного построения моделей  семантики отдельных документов в форме списков «ключевых» слов необходимы:

     - текст документа;

     - репрезентативная для языка, на  котором написан документ, коллекция документов;

     - знания о морфологии языка  документа, представленные в определенном формате.

     При построении моделей семантики отдельных  документов в форме списков «ключевых» слов при желании пользователя могут  быть учтены:

     - словарь слов, воспринимаемых пользователем в качестве синонимов;

     - словарь устойчивых словосочетаний, воспринимаемых пользователем в  качестве единого означающего  для определенных объектов.

     3.Поиск  содержательно похожих документов:

     В информационной технологии поиск содержательно  похожих документов использует анализ наукоемких вторичных информационных ресурсов документов – сравнение  списков ключевых слов с весами. Результатом такого сравнения является количественная оценка смысловой близости пары документов. При этом значению единица (100%) соответствует полное смысловое  совпадение, а значению ноль – отсутствие смысловых совпадений. Поиск содержательно  похожих документов может выполняться  по желанию пользователя или в  рамках определенных фиксированных  сценариев работы, например, для  автоматического построения списков  подозрительно схожих документов, так  называемых «тревожных списков».

     В обоих случаях задается документ – образец, для которого отыскиваются содержательно схожие документы. Оценивание смысловой близости является достаточно трудоемкой вычислительной процедурой. Поэтому для ограничения потребностей системы в вычислительных ресурсах выполняется предварительный поиск  «подозрительных» документов, содержащих ключевые слова документа – образца, на основании которых формируется  задание и запрос на поиск. По результатам  вычислений попарных оценок смыслового сходства образца и найденных  документов формируется невозрастающий по величине оценки содержательного  сходства с образцом отчет о результатах  поиска.

     Контекстный поиск по заданному числу слов из сформированного пользователем  списка слов с использованием моделей  семантики отдельных документов в форме списков ключевых слов.

     Основная  для традиционных поисковых систем функция – контекстный поиск (поиск документов, в которых встречаются  слова запроса), реализована и  в информационной технологии. Возможности нашей технологии позволили сделать эту стандартную функцию более удобной и комфортной для пользователя по сравнению с реализацией контекстного поиска в популярных поисковых системах.

     Пользователю  предоставлен выбор: осуществлять контекстный  поиск среди всего словарного состава документов, среди рассчитанных ключевых слов, которые являются носителями основного содержания и тематики документа, или среди «главных» (самых  значимых) ключевых слов.

     Пользователь  имеет возможность задать в качестве запроса набор слов в произвольной грамматической форме (поиск выполняется  по леммам слов) и указать пороговое  число слов из запроса. При наличии  в документе числа слов из запроса  не меньше порогового, идентификатор  документа включается в отчет  о результатах поиска. Отчет упорядочен по невозрастанию числа слов из запроса  в документах (первым в отчете приводится ссылка на документ, использующий максимальное среди других найденных документов число слов из запроса). Это позволяет  пользователю обойтись без написания  запроса объемом в страницу или  больше в виде логических формул. При  равенстве числа слов в запросе  и пороговой величины для числа  слов из запроса, реализуется стандартный  вариант контекстного поиска.

     4.Построение  моделей семантики документа  в форме аннотаций:

     Формируемые при использовании информационной технологии в результате формальных вычислений списки ключевых слов текстовых  документов достаточно легко интерпретируются разумным человеком.

     Модель семантики документа в форме аннотации позволяет достаточно точно, полно и ярко представить тематику и содержание документа в виде небольшого текста на естественном языке. В информационной технологии в качестве аннотации формируется ограниченный по объему (параметр, управляемый пользователем) набор предложений текстового документа. Предложения, включаемые в аннотацию, выбираются в ходе вычислительной процедуры таким образом, чтобы суммарный вес включенных в отобранные предложения ключевых слов документа был максимален при алгоритмическом обеспечении разнообразия ключевых слов.

     Для каждого документа реализуются  одновременно два режима аннотирования: в контексте запроса (в аннотацию  включаются «тяжелые» предложения  документа со словами из запроса) и в контексте самого найденного документа (в аннотацию включаются «тяжелые» предложения без дополнительных ограничений). В результате пользователь получает, соответственно, модельное  представление о содержании в  найденном документе информации, связанной с непосредственным запросом, и об «информационной начинке» документа, как он есть. Аннотация в контексте  запроса и аннотация в контексте  самого документа могут существенно  различаться.

     5.Смысловая  навигация по текстовой коллекции  с использованием адаптивного  диалогового тезауруса (АДТ):

     Адаптивный  диалоговый тезаурус (АДТ) – управляемый  пользователем диалоговый инструмент смысловой навигации по текстовым  коллекциям, являющийся оригинальным компонентом информационной.

     АДТ формируется вычислительно для  произвольной выбранной пользователем  коллекции документов по наукоемким вторичным информационным ресурсам, характеризующим коллекцию: словарным  лингвистическим моделям текстов  и словарным моделям семантики  текстов.

     Средствами  формирования коллекции могут быть поиск (контекстный или по сходству с документом - образцом) и/или отбор  документов по доступной метаинформации. АДТ – это список всех слов, используемых в документах отобранной коллекции, упорядоченный по невозрастанию  суммарного веса слов в документах коллекции или числа документов, использующих слово. Именно этим обусловлено  название нашего инструмента смысловой  навигации.

     Действительно, АДТ предоставляет информацию о  тематике и содержании конкретной коллекции, начиная с наиболее значимых слов (с максимальным суммарным весом) или с наиболее распространенных слов (с максимальным числом использующих их документов).

Области применения современных информационных технологий