Компьютерная протеомика
Оглавление
Введение 2
1. Цели и задачи: 3
2. Структура подсистемы Протеомика и детальное 6
руководство по ее применению 6
2.1 Программные компоненты подсистемы Протеомика 6
2.1.1 Программная компонента BLAST: поиск гомологов в базах 6
аннотированных последовательностей белков 6
- Работа с программной компонентой BLAST 7
2.1.2 Программная компонента PrositeScan: поиск мотивов и паттернов в первичных структурах белков. 8
- Работа с программной компонентой PrositeScan 9
- Программная компонента PDBSiteScan: распознавание функциональных сайтов в пространственных структурах белков. 10
- Работа с программной компонентой PDBSiteScan 11
2.2 Программные компоненты Subloc и SubPrediction : предсказание 13
внутриклеточной
локализации белков
прокариот и эукариот. 13
Введение
Протеомика — наука, основным предметом изучения которой являются белки и их взаимодействия в живых организмах, в том числе — в человеческом. Учёные, работающие в области протеомики, исследуют «производство» белков, их декомпозицию и замену белков внутри тела. Они также изучают как белки модифицируются после их синтеза в организме. Традиционно изучение белков являлось одним из разделов биохимии, но после определения структуры всей геномной ДНК человека и ряда других организмов, у исследователей белков появились новые методы, с которыми и связывают появление нового термина протеомика (от протеин и геномика). В частности, появились исчерпывающие базы данных о структуре всех белков человека, а также их протеолитических фрагментов, полученных в стандартных условиях. Это позволяет идентифицировать белки по молекулярной массе их протеолитических фрагментов, полученных в тех же условиях.
1. Цели и задачи:
Подсистема «компьютерная Протеомика» предназначена для решения задач комплексной структурно-функциональной аннотации белков и задач компьютерного дизайна модифицированных вариантов белков с использованием технологии конвейерного анализа.
Программные
компоненты подсистемы Протеомика
ориентированы на структурно-функциональную
аннотацию протеом бактерий, растений
и других организмов, что позволит осуществлять
реконструкцию сетей молекулярно-генетических
взаимодействий, интерпретировать нуклеотидный
полиморфизм на уровне структуры и функции
белков, а также предсказывать мутации
в белках, направленно изменяющие величину
биологической активности белков, что
имеет большое значение для дизайна белков
с улучшенными медико-биологическими
свойствами. Таким образом, задачи, решаемые
с использованием подсистемы, являются
важной составляющей в области молекулярной
системной биологии, медицины, биотехнологии
и биоинженерии.
Подсистема
Протеомика ориентирована
на решение следующих
задач:
1) поиск гомологов
в базах аннотированных
2) поиск мотивов
и паттернов в первичных
3) предсказание
внутриклеточной локализации
4) распознавание
функциональных сайтов в
5) реконструкция
пространственных структур
реконструкцию комплексов "белок-ион металла", "белок-низкомолекулярные лиганды", "белок-белок", "белок-ДНК/РНК";
6) предсказания
иммунологических
7) предсказания
мутаций, направленно меняющих
биологические активности и
2. Структура подсистемы Протеомика и детальное
руководство по ее применению
В подсистему Компьютерная
протеомика входят
следующие компоненты:
1) компонента, осуществляющая
поиск гомологов в базах
последовательностей белков;
2) компонента, осуществляющая поиск мотивов и паттернов в первичных
структурах белков;
3) компонента, осуществляющая
распознавание функциональных
пространственных структурах белков;
4) компонента, осуществляющая
предсказание внутриклеточной
белков;
5) компонента, осуществляющая
реконструкцию
молекулярных комплексов белок-лиганд;
6) компонента, осуществляющая предсказание иммунологических характеристик
белков;
7) компонента, осуществляющая
предсказание мутаций,
биологические активности и свойства белков.
2.1 Программные компоненты подсистемы Протеомика
2.1.1 Программная компонента BLAST: поиск гомологов в базах
аннотированных последовательностей белков
Для любых двух белков можно определить степень сходства их аминокислотных последовательностей - уровень гомологии. Два белка, имеющих уровень гомологии, превышающий пороговое значение, являются гомологами. Белки-гомологи обычно имеют сходное происхождение и большей частью принадлежат к одному семейству. Часто белки,
выполняющие одну и ту же функцию, являются гомологами, обратное же утверждение справедливо лишь в некоторой степени.
Поиск гомологов заданного белка позволяет охарактеризовать его, опираясь на существующие знания об уже изученных белках. Таким образом, поиск гомологов может применяться, в частности, для определения семейства, к которому принадлежит вновь открытый белок, что дает сведения об его возможных функциях в клетке. Так же определение набора гомологов заданного белка делает возможным исследование молекулярной эволюции заданного белка и установление направления изменения его
биологических активностей в эволюционной истории.
Поиск гомологов для заданной пользователем последовательности осуществляется в базе данных SWISS-Prot. На вход программного модуля, реализующего поиск гомологов, подается последовательность и указывается тип организма, грам-положительная или грам- отрицательная бактерия. Результат BLAST и PsiBLAST содержит идентификаторы (ID)
SWISS-Prot записей для найденных гомологий. С использованием этих ID для каждой из гомологичных последовательностей извлекаются их карточки из базы данных SWISS-Prot. Из карточки экстрагируются тип организма и внутриклеточная локализация и отбираются только те карточки, указанный организм в которых соответствует организму, введенному пользователем. Таким образом формируется список потенциальных локализаций для
анализируемой последовательности.
Программа предназначена для нахождения белков, аминокислотная
последовательность которых гомологична последовательности заданного белка [1].
- Работа с программной компонентой BLAST
Для подготовки к выполнению операции, соответствующей данной программной компоненте, надо войти в подсистему « Компьютерная протеомика» и с помощью мыши кликнуть надпись Поиск гомологов в базах аннотированных последовательностей белков в списке операций этой подсистемы. В результате появится HTML-страница с интерфейсом этой операции.
Выполнение операции начинается с ввода аминокислотной исследуемого белка.
Для этой цели используется раздел "Введите последовательность белка в FASTA формате" HTML-интерфейса операции. Последовательность
может быть набрана в поле экрана для ввода последовательности или скопирована с использованием стандартных операций Интернет-браузера.
После ввода данных как было описано выше необходимо нажать на кнопку
"Выполнить", в результате чего появляется HTML-страница с результатом поиска гомологов в базе NR NCBI BLAST для белковых последовательностей, выполненного программой NCBI BLAST,
подается последовательность и указывается тип организма, грам-положительная или грам-отрицательная бактерия. Результат BLAST и PsiBLAST содержит идентификаторы (ID) SWISS-Prot записей для найденных гомологий. С использованием этих ID для каждой из
гомологичных
последовательностей
Из карточки экстрагируются тип организма и внутриклеточная локализация и отбираются только те карточки, указанный организм в которых соответствует организму, введенному пользователем. Таким образом формируется список потенциальных локализаций для анализируемой последовательности.
Программа предназначена для нахождения белков, аминокислотная
последовательность которых гомологична последовательности заданного белка [1].
2.1.2 Программная компонента PrositeScan: поиск мотивов и паттернов в первичных структурах белков.
Группа аминокислотных последовательностей белков, сходных между собой, но не идентичных, может быть представлена в виде одной общей символьной последовательности - паттерна. Для представления группы последовательностей в виде паттерна каждый аминокислотный остаток одной последовательности должен быть, по возможности, поставлен в соответствие какому либо остатку каждой из других последовательностей.
Обычно это достигается посредством выравнивания заданных
последовательнотей. Алфавит, из символов которого составляются паттерны, включает в себя символы обозначений 20-ти аминокислотных, входящих в белки, а также ряд специальных символов, описывающих вариацию аминокислотных остатков в заданном участке описываемых последовательностей.
Среди похожих белков степень вариации аминокислот, составляющих сайт с определенной функцией, изменяется от одной аминокислотной позиции к другой.
Некоторые аминокислоты должны оставаться одними и теми же во всех сходных сайтах, другие могут варьировать в узких пределах, третьи могут быть заменены практически без вреда для функции сайта. Эту структуру функционального сайта можно описывать с помощью паттернов первичных последовательностей белков [2].
Таким образом, программа поиска мотивов и паттернов в первичных структурах белков может применяться в биоинформатике для функциональной аннотации аминокислотных последовательностей белков и изучения структуры функциональных сайтов в белках.
- Работа с программной компонентой PrositeScan
Для подготовки к выполнению операции надо войти в подсистему Компьютерная протеомика и с помощью мыши кликнуть надпись Поиск мотивов и паттернов в первичных структурах белков в списке операций этой подсистемы. В результате появится HTML-страница с интерфейсом этой операции.
Выполнение операции начинается с ввода аминокислотной исследуемого белка. Для этой цели используется раздел "Введите последовательность белка в FASTA формате" HTML-интерфейса операции.
Последовательность может быть набрана в поле экрана для ввода последовательности или скопирована с использованием стандартных операций текстового редактора Интернет-браузера. Обычно это достигается посредством выравнивания заданных последовательнотей. Алфавит, из символов которого составляются паттерны, включает в себя символы обозначений 20-ти аминокислотных, входящих в белки, а также ряд
специальных символов, описывающих вариацию аминокислотных остатков в заданном участке описываемых последовательностей.
Среди похожих белков степень вариации аминокислот, составляющих сайт с определенной функцией, изменяется от одной аминокислотной позиции к другой.
Некоторые аминокислоты должны оставаться одними и теми же во всех сходных сайтах, другие могут варьировать в узких пределах, третьи могут быть заменены практически без вреда для функции сайта. Эту структуру функционального сайта можно описывать с помощью паттернов первичных последовательностей белков [2].
Таким образом, программа поиска мотивов
и паттернов в первичных структурах белков
может применяться в биоинформатике для
функциональной аннотации аминокислотных
последовательностей белков и изучения
структуры функциональных сайтов в белках.
- Программная компонента PDBSiteScan: распознавание функциональных сайтов в пространственных структурах белков.
Отдельные участки пространственной структуры белка необходимы для
выполнения им конкретных молекулярных функций, составляющих его биологическую активность. Такие участки носят название функциональных сайтов.
Все функциональные сайты разделяются на три группы:
- активные центры ферментов,
- сайты связывания лигандов или биополимеров,
- сайты пострансляционной модификации белков.
Биологическая активность белка во многом определяется набором его функциональных сайтов.
Проблема распознавания функциональных сайтов занимает одно из центральных мест в протеомике . Можно выделить несколько основных подходов к решению этой задачи. Первый из них основан на анализе первичных структур. На нем основаны два метода: поиск консервативных участков во множественном выравнивании белковых
семейств [3, 4] и метод паттернов и весовых матриц (PROSITE) [5]. Однако эти методы эффективно применяются только для сайтов, включающих относительно протяженные консервативные участки.
Другой подход использует данные по третичной структуре белков и включает следующие методы: молекулярный докинг [6], распознавание каталитических центров, на основе различий между моделированными кривыми титрования (THEMATICS) [7].
В последнее время активно развиваются методы, построенные на использовании пространственных паттернов функциональных сайтов, содержащих положение в пространстве функционально важных групп атомов. Наиболее известны методы поиска структурных паттернов каталитических сайтов ферментов в третичных структурах белков
[8], распознавания сайтов связывания на основе поиска структурных паттернов [9].
Авторами проекта был разработан эффективный
алгоритм, заключающийся в структурном
сравнении белка не с консенсусом функционального
сайта, а с каждым его представителем,
что дало возможность получать информацию
о структурном сходстве белковых фрагментов
с сайтами, представленными малым количеством.
[10].
Суть алгоритма состоит в следующем.
Рассматриваются всевозможные тройки аминокислотных остатков в различных участках пространственной структуры белка в качестве ядра для искомого сайта. Каждая из троек сопоставляется в пространстве с первыми тремя остатками сайта из базы PDBSite. В случае удовлетворительного структурного сходства соответствующие множества сопоставляемых остатков расширяются до тех пор, пока их число не окажется равным числу остатков в сайте.
Результатом являются все найденные множества аминокислотных остатков белка, удовлетворяющие критериям сходства сайт-белок.
Таким образом, программа распознавания функциональных сайтов позволяет
аннотировать функцию вновь открытых белков, изучать изменение функции белка при изменении его структуры, моделировать искусственную структуру белка с заранее заданной биологической функции.
- Работа с программной компонентой PDBSiteScan
Для подготовки к работе с данной программной компонентой следует войти в подсистему Компьютерная протеомика и с помощью мыши кликнуть надпись «Распознавание функциональных сайтов в пространственных структурах белков в списке»
операций этой
подсистемы. В результате появится
HTML-страница с интерфейсом этой операции.
Назначения полей:
1) окно для ввода пути к PDB файлу,
2) задание идентификатора цепи,
3) определение порога MDM (Maximum Distance Mismatch) для распознавания функциональных сайтов,
4) определение порога для максимально допустимого различия между показателем доступности для растворителя остатков шаблона функционального сайта и фрагмента белка с которым произведено структурное выравнивание шаблона,
5) задание типов функциональных сайтов, которые будут распознаванься, с
помощью кнопок-флажков.
Выполнение операции начинается с ввода пути к файлу PDB исследуемого белка. Для этой цели используется кнопка "Browse", которая предоставляет стандартный диалог открытия файла, либо пользователь вводит путь в окно "Enter file in PDB format" HTML-интерфейса операции.
Далее пользователь определяет типы функциональных сайтов, которые будут включены в распознавание. Для этой цели необходимо поставить галочку в нужном check-box.
После ввода данных как было описано выше
необходимо нажать клавишу "Scan",
находящуюся внизу формы, в результате
чего появляется HTML-страница с результатом
распознавания функциональных сайтов
в анализируемом белке.
Поля
и данные, приведенные
на форме имеют следующее
значение:
1) ID идентификатор шаблона сайта в базе PDBSite, идентификатор является гиперссылкой на запись в этой базе; кнопка-флажок "Include in structure alignment" - отметить сайт для включения в структурное выравнивание белок-шаблон сайта,
2) PDBID – идентификатор шаблона сайта,
3) SITE_TYPE - тип сайта,
4) SITE_DESCR - описание сайта,
5) EC_NUMBER номер-классификатор фермента, если белок, из которого экстрагирован сайт-шаблон, таковым является,
6) LIGAND - название лиганда,
7) LIGAND_FORMUL - химическая формула лиганда,
8) DRUG - название лекарства, если лиганд является лекарством,
9) Max Dist и RMSD - параметры MDM и RMSD для структурного
выравнивания шаблона сайта с белком,
10) Site chain in the protein - идентификатор цепи для распознанного сайта в белке,
11) Site positions in the protein - номера позиций для распознанного сайта в белке,
12) Site residues in the protein - обозначения аминокислот для распознанного сайта в белке,
13) Site chain in the PDBSite - идентификатор цепи для шаблона сайта,
14) Site residues in
the PDBSite - обозначения аминокислот для шаблона
сайта.
Результат, представленный на HTML-страницы может быть сохранен в файл с помощью стандартных средств Интернет-браузера. Для получения PDB файла со структурным выравниванием белка с шаблонами сайтов необходимо кликнуть мышью на check-box интересуемого сайта, а затем нажать на кнопку Download structure alignment as PDB file. После этого действия будет показано окно для сохранения PDB файла на
компьютере пользователя.
Для завершения работы с текущей (введенной) третичной структурой белка и
перехода к обработке другого белка надо воспользоваться стандартными средствами Интернет браузера для возвращения на предыдущую страницу, в результате чего осуществляется подготовка к повторному выполнению этой операции.
2.2 Программные компоненты Subloc и SubPrediction : предсказание
внутриклеточной локализации белков прокариот и эукариот.
Пространство внутри живой клетки не однородно, а состоит из замкнутых объемов, разделенных мембранами - компартментов. Прокариотические клетки часто содержат всего один компартмент, содержащий ДНК, РНК, белки. Фотосинтезирующие виды имеют также плоские цистерны - тилакоиды. Эукариотические клетки содержат большой набор компартментов, представленных, в основном, органеллами. Белковые молекулыклетки могут находиться в разных компартментах, а также быть связанными с различными структурами клетки - плазматическими мембранами, цитоскелетом и хроматином, в случае эукариот, или нуклеоидом, в случае эукариот. Каждый компартмент или клеточная структура имеет свой набор функций, который отчасти зависит от белков,
находящихся в соответствующей области.
Среди известных серверов, реализующих методы предсказания внутриклеточной локализации белков для бактериальных организмов можно выделить следующие: SubLoc, LOCTREE ,
PSORTB, и т.д.
Методы предсказания основываются поиске гомологов среди белков с
установленной локализацией, поиске сигналов в последовательностях, характеризующих локализацию, использовании дискриминантного анализа и нейронных сетей, а также существуют алгоритмы, построенные на комбинации нескольких методов.
Алгоритм предсказания внутриклеточной локализации белков состоит из трех разделов:
- Поиск гомологов для анализируемой последовательности среди
последовательностей белков с установленной локализацией методом BLAST и PsiBLAST,
(2) Классификация
последовательности методом кластерного
анализа КРАБ, (3) Классификация последовательности
методом нейронных сетей.
В результате классификации будет решаться задача отнесения последовательности к группе белков с заданной внутриклеточной локализацией. В качестве результата будут выдаваться
предсказания каждого из трех алгоритмов, а также решение, построенное методом голосования.
Таким образом, определение внутриклеточной
локализации вновь открытого белка может
указать на область его биологических
функций.
- Разработаны две программные компоненты для предсказания внутриклеточной локализации белков - Subloc, для прокариот, и SubPrediction, для эукариот.
Министерство здравоохранения и социального развития РФ
Волгоградский
Государственный Медицинский
Реферат на тему:
«Компьютерное
программное обеспечение
в протеомике»
Выполнила:
Студентка I курса, 5 группы
Медико-биологического факультета
Файт Евгения
Волгоград 2011

- Компьютерная психодиагностика
- Компьютерная революция во 2-ой половине XX века и ее последствия
- КОМПЬЮТЕРНАЯ РЕВОЛЮЦИЯ И ЕЕ ВЛИЯНИЕ НА ЭКОНОМИЧЕСКУЮ СИСТЕМУ
- Компьютерная революция: социальные перспективы и последствия
- Компьютерная реклама
- Компьютерная сеть
- Компьютерная сеть
- Компьютерная преступность
- Компьютерная преступность
- Компьютерная преступность
- Компьютерная преступность
- Компьютерная преступность
- Компьютерная преступность и безопасность
- Компьютерная преступность:перед лицом