QSAR - количественная взаимосвязь между структурой и активностью
Содержание
Введение…………………………………………………………
- История создания QSAR………………………………………………………..4
- QSAR - количественная взаимосвязь между структурой и активностью…...12
- Cхема работы метода QSAR…………………………………………………...14
Заключение……………………………………………………
Список литературы……………………………………………………
Введение
Продуцирование нового лекарства это сложный, многостадийный процесс, занимающий много лет итребующий существенных трудовых и финансовых затрат. В последнее время постоянно воз- растающую роль в нем играют методы компьютерного молекулярного моделирования и исследованияколичественной связи между структурой и биологической активностью химических соединений -QSAR (Quantitative Structure-Activity Relationships), которые позволяют значительно сократить сроки разработки лекарств.Компьютерное проектирование лекарственных средств сравнительно молодая технология, она условноможет быть разделена на две ветви - поиск соединений с нужной активностью среди уже известныхвеществ и конструирование ранее неизвестных. Обе эти ветви, в реальной практике используются чащевсего совместно, дополняя и обогащая возможности исследователя.Корреляционный подход, структура-свойство, сводится к выявлению главных особенностей рассматриваемых объектов. Любопытно проследить, как он развивался применительно к созданиюновых биологически-активных, в том числе лекарственных, соединений. Сведения об их структуренакапливались двумя совершенно различными путями. С одной стороны, химикам и фармакологам запоследние две столетия стали известны многие высокоактивные природные соединения, обладающие,подчас чрезвычайно сложным строением (хинин, морфин, стрихнин, стероидные половые гормоны ит.д.), а с другой - за этот период среди несметного множества синтетических органических соединенийнет-нет, да обнаруживались ценные лекарственные вещества. Так, совершенно случайно были открытыдоселе применяемые аспирин, фенацетин, антипирин, стрептоцид. Оба эти направления породили разные подходы к установлению корреляций между структурой химического соединения и егобиологической активностью.
- История создания QSAR
С древнейших времен в качестве источника лекарственных препаратов использовалось растительное или животное сырье. Уже в средние века получила широкое распространение идея применения химических (главным образом неорганических) веществ для лечения заболеваний. Во второй половине XIX в. благодаря созданию структурной теории и быстрому развитию органической химии произошла подлинная революция в химии лекарств – появились и нашли применение чисто синтетические препараты. Традиционный путь поиска лекарственных веществ в XX в. заключался в синтезе самых разнообразных типов органических соединений и их тестировании на различные виды активности. Были синтезированы и протестированы сотни тысяч веществ. Трудоемкость и длительность этого процесса заставляла ученых задумываться над разработкой теоретических основ поиска лекарств, и главным образом – над проблемой ограничения количества синтезируемых соединений. Постепенно возникали подходы не только к выявлению взаимосвязи биологических свойств веществ с их структурой, но и к количественномуописанию этой взаимосвязи. Подобные исследования привели к рождению целого научного направления, называемого в современной химии лекарств QSAR («Quantitative Structure – Activity Relationship», или «количественное соотношение структура–активность»).
QSAR – это математический аппарат, позволяющий проводить корреляции между структурами химических соединений и их биологической активностью. Важная задача QSAR заключается в идентификации и количественном выражении структурных параметров или физико-химических свойств молекул с целью выявления факта влияния каждого из них на биологическую активность. Если такое влияние имеет место, то возможно составление уравнений, позволяющих просчитать заранее активность новых соединений и сократить количество синтезируемых веществ. Методология QSAR сформировалась к середине 1960-х гг. Ее основателем во многих литературных источниках считается американский ученый Корвин Ганч, хотя в ее создание существенный вклад внесли и такие ученые, как Ч.Овертон, Г.Мейер, Г.Фюнер, С.Фри, Дж.Вильсон, Т.Фуджита и др.
Идея о существовании математической зависимости между структурой и биологическими свойствами соединений была высказана еще во второй половине XIX в. В 1869 г. А.Крум-Браун и Т.Фрезер, исследуя токсическое действие различных алкалоидов (стрихнина, кодеина, морфина, никотина) и продуктов их метилирования (рис. 1), показали, что такое «незначительное» структурное изменение, как введение метильной группы к атому азота, вызывает существенное уменьшение токсичности алкалоидов. Крум-Браун и Фрезер пришли к выводу, что физиологическая активность (Ф) должна быть функцией химической структуры (С), и опубликовали уравнение, которое считается первой общей формулировкой количественной зависимости структура–активность:
Ф = f(С).
|
Рис. 1. |
Стали появляться и другие работы, в которых предпринимались попытки найти количественные выражения зависимости физиологической активности от химической структуры. Так, в том же 1869 г. Б.Ричардсон обнаружил, что в гомологических рядах спиртов жирного ряда концентрации веществ, вызывающих наркоз (отсутствие реакции на внешние раздражители) у животных, уменьшаются пропорционально увеличению количества атомов углерода в их молекулах. С.Бинц в 1880-х гг. вывел заключение о возрастании наркотического действия с увеличением количества атомов хлора в ряду CH4, CH3Cl, CH2Cl2, CHCl3, CCl4. Было установлено также, что снотворное действие некоторых сульфосодержащих соединений возрастает с увеличением количества этильных групп в их молекулах. Поиски подобных закономерностей, связывающих биологическую активность с количеством определенных атомов или групп, продолжались и в XX в. Можно привести довольно много примеров, однако подавляющее большинство этих закономерностей имели существенные ограничения и оказывались справедливыми лишь для очень небольших рядов соединений. Возникла необходимость привлечения каких-то других параметров для построения корреляций структура–свойство, и в дальнейшем существенно более плодотворными оказались попытки искать зависимости биологической активности веществ от их физико-химических свойств (которые в свою очередь зависят от химической структуры).
В конце XIX – начале XX в. появилась серия работ М.Рише, Ч.Овертона и Г.Мейера, в которых были обнаружены количественные корреляции между различными физико-химическими параметрами молекул и их токсичностью, а также способностью вызывать наркоз и местную анестезию. В 1893 г. Рише получил количественную зависимость токсичностей этилового спирта, диэтилового эфира, «экстракта полыни» и других веществ от их растворимостей в воде. В проводимых им экспериментах рыбки весом 2–5 г помещались в 1–1,5 л воды, содержащей измеренное количество исследуемого соединения, и определялась доза последнего, которая позволяла жить этим рыбкам в течение определенного времени. На основании полученных результатов Рише сделал заключение: чем более соединение растворимо, тем менее оно токсично.
Овертон через несколько лет после работ Рише, проанализировав наркотическое действие более 130 коммерчески доступных органических веществ на многочисленные растительные и животные объекты (водоросли, головастики, рыбы и др.), получил линейные зависимости между их активностью и липофильностью (способностью растворяться в жирах). В качестве меры последней он использовал коэффициент распределения вещества в системе оливковое масло–вода (т.е. соотношение концентраций вещества в липидной и водной фазах). Полученные результаты привели Овертона к выводу о том, что явление наркоза следует приписать к чисто физическим изменениям, вызванным растворением органических веществ в липидных компонентах животных и растительных клеток. К аналогичным выводам пришел и Мейер в 1899 г.
Работы Ричардсона, Рише и Овертона стимулировали появление в начале XX в. ряда исследований по построению зависимостей величин биологической активности от самых разнообразных физико-химических параметров. Например, Дж.Холт и В.Мур показали, что для тараканов и домашних мух токсичность паров жидкостей увеличивалась с увеличением их температуры кипения вплоть до определенной величины (около 225 °С). Более высококипящие соединения (225–250 °С) были настолько малолетучими, что гибель мух наблюдалась только после очень длительного нахождения в их парах, а соединения с температурами кипения выше 250 °С оказались нетоксичны.
Важные работы по изучению влияния физико-химических свойств веществ на биологическую активность были сделаны русским ученым Николаем Васильевичем Лазаревым. В начале 1940-х гг. (в блокадном Ленинграде) он проанализировал значения токсичностей и коэффициентов распределения в системе оливковое масло–вода для тысячи органических соединений. Лазарев построил графические корреляции, используя двойную логарифмическую шкалу, что позволило наблюдать линейные зависимости логарифмов коэффициентов распределения от логарифмов концентраций веществ, вызывающих тот или иной токсический эффект, например остановку изолированного сердца лягушки, раздражение кожных покровов животных.
В 1950-х гг. методология поиска корреляций между структурой и биологической активностью стала интенсивно развиваться благодаря исследованиям, целью которых было изучение вкладов отдельных заместителей в биологическую активность. Отметим, что еще в 1907 г. Г. Фюнер, изучавший задержку развития яиц морских ежей под влиянием одноатомных спиртов жирного ряда, обнаружил, что в пределах гомологических серий каждый следующий член ряда действовал приблизительно втрое сильнее, чем предыдущий, что явилось первым количественным свидетельством аддитивности вкладов отдельных структурных фрагментов в значение активности.
Важным достижением середины XX в. по созданию корреляций, основанных на определении вкладов заместителей в данный вид активности, являются исследования С.Фри и Дж.Вильсона (1964). В предложенном ими методе биологическая активность определяется как сумма вкладов, вносимых каждым заместителем в каждом положении, и никакие физико-химические характеристики молекул при этом не привлекаются. Так, для серии гипотетических соединений (рис. 2, соединения 1, 2, 3), активность (А) будет определяться уравнением:
А =
где Ki – вклад заместителя Ri, находящегося в положении i. При отсутствии заместителя в данном положении K = 0, при его наличии k = 1.
Константы, выражающие влияние на активность каждого заместителя в каждой позиции, определяют на основании экспериментальных данных (в нашем гипотетическом примере – на основании значений активностей соединений 1, 2 и 3) и подставляют их в уравнение. Полученное уравнение может быть использовано для вычисления активности лишь тех новых соединений рассматриваемого ряда, которые содержат заместители, по природе и положению идентичные заместителям уже исследованных соединений (например, в нашем случае (см. рис. 2) – для соединений 4, 5, 6). Часто, однако, таким образом удается рассчитать активность довольно большого числа новых структур.
|
Рис. 2. |
Помимо таких чисто эмпирических методов в середине XX в. были предприняты попытки использовать в корреляционных уравнениях параметры, учитывающие липофильность соединений, а также электронные и стерические эффекты заместителей. В 1964 г. Корвин Ганч опубликовал в журнале Американского химического общества свою работу « – – –анализ. Метод корреляции биологической активности и химической структуры», которая впоследствии получила такой высокий индекс цитирования, что была названа Международным институтом научной информации «классической работой». 1964 год условно считается годом рождения современной методологии QSAR.
Заслугой Корвина Ганча явились следующие важные идеи. Во-первых, он предложил скомбинировать в одном уравнении сразу несколько структурных параметров, характеризующих электронные, стерические и гидрофобные свойства молекулы. Во-вторых, для нелинейных соотношений липофильность – активность Ганч предложил параболическую модель. Он заключил, что для связывания с молекулами-мишенями лекарственные соединения должны иметь возможность, с одной стороны, циркулировать в кровотоке (т.е. быть растворимыми в воде), а с другой стороны – проникать через мембраны клеток (т.е. растворяться в жирах). В таком случае активность веществ с очень маленьким или очень большим коэффициентом распределения (т.е. очень гидрофильных или очень липофильных) будет незначительной, т.к. они либо не смогут пройти через липидные мембраны, либо будут захвачены жировой тканью. Это означает, что зависимость активности от коэффициента распределения будет в общем случае представлять собой параболическую кривую, имеющую максимум. Подобные зависимости Ганч предложил описывать уравнениями, содержащими вторую степень. В общем виде предложенное им корреляционное уравнение для данного вида активности в данном ряду химических соединений имеет вид:
lg(1/c) = a0 + a1lgP – a2(lgP)2 + a3
где с – любая экспериментальная величина, характеризующая биологическую активность, Р – коэффициент распределения вещества между липидной и водной фазами (Ганч использовал систему октанол–вода), параметры и Es отражают соответственно электронные и стерические влияния заместителей, ai – постоянные, полученные при обработке экспериментальных данных методом наименьших квадратов. В частных случаях один или несколько коэффициентов ai могут принимать нулевое значение, тогда величина lg(1/c) зависит от меньшего числа параметров. Например, биологический ответ живого организма может определяться только гидрофобными характеристиками вещества, в то время как его электронные и стерические параметры могут не играть существенной роли, и наоборот.
Основной характеристикой липофильности молекулы, используемой в корреляционных уравнениях, является логарифм коэффициента распределения в системе октанол–вода. Одна из идей Ганча заключалась в том, что эту величину можно представить как сумму введенных им величин , характеризующих вклад в липофильность отдельных атомов или фрагментов структуры. Очевидно, что параметр имеет отрицательные значения для гидрофильных групп (например, для карбоксила) и положительные – для гидрофобных групп (например, для метила). Важность этой идеи заключается в том, что, суммируя определенные экспериментальные значения для структурных фрагментов данного соединения, можно получить расчетную величину lgP и в ряде случаев оценить биологическую активность молекул до их синтеза. Например, при создании снотворных средств имеет смысл рассчитать теоретические значения логарифма коэффициента распределения для серии перспективных соединений и синтезировать только те, для которых lgP 2, т.к. именно это значение является для них оптимальным.
В настоящее время подход Ганча получил свое развитие и широко используется для поиска корреляций между биологической активностью, липофильностью и другими молекулярными характеристиками. Корреляционные соотношения чрезвычайно важны для предсказания структурных модификаций химических соединений, способствующих повышению их биологической активности. Именно в этой предсказательной силе и заключается основная ценность методологии QSAR – необходимого инструмента для рационального синтеза лекарственных препаратов.
* * *
Корвин ГАНЧ* (Corwin Hansch) – американский химик-органик. Родился 6 октября 1918 г. в г. Кейнмаре (шт. Северная Дакота, США). Закончил Иллинойский университет (Чикаго) в 1940 г., после чего работал над кандидатской диссертацией в Университете Нью-Йорка, защитил ее в 1944 г. Некоторое время работал в компании «Дюпон» в Ричланде и в Вилмингтоне (шт. Делавар), а также в университете в Чикаго. В 1946 г. стал сотрудником химического отделения колледжа Помона в Клэрмонте (Pomona College, Claremont), где работает до сих пор. Корвин Ганч женат (с 1944 г.), в семье двое детей – сын (1954) и дочь (1958).
Начальные научные исследования Ганча были посвящены изучению реакций высокотемпературной каталитической дегидроциклизации, однако основной областью деятельности является разработка методов поиска количественных соотношений между биологической активностью и химической структурой. Ученый считается одним из главных основателей дисциплины QSAR. Он автор более 300 публикаций, в том числе нескольких монографий. Ряд книг других авторов посвящен Корвину Ганчу в знак признания его выдающихся научных заслуг. По данным Института научной информации Ганч является одним из наиболее цитируемых ученых всего мира.
В 2000 г. Международное общество химической информатики и QSAR (основано в 1989 г.) учредило в честь К.Ганча, почетного председателя общества, специальную награду, которая вручается ежегодно на европейском симпозиуме по QSAR.
- QSAR - количественная взаимосвязь между структурой и активностью
Одной из важнейших задач современной химической науки является установление зависимостей между структурой и свойствами веществ. Число вновь синтезируемых новых органических соединений постоянно увеличивается, поэтому самой актуальной задачей является количественное предсказание конкретных свойств для новых еще не синтезированных веществ на основании определенных физико-химических параметров отдельных соединений. Для этого используют метод QSAR. Аббревиатура QSAR является сокращением от английского Quantitative Structure Activity Relationships. Дословный перевод: количественное соотношение структура-свойство. В русском языке для него нет аббревиатуры, поэтому используют английское сокращение. Это направление возникло на стыке органической химии, математического моделирования и компьютерной химии.
Исторически всё началось с желания учёных найти количественную связь между структурой вещества и его свойствами и выразить её в виде математического уравнения. Это уравнение должно отражать зависимость одного набора цифр (свойств) от другого набора цифр (структур). Однако при этом возникает трудность. Выразить цифрой свойство достаточно просто — физиологическую активность серии веществ можно измерять количественно. Но как выразить числом структуру химического соединения? Над этим вопросом химики и математики работали в течение многих лет. В настоящее время в QSAR используются так называемые дескрипторы химической структуры.
Дескриптор — это число (или математический параметр), которое характеризует структуру органического соединения, причём так, что подмечаются какие-то важные черты этой структуры. В принципе любое число, которое можно рассчитать из структурной формулы — молекулярный вес, число определённых атомов, связей или групп, молекулярный объём, частичные заряды на атомах, — может выступать в качестве дескриптора. Например, годится ли в качестве дескриптора (то есть характеризует ли соединение) число атомов углерода в нём? Да, и иногда это хороший дескриптор. А число нитрогрупп? Конечно: чем их больше, тем лучше взорвётся — это дескриптор для взрывчатых веществ.
Для предсказания физиологической активности в QSAR обычно используют следующие дескрипторы:
- электронные эффекты (влияют на ионизацию или полярность соединения)
- стерические особенности структуры (играют важную роль при оценке прочности связывания исследуемого соединения с биомишенью)
- липофильность (способность растворяться в жирах характеризует способность лекарства преодолевать клеточные мембраны)
Большую роль в QSAR имеют так называемые топологические дескрипторы. В этом методе структурная формула — чисто математическое понятие, граф. Из теории графов можно посчитать так называемые инварианты графов, которые и рассматриваются как дескрипторы. Применяются и сложные фрагментные дескрипторы, которые оценивают вклад различных частей молекулы в общее свойство. Они значительно облегчают исследователям обратное структурное конструирование неизвестных соединений с потенциально высокой активностью. Модель QSAR — это математическое уравнение, с помощью которого можно описать физиологическую активность (и вообще любое свойство).
Рис. 3. Пример предсказания активности структур методом QSAR (сравнение экспериментальных и предсказанных данных по ингибированию замещенными индолами захвата Са2+) |
Схема работы метода QSAR
Метод QSAR работает следующим образом. Сначала группу соединений с известной структурой и известными значениями физиологической активности (полученными из эксперимента) делят на две части: тренировочный и тестовый набор. В этих наборах цифры, характеризующие активность, уже соотнесены с конкретной структурой. Далее выбираются дескрипторы — хорошие компьютерные программы способны перебирать многие сотни дескрипторов. На следующем этапе строят математическую зависимость активности от выбранных дескрипторов для соединений из тренировочного набора и получают так называемое QSAR-уравнение.
Правильность полученного QSAR-уравнения проверяют на тестовом наборе структур. Сначала вычисляют дескрипторы для каждой из тест-структур, подставляют их в QSAR-уравнение, рассчитывают значения активности и сравнивают их с уже известными экспериментальными значениями (рис. 3). Если для тестового набора наблюдается хорошее совпадение расчётных и экспериментальных значений, то данное QSAR-уравнение можно применить для предсказания свойств новых, ещё не синтезированных структур. С помощью этого метода, имея в арсенале совсем небольшое количество химических соединений с известной активностью, можно предсказать необходимую структуру и тем самым резко ограничить круг поисков.
Метод QSAR широко используют химики во всём мире. Например, если взять выпуски журналов „Chemical reviews“ за последние годы, то только в заголовках статей эта аббревиатура встретится несколько раз. Сейчас издаётся несколько специальных журналов, посвященных QSAR.
В методологии QSAR выделяют прямую и обратную задачи. Прямая задача QSAR заключается в предсказании активности на основания знания структуры. Обратной задачей QSAR является конструирование химических структур с заданными величинами активностей.
Заключение
Поскольку речь идет о биологической активности, понятию QSAR близко понятие компьютерное моделирование лекарственных препаратов (или компьютерный дизайн лекарств), в англоязычной литературе термин более устоялся - Computer Aided Drug Design, или сокращенно CADD - савокупность вычислительных методов (в том числе и методов QSAR) и программ, используемых для направленного молекулярного дизайна лекарств (более корректно было бы говорить о потенциальных лекарствах или же о соединениях-лидерах). Хотя о чисто вычислительном дизайне говорить еще рано, поскольку многие свойства потенциальных лекарств в настоящее время можно определить исключительно экспериментальным путем (вычислительные же оценки носят качественный характер). CADD (компьютерный дизайн лекарств) можно рассматривать частным (хотя и наиболее изучаемым) направлением CAMD (Computer Aided Molecular Design), компьютерного молекулярного дизайна. Таким образом компьютерный молекулярный дизайн представляет собой савокупность подходов (методов, программ), используемых для молекулярного моделирования. Фактически экспоненциальное развитие вычислительных методов в последнее десятилетие связано главным образом с ростом мощностей вычислительных ресурсов и во вторую очередь - с развитием разных методов и подходов.
Исследования в области вычислительной биологии, биоинформатики, а также других междисциплинарных вычислительных наук сранительно молоды (отдельные ветви области находятся только на стадии становления). Одним из пропагандистов QSAR в России стояла и стоит группа вычислительной химии лаборатории органического синтеза кафедры органической химии Химического факультета Московского государственного университета им. М.В.Ломоносова, возглавляемая академиком РАН Зефировым Н.С. В настоящее время тематику QSAR в той или иной степени затрагивают научно-исследовательские группы, работающие в разных российских учебных и научных центрах. В последнее время использование методов QSAR получает все большее распространение.
Список литературы
- И. И. Баскин, М. И. Скворцова, И. В. Станкевич, Н. С. Зефиров(1994). «О базисе инвариантов помеченных молекулярных графов». Докл. РАН 339 (3): 346-350.
- О. А. Раевский (1999). «Дескрипторы молекулярной структуры в компьютерном дизайне биологически активных веществ». Успехи химии 68 (6): 555-575.
- И. И. Баскин, В. А. Палюлин, Н. С. Зефиров (1993). «Методология поиска прямых корреляций между структурами и свойствами органических соединений при помощи вычислительных нейронных сетей». Докл. РАН 333(2): 176-179.
- Н. В. Артеменко, И. И. Баскин, В. А. Палюлин, Н. С. Зефиров (2001). «Прогнозирование физических свойств органических соединений при помощи искусственных нейронных сетей в рамках подструктурного подхода». Докл. АН 381 (2): 203-206.
- Н. М. Гальберштам, И. И. Баскин, В. А. Палюлин, Н. С. Зефиров (2002). «Построение нейросетевых зависимостей структура-условия-свойство. Моделирование физико-химических свойств углеводородов». Докл. АН 384 (2): 202-205.
- И. И. Баскин, А. О. Айт, Н. М. Гальберштам, В. А. Палюлин, Н. С. Зефиров (1997). «Применение методологии искусственных нейронных сетей для прогнозирования свойств сложных молекулярных систем». Докл. АН 357 (1): 57-59.
- Зефирова О.Н., Палюлин В.А. История QSAR. Ранние исследования количественной связи между структурой и биологической активностью органических соединений; История QSAR. Работы Н.В.Лазарева о количественной связи между структурой органических соединений и их биологической активностью. В кн.: История химии: область науки и учебная дисциплина. Под ред. В.В.Лунина и В.М.Орла. М.: Изд-во МГУ, 2001, с. 60–73, 74–81.

- Quantifiers and their ways of use
- Questionnaire as a method of expert judgements, and its features
- Quick Check
- RAID-массивов
- Raising Capital
- Realization of implicit lexical-grammatical categories of noun in the songs of English speaking group “Evanescence”
- Regional varieties of the English vocabulary
- Publіc Relatіons
- Punctuation in english language
- Pазpабoтка peкoмeндаций пo сoвepшeнствoванию кopпopативнoй культуpы пpeдпpиятия
- Pазвитие твоpческих способностей у детей в условиях пленэpа в системе дополнительного обpазования
- QFD-анализ и построение функции качества для цельного сгущенного молока с сахаром
- QFD-анализ качества молока цельного сгущенного с сахаром
- QL алгоритм для вычисления симметричных трехдиагональных матриц