Главная страница
Навигация по странице:

  • АКТИВНОСТИ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ Харьков - 2003 УДК 615.015.11 Иванов В.В, Слета Л.А. РАСЧЕТНЫЕ МЕТОДЫ ПРОГНОЗА БИОЛОГИЧЕСКОЙ

  • 1. ДЕСКРИПТОРНЫЙ МЕТОД ОПИСАНИЯ СТРУКТУРЫ МОЛЕКУЛ

  • 1.1. ИНДЕКСЫ ЭЛЕКТРОННОЙ СТРУКТУРЫ

  • Таблица 1.1 Наиболее распространенные квантовохимические индексы π-электронной структуры

  • В. В. Иванов, Л. А. Слета расчетные методы прогноза биологической активности органических соединений


    Скачать 1,74 Mb.
    НазваниеВ. В. Иванов, Л. А. Слета расчетные методы прогноза биологической активности органических соединений
    АнкорRaschetnie metodi prognoza biologicheskoy aktivnosti organicheskih soedineniy ivanov.pdf
    Дата01.11.2019
    Размер1,74 Mb.
    Формат файлаpdf
    Имя файлаRaschetnie metodi prognoza biologicheskoy aktivnosti organichesk.pdf
    ТипУчебное пособие
    #14184
    КатегорияХимия
    страница1 из 5
      1   2   3   4   5


    Министерство образования и науки Украины
    Харьковский национальный университет им.В.Н.Каразина
    В.В.ИВАНОВ, Л.А.СЛЕТА
    РАСЧЕТНЫЕ МЕТОДЫ ПРОГНОЗА БИОЛОГИЧЕСКОЙ
    АКТИВНОСТИ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ
    Харьков - 2003

    УДК 615.015.11
    Иванов В.В, Слета Л.А.
    РАСЧЕТНЫЕ МЕТОДЫ ПРОГНОЗА БИОЛОГИЧЕСКОЙ
    АКТИВНОСТИ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ.
    Харьков: ХНУ, 2003–71с.
    Учебное пособие является систематическим изложением основ методологии прогноза биологической активности органических молекул.
    Рассмотрены базовые параметры характеризующие молекулярную структуру, а также распространенные статистические методы обработки экспериментальных данных по биоактивности.
    Для аспирантов и студентов старших курсов специальностей химия, биохимия, биофизика и медицинская физика.
    Рис. 5. Библиография: 7 назв.
    Рецензенты:
    Доктор химических наук Дорошенко А.О.
    Рекомендовано к печати методической комиссией химического факультета
    Харьковского национального университета им. В.Н.Каразина
    Протокол № 5 от 14 мая 2003 г.
    © Иванов В.В., Слета Л.А.
    ©Харьковский национальный университет им.В.Каразина, 2003 г.
    2

    СОДЕРЖАНИЕ
    Введение..........................................................................................................4 1. Дескрипторный метод описания структуры молекул...............................6 1.1. Индексы электронной структуры.......................................................6 1.2.Задачи..................................................................................................15 1.3. Топологические и теоретико-информационные индексы...............21 1.4.Задачи..................................................................................................31 2. Регрессионные модели биологической активности................................33 2.1. Метод наименьших квадратов..........................................................34 2.2. Эмпирические константы заместителей. Уравнения Гаммета и
    Тафта...……………………………………………………….………........36 2.3. Аддитивная модель Фри-Вильсона...........................…....................39 2.4. Метод Хэнча. Оценка липофильности......…....................................41 2.5. Задачи........................................................…...........................….......46 3. Статистические методы классификации молекул по их биологической активности...........................................................................................…..53 3.1. Логико-комбинаторный подход........……....................................….54 3.2. Кластерный анализ.............................................................................59 3.3. Линейный дискриминационный анализ...........….............................61 3.4. Задачи..…………………………..................………...........................64 4. Заключение....................................................................…..........................68 5. Список литературы........................................................…….....................70 6. Приложение. Некоторые термины и параметры биологической активности........……………………………………………………………......71 3

    ВВЕДЕНИЕ
    Современная технология ставит перед учеными задачу разработки методов надежного предсказания физико-химических и биологических видов активности различных классов химических соединений. Эта проблема имеет общее название количественное соотношения структура
    - активность (Quantitative Structure – Aсtivity Relationship, QSAR) и в настоящее время является многопрофильной задачей, включающей в себя различные подходы не только в рамках фармакологической химии, но и физики и математики.
    Для того, чтобы найти соотношение между заданным видом активности органических соединений и их структурой, последнюю необходимо представить в численном виде. Численные характеристики, выражающие структурные особенности молекулы, получили общее наименование дескрипторов молекулярной структуры (или просто
    дескрипторы). В связи с этим главная проблема QSAR – выбор такого
    (желательно минимального) набора дескрипторов, который достаточен для описания заданного свойства. Хорошие перспективы при решении данной проблемы имеют методы квантовой химии, с помощью которых можно проводить расчеты электронной структуры и геометрии самых разнообразных химических систем вплоть до моделирования эффектов среды и взаимодействия молекулы с рецептором.
    Особенностью проблематики QSARявляется необходимость широкого внедрения математических методов обработки экспериментальных данных, позволяющих строить различные типы функциональных зависимостей. Здесь наряду с хорошо известным регрессионным анализом применяются факторные методы, позволяющие выделять наиболее существенные параметры, описывающие систему, а затем проводить классификацию химических соединений по типам
    4
    биологической активности. В целом методология QSAR позволяет заменить поиск соотношений “структура – активность“ анализом соотношений “дескрипторы – активность“ и на конечном этапе исследований получать модельные функции вида:
    Y = Y (d , d , , d ),
    1 2
    N
    K
    где искомое свойство Y выражается через значения дескрипторов молекулярной структуры
    . Подобные уравнения фактически являются схемами для расчета самых различных свойств органических соединений. i
    d
    Область применения построенных моделей зависит как от их качества с точки зрения статистики, так и от представительности базы данных, использованной для их построения.
    В процессе моделирования важно контролировать прогностическую способность построенных моделей. Один из наиболее надежных подходов к решению этой задачи состоит в разделении исходной базы данных на
    обучающую выборку, использующуюся для построения моделей, и
    контрольную выборку. Последняя необходима для независимого контроля предсказательной способности моделей. Такой подход позволяет в большинстве случаев избежать случайных корреляций.
    Целью настоящего пособия является краткое изложение основных понятий и методологии QSAR, а также описание различных систем параметров молекул и методов оценки биологической активности на основе статистического анализа эмпирических данных. Для каждого из таких подходов предлагается набор соответствующих задач. Все объекты, описанные в этих задачах, и соответствующие данные об их биологической активности взяты из оригинальных работ.
    5

    1. ДЕСКРИПТОРНЫЙ МЕТОД ОПИСАНИЯ СТРУКТУРЫ
    МОЛЕКУЛ
    В последние десятилетия для описания структуры молекул были предложены тысячи различных дескрипторов, которые включают индексы, характеризующие топологию, электронную структуру, энергию, форму молекул и т.д.
    Строение молекулы может быть описано с разной степенью детализации. Так, брутто-формула показывает, сколько и какие атомы содержатся в молекуле. Структурная формула учитывает лишь типы атомов и характер их связывания, игнорируя при этом геометрические характеристики. Задание координат ядер атомов в пространстве позволяет строить трехмерные геометрические модели молекул. С помощью квантовохимических расчетов можно получить дополнительную информацию о распределении электронной плотности (электронная
    структура молекулы). В ряде случаев для характеристики молекул используют физико-химические параметры, отражающие молекулярное строение косвенным образом.
    1.1. ИНДЕКСЫ ЭЛЕКТРОННОЙ СТРУКТУРЫ
    На первом этапе исследования QSAR необходимо вычислить определенный набор дескрипторов для всех структур в имеющейся базе данных.
    Электронные дескрипторы могут быть вычислены с использованием методов квантовой химии. В данном разделе мы рассмотрим возможности применения простейшего подхода - полуэмпирического метода молекулярных орбиталей Хюккеля (МОХ). Метод МОХ основан на предположении, что каждый атом углерода поставляет в общую систему
    6
    один
    π-электрон, а гетероатомы – один или два (так называемое π- электронное приближение).
    В методе Хюккеля обычную структурную формулу органического вещества заменяют его молекулярным графом или хюккелевским графом.
    Хюккелевский граф наряду с топологической матрицей передает информацию о молекулярной структуре сопряженных и ароматических соединений. Так, для молекулы фульвена граф имеет вид:
    CH
    CH
    CH
    HC
    HC
    2
    Граф фульвена
    Фульвен
    2 3
    4 5
    6 1
    Топологическая матрица (или матрица смежности) графа G
    представляет собой симметричную матрицу порядка N, которая определяется следующим образом. Матричный элемент равен 1, если вершины графа (атомы) связаны друг с другом, в противном случае матричный элемент равен 0, т.е. топологическая матрица состоит из 1 и
    0. Например, топологическая матрица графа фульвена имеет вид: rs
    G
    rs
    G




















    =
    0 1
    0 0
    1 0
    1 0
    1 0
    0 0
    0 1
    0 1
    0 0
    0 0
    1 0
    1 0
    1 0
    0 1
    0 1
    0 0
    0 0
    1 0
    G
    Хюккелевские молекулярные орбитали (МО) являются собственными функциями эффективного одноэлектронного гамильтониана, обозначаемого :
    i
    ϕ
    h i
    i i
    h
    ϕ
    ε
    =
    ϕ
    7

    Величина орбитальной энергии i
    ε
    представляет собой собственное значение энергии, связанное с собственной функцией
    . Каждая МО выражается в виде линейной комбинации атомных орбиталей: i
    ϕ

    =
    χ
    =
    ϕ
    N
    1
    r r
    ir i
    c
    , где суммирование проводится по всем атомам r сопряженной молекулы,
    – атомная
    – орбиталь атома с номером r, а
    – вклад r-й атомной орбитали в i-ю МО (так называемый орбитальный коэффициент). При этом атомные орбитали предполагаются ортонормированными: r
    χ
    z p
    2
    ir c
    r
    χ
    rs s
    r
    δ
    =
    χ
    χ
    Полная
    π-электронная энергия определяется выражением
    π
    E

    =
    π
    ε
    =
    N
    1
    i i
    i n
    E
    , где n i
    - число заполнения орбитали
    ϕ
    i
    , принимающее значения 2, 1 или 0.
    Минимизация с помощью вариационного метода приводит к системе секулярных (или вековых) уравнений
    π
    E
    (
    )
    N
    ,
    ,
    1
    s
    ,
    0
    c h
    N
    1
    s is rs i
    rs
    K
    =
    =
    δ
    ε


    =
    , где
    – матричные элементы гамильтониана в базисе атомных орбиталей: rs h
    s r
    rs
    =
    h
    χ
    χ h
    Секулярные уравнения имеют нетривиальные решения только при условии обращения в нуль секулярного (векового) детерминанта
    0
    I
    E
    det
    =

    π
    h
    , где I – единичная матрица.
    Упрощение секулярного детерминанта достигается путем введения следующих хюккелевских приближений:

    α
    =
    χ
    χ
    =
    r r
    rr h
    h
    ,
    8
    где
    α - кулоновский интеграл, который предполагается одинаковым для всех орбиталей, центрированных на идентичных атомах r,
    • связаны s
    ,
    r атомы если связаны не s
    ,
    r атомы если
    ,
    ,
    0
    h h
    s r
    rs



    β
    =
    χ
    χ
    =
    где
    β называется резонансным интегралом,в простейшем варианте теории он предполагается одинаковым для всех связей между атомами одного типа. С учетом хюккелевских приближений матрица h приобретает вид
    G
    h
    β
    +
    Ι
    α
    =
    , где G – топологическая матрица молекулы.
    Секулярный детерминант легко преобразовать к виду:
    0
    G
    I
    det i
    =

    β
    α

    ε
    Численные величины
    β
    α

    ε
    =
    i x
    , входящие в секулярный детерминант, определяют энергию
    π-электронов на отдельных МО и образуют набор собственных значений рассматриваемого хюккелевского графа, т.е.
    N
    ,
    ,
    2
    ,
    1
    i
    ,
    x i
    i
    K
    =
    β
    +
    α
    =
    ε
    Набор собственных значений матрицы G называют
    спектром графа.
    N
    3 2
    1
    x
    ,
    ,
    x
    ,
    x
    ,
    x
    K
    Поскольку матрицы h и G коммутируют, они обладают общим набором собственных векторов. Собственные векторы топологической матрицы G идентичны хюккелевским молекулярным орбиталям.
    На основе решений метода Хюккеля в рамках
    π-электронного приближения разработана система дескрипторов молекулярной структуры
    (табл.1.1).
    Таблица 1.1 Наиболее распространенные квантовохимические
    индексы
    π-электронной структуры
    9

    Тип дескриптора
    Дескриптор
    Предсказываемое физико-химическое свойство
    Индексы электронной структуры
    Электронная плотность –
    ρ
    r
    Электрофильные и нуклеофильные центры,
    Дипольный момент
    Порядок связи –
    ρ
    rs
    Длина, силовая постоянная, прочность химической связи
    Индекс свободной валентности – r
    F
    Реакционная способность в радикальных реакциях замещения
    Суперделокализуемость

    ,
    S
    (r)
    S
    e
    (r)
    n
    Электрофильные, нуклеофильные центры
    Поляризуемость молекулы
    Взаимодействие электронной оболочки с электрическим полем, реакционная способность
    Энергетические индексы
    Полная энергия – Е
    π
    Устойчивость конформации
    Энергия связи – Е
    b
    Энергия разрыва связи
    Энергия высшей занятой МО –
    )
    HOMO
    (
    ε
    Энергия ионизации
    Энергия низшей вакантной МО –
    )
    LUMO
    (
    ε
    Энергия сродства к электрону
    Энергия электронного перехода –
    λ
    Электронные спектры поглощения
    Энергия делокализации –
    Е
    D
    Устойчивость сопряженной системы
    Электронная плотность характеризует вероятность пребывания электронов в данной области молекулы (у данного атома r)

    =
    i
    2
    ir i
    r c
    n
    ρ
    , где n i
    – число электронов на i-той МО, c
    – орбитальный коэффициент разложения i-той молекулярной орбитали по r-той атомной орбитали (атом r). C этой величиной связан также заряд на атоме (q ir r
    ):
    10
    r
    r r
    Z
    q
    ρ

    =
    , где Z
    r
    – число
    π–электронов атома, отданных в систему сопряжения.
    π-Порядок связи характеризует степень π-электронного связывания.
    Эту величину для связи r-s можно вычислить следующим образом:

    =
    ρ
    i is ir i
    rs c
    c n
    Индекс свободной валентности характеризует реакционную способность углеродного атома r и согласно определению вычисляется следующим образом: r
    F
    r max r
    N
    N
    F

    =
    , где
    3
    N
    max
    =
    – максимальная для атома углерода величина, характеризующая способность к образованию
    π-связи, а N
    r
    - сумма порядков всех связей атома r:

    ρ
    =
    )
    rs
    (
    rs r
    N
    Суперделокализуемость атома r (индекс Фукуи) различают электрофильную – и нуклеофильную –
    S
    :
    (r)
    S
    e
    (r)
    n

    ε

    ε
    +
    ε
    =
    vac a
    a
    )
    LUMO
    (
    )
    HOMO
    (
    2
    ar e
    )
    (
    5 0
    c
    2
    )
    r
    (
    S
    ,

    ε
    +
    ε

    ε
    =
    occ i
    )
    LUMO
    (
    )
    HOMO
    (
    i
    2
    ir n
    )
    (
    5 0
    c
    2
    )
    r
    (
    S
    , где
    – энергия высшей заполненной МО,
    )
    HOMO
    (
    ε
    )
    LUMO
    (
    ε
    – энергия нижней вакантной МО. Эти величины интерпретируются как индексы, характеризующие способность к делокализации (стабилизации) электронов в переходном комплексе при атаке электрофильным/нyклеофильным реагентом.
    Особенно широкое применение получила суперделокализуемость в связи с оценками канцерогенной активности молекул.
    11

    Важное значение имеют индексы, характеризующие поляризуемость молекулярной системы.
    Обычно различают так называемую
    электрическую дипольную поляризуемость
    α и набор коулсоновских
    поляризуемостей
    π.
    Электрическая дипольная поляризуемость характеризует изменение распределения электронной плотности молекулы при помещении её в однородное электрическое поле. Эта величина может быть получена из эксперимента по молекулярной рефракции или вычислена как производная дипольного момента (
    µ
    ) по напряженности электрического поля (
    E
    r r
    ) из выражения
    E
    r r

    α
    =
    µ
    Обычно эта величина используется в виде средней поляризуемости
    α
    :
    (
    )
    zz yy xx
    3 1
    α
    +
    α
    +
    α
    =
    α
    , или (реже) анизотропии поляризуемости:
    (
    ) (
    )
    (
    )
    [
    ]
    2
    xx zz
    2
    zz yy
    2
    yy xx
    2 2
    1


    α

    α
    +
    α

    α
    +
    α

    α
    =
    α
    Здесь
    – компоненты тензора дипольной поляризуемости. zz yy xx
    ,
    ,
    α
    α
    α
    Молярная рефракция (MR) также широко используется в качестве дескриптора. В области оптических частот она выражается известной формулой Лорентца-Лоренца:
    α
    π
    =
    +

    =
    A
    2 2
    N
    3 4
    d
    MW
    2
    n
    1
    n
    MR
    , где n – показатель преломления вещества, MW – молекулярный вес, а d – плотность.
    Известны следующие типы коулсоновских поляризуемостей.
    Самополяризуемость атома
    r
    ) характеризует изменение электронной плотности атома при изменении электроотрицательности (кулоновского интеграла) того же атома:
    12

    ∑∑
    ε

    ε
    =
    α

    ρ

    =
    π
    occ i
    vac a
    a i
    2
    ar
    2
    ir r
    r r
    c c
    4
    Сумма самополяризуемостей по всем атомам также может служить хорошим дескриптором “подвижности” электронной оболочки молекулы:

    π
    =
    Π
    r r
    Атом-атомная поляризуемость (
    rs
    π
    ) характеризует изменение электронной плотности на атоме (r) при изменении электроотрицательности (кулоновского интеграла) другого атома (s):
    ∑∑
    ε

    ε
    =
    α

    ρ

    =
    π
    =
    π
    occ i
    vac a
    a i
    as is ar ir s
    r rs sr c
    c c
    c
    4
    Кроме перечисленных известны также поляризуемости типа атом-связь
    (
    st r
    st
    ,
    r
    β

    ρ

    =
    π
    ) и связь-связь (
    tu rs tu
    ,
    rs p
    β


    =
    π
    ), которые, однако, менее популярны в проблеме QSAR.
    Энергия разрыва химической связи:
    E
    E
    E
    b


    =
    , где E – полная энергия молекулярной системы, а
    E′
    – суммарная энергия составных частей, на которые система распадается.
    Энергия электронного перехода в различных квантовохимических подходах оценивается по-разному. В простейшем методе Хюккеля её получают как разность энергий МО. Так, энергия длинноволнового перехода вычисляется по формуле:
    )
    ВЗМО
    (
    )
    НВМО
    (
    ε

    ε
    =
    λ
    Энергия
    делокализации, (E
    D
    ) является фундаментальной характеристикой сопряженной системы:


    =
    π
    i i
    D
    E
    E
    E
    ,
    13
    где второй член соответствует энергии системы изолированных двойных связей данной молекулы.
    Вышеперечисленные квантовохимические индексы нашли широкое распространение в проблеме QSAR. Известно множество корреляционных функций, которые связывают наблюдаемый био- или физико-химический эффект с параметрами электронной структуры молекулы. В качестве примера приведем два уравнения. Так, из данных о токсичности (
    lg
    , см. приложение) серии из 20 нитрилов было получено следующее корреляционое уравнение (Chem.Rev., 1996,
      1   2   3   4   5


    написать администратору сайта