Русский
!

Presentations

Periodicity of 2 amino acids in protein sequencies

Rudenko V.M., Korotkov E.V.

Center of Bioengineering Federal Research Centre “Fundamentals of Biotechnology” RAS, Russia, 117312, Moscow, pr. 60-letiya Oktyabrya, 7, 1

Широко известен тот факт, что аминокислотные последовательности могут содержать в своем составе тандемные повторы, которые связаны с пространственной структурой белка и его биологической функцией [1]. Белки с тандемными повторами вовлечены в такие жизненно-важные процессы как дупликация генов, рекомбинация, кроссинговер. Это подчеркивает их значимость и эволюционную роль.

С точки зрения математики тандемные повторы можно интерпретировать как периодичность, хотя и размытую, содержащую замены, вставки и делеции. В данной работе мы предлагаем производить поиск периодичности с учетом корреляций соседних символов последовательности. Для этих целей сначала мы группировали аминокислоты на 5 групп в соответствии с полярностью их радикалов и перекодировали исходную последовательность, определенную на алфавите в 20 символов к новому 5-символьному алфавиту. Затем рассматривали все парные комбинации соседних символов последовательности, строили для них позиционно-весовую матрицу и циклическое выравнивание [2]. В качестве меры периодичности выступала величина Z, которая определялась методом Монте-Карло. Пороговое значение величины было взято Z0=6.

Метод был применен к анализу последовательностей банка данных uniprot. Было обнаружено достаточно много белков, с периодичностью 2. Так используемый нами подход выявил 2115 белков, в то время как популярная программа T-REKS обнаружила на том же множестве всего 1090 периодических фрагментов.

Анализ белков с периодичностью 2 показал, что среди них встречается много уже аннотированных ранее как белки, содержащие повторы: сollagen-like protein, serine-aspartate repeat-containing protein и т.д. Их последовательности имеют экстремальное большое значение Z.

Но наибольший интерес представляют последовательности, где определяется периодичность с небольшими значениями Z. Например, последовательность Q3SZ45 из генома Bos taurus (Stromal cell-derived factor 2), длина 211. Периодичность с Z=8.2 наблюдаетcя на участке 25-193 аа, что составляет около 80% ее длины.

© 2004 Designed by Lyceum of Informational Technologies №1533