Сравние выравнивания одних и тех же последовательностей разными программами

Выравнивание было проведено при помощи программ: MAFFT, MUSCLE, ClustalW в качестве референсного было выбрано выравнивание MAFFT. ClusalW, была выбранна так как имеет соотношение наименьшее количество затраченного времени и наибольшее отклонение от референсного выравнивания, опираясь на таблицу сравнения программ на BaliBase.

Для выравнивания были выбраны 7 последовательностей FGF1 (фактор роста фибробластов 1 ) – это белок из семейства факторов роста фибробластов, играющий роль в регуляции клеточной пролиферации, дифференцировки и восстановления тканей.

Почему интересна его последовательность?
Высокая консервативность – последовательность FGF1 сохранилась у многих видов, что говорит о её важности в эволюции.
Отсутствие сигнального пептида – в отличие от многих секреторных белков, FGF1 не имеет классического сигнального пептида, но всё же выделяется клеткой (механизм до конца не ясен).

Использовалась программа для сравнения macho.py

Таблица 13-1 Mafft и Muscle Mafft и ClustalW
Одинаково выровненные блоки (1-55)-(1-55)
(59-153)-(59-153)
(1-11)-(1-11)
(15-19)-(15-19)
(23-53)-(23-53)
(59-119)-(59-119)
(122-157)-(122-157)
Одинаково выравненные колонки не входяшие в блоки нет нет

проект Jalview

По таблице видно, что программы Mafft и Muscle имеют больший процент совпадения блоков (95.54%) чем Mafft и ClustalW (91.72%). Возможно это связано со схожестью алгоритмов составления множественных выравниваний программ Mafft и Muscle.

Сравнение по совмещению структур и с выравниванием MSA

Для совмещения структур были выбранны белки 3hay, 3u28, 3uai из домена Gar1 AC:PF04410.

Рисунок 1. Визуальное выравнивание структур белков
Таблица 13-1 Mafft и PDB
Одинаково выровненные блоки (1-2)-(1-2)
(43-131)-(36-124)
(139-153)-(132-146)
(156-158)-(149-151)
(160-177)-(153-170)
(184-288)-(177-281)
(300-377)-(292-369)
Одинаково выравненные колонки не входяшие в блоки (28)-(20)

Как показано в таблице и на рисунке 1, выравнивание с помощью MAFFT и структурное выравнивание на основе PDB демонстрируют значительное совпадение в консервативных блоках, однако не являются абсолютно идентичными. Обнаружена одна одинаково выровненная колонка вне блоков: (28)-(20), что может отражать локальную консервативность этого положения.

Таким образом, выравнивание подтверждает высокую степень сохранности в основных структурных областях, но также указывает на возможные расхождения в участках без четкой вторичной структуры. Это может свидетельствовать как о функциональной важности консервативных блоков, так и о гибкости менее структурированных регионов.

проект Jalview

Программа MSA

Clustal Omega — это одна из самых популярных программ для множественного выравнивания последовательностей (MSA), разработанная для работы с белковыми и нуклеотидными последовательностями. Она пришла на смену более старым версиям (ClustalW, ClustalX) и предлагает улучшенную точность и скорость, особенно при работе с большими наборами данных.

Алгоритмы и методы

Clustal Omega использует комбинацию нескольких алгоритмов:
mBed – алгоритм кластеризации, который сокращает вычислительные затраты, представляя последовательности в виде точек в многомерном пространстве.
HHalign – метод, основанный на скрытых марковских моделях (HMM), для точного выравнивания отдалённо родственных последовательностей.
Прогрессивное выравнивание – последовательное добавление последовательностей в выравнивание на основе заранее построенного дерева.

Преимущества перед другими MSA-программами


1.Оптимизирован для работы с тысячами последовательностей (в отличие от ClustalW, который работает медленно на больших данных).
2.Лучше справляется с отдалённо родственными последовательностями благодаря HMM-подходу.
3.Может использоваться как для малых (<100 последовательностей), так и для очень больших (>100 000 последовательностей) наборов данных.

Где применяется?


Филогенетический анализ
Предсказание структуры белков
Сравнительная геномика
Обнаружение консервативных доменов