Составление списка гомологичных белков, включающих паралоги

Были выбраны 7 полных протеомов бактерий отдела Pseudomonadota:
ACICJ.fasta
AROAE.fasta
BRUSU.fasta
BURMA.fasta
PASMU.fasta
POLAQ.fasta
YERPE.fasta.
Далее они были обьединены командой:

cat ACICJ.fasta AROAE.fasta BRUSU.fasta BURMA.fasta PASMU.fasta POLAQ.fasta YERPE.fasta > file.fasta

На основе выбранных протеомов была создана локальная база данных:

makeblastdb -in file.fasta -dbtype prot

Был проведён поиск blastp c e-value 0.0001:

blastp -task blastp -query CLPX.fasta -db file.fasta -out blast.out -evalue 0.0001

выдача

Реконструкция и визуализация

На рисунке 1 представлено дерево, отражающее верную филогению выбранных бактерий.

Рисунок 1. Дерево, отражающее верную филогению выбранных бактерий.

В нем выделяются две основные ветви:

Ветвь 1: {BRUSU, ACICJ, YERPE, PASMU} (группа, где Y. pestis и P. multocida - ближайшие родственники).

Ветвь 2: {AROAE, POLAQ, BURMA} (группа, где A. aromaticum и P. naphthalenivorans ближе друг к другу, чем к B. mallei).

Топология внутри каждой из трех белковых групп (HslU, ClpX, FtsH) полностью совпадает с топологией верного филогенетического дерева организмов (Рис. 1), что подтверждает ортологичность данных белков далее

Все находки были записаны в fasta формате и выровнены. Реконструкция филогенетического древа выполнена программой FastME на основе матрицы попарных расстояний, рассчитанных по модели LG в формате Newick

Рисунок 2. Филогенетическое дерево, построенное по выравниванию белков программой fastme по модели LG6, с помощью iTOL. Разными цветами отмечены разные ортологические группы

Дерево успешно разделило белки на три четкие семьи (HslU, ClpX, FtsH). Внутри каждой семьи (цветовые блоки) топология в целом соответствует верному дереву. Например, внутри зеленого блока (HslU) PASMU и YERPE сидят рядом, как и в эталоне. Но есть и различия с рисунком 1, где представленна верная филогения, на рисунке 2 присутствуют паралоги (например, два белка у YERPE: один в красной зоне FtsH, другой — отдельная ветвь).

В ходе анализа были выделены 3 группы белков (зеленый — HslU, синий — ClpX, красный — FtsH) на филогенетическом дереве были выявлены как ортологичные, так и паралогичные связи. Примерами ортологичных пар, чья топология совпадает с видовым деревом, являются ClpX у Aromatoleum aromaticum и Burkholderia mallei; HslU у Pasteurella multocida и Yersinia pestis; а также белки A5FVF9 (Acidiphilium cryptum) и A0A0H3GCZ6 (Brucella suis). Примерами паралогов (продуктов генного дублирования в рамках одного генома) могут быть ClpX и HslU у Aromatoleum aromaticum; A0A5P8YB42 и ClpX у Yersinia pestis; A0A0H2WJ72 и HslU у Burkholderia mallei

Рисунок 3. Изображение филогенетического дерева , построенного по выравниванию белков программой fastme по модели LG6, с помощью iTOL. Группы, где более трёх белков собраны в треугольники.

Cемейство ClpX само по себе не расщепляет белки. АТФаза находит белки, которые неправильно свернулись или больше не нужны, денатурирует и заталкивает внутрь протеазы ClpP.

Когда бактерия попадает в условия высокой температуры (например, когда у человека лихорадка при инфекции), HslU активируется, чтобы спасать клетку от дефектных белков, возникших из-за жара.

FtsH важен для выживания таких патогенов, как Yersinia pestis (чумная палочка) или Brucella. Если его «выключить», бактерия потеряет способность быстро адаптироваться к среде внутри хозяина и погибнет.