Для поиска гомологов сответствующего белка в окно поиска программы BLAST был введён AC этого белка (Q7MBB4), затем в качестве базы данных для поиска был выбран Swiss-Prot, затем значение параметра "Max target sequences" было изменено на 5000, остальные параметры оставлены без изменений. Всего было найдено 1019 результатов.
Ссылка на текстовую выдачу программы.
После этого было отобрано 7 первых результатов выдачи BLAST (исходный белок и 6 следующих за ним), скачано в fasta-формате и выполено множественное выравнивание этих белков с использованием программы muscle.
Ссылка на проект Jalview.
Выравнивание наглядно показывает, что все выбранные белки являются гомологичными: все семь аминокислотных последовательностей содержат много высококонсервативных участков.
Для выполнения этого задания был выбран белок Capsid polyprotein вируса Pseudomonas phage PAJU2.
ID: CAPSD_BPPAJ
AC: P85500
Название вируса: Pseudomonas phage PAJU2
Данный полипротеин обладает автокаталитической протеазной активностью, и после созревания разрезается, образуя один белок капсида этого вируса (координаты зрелого белка: 349-667, название белка: "Capsid protein").
Ссылка на фрагмент полипротеина в формате fasta.
Далее был выполнен поиск гомологов этого фрагмента с помощью программы BLAST, для этого в окно поиска был загружен файл, ссылка на который приведена выше, остальные параметры использовались так же, как и в прошлом задании. Всего было найдено 3 последовательности, при этом одна из них - последовательность исходного полипротеина. Изменение при последующих запросах значений поля "Word size" не увеличило количество найденных последовательностей.
Ссылка на текстовую выдачу.
После этого было проведено множественное выравнивание фрагмента полипротеина и двух остальных найденных последовательностей с применением программы muscle. Исходя из его результатов, можно сделать вывод, что два других найденных белка являются гомологичными, но исходный фрагмент полипептида имеет мало общих с этими белками консервативных участков, что может означать два варианта: либо исходный фрагмент не гомологичен двум найденным, либо организмы, из которых были выделены эти белки, давно имели одного общего предка и накопили много различий в аминокислотных последовательностях белков. Так как вирусы, которым принадлежат найденные белки и исходный фрагмент, относятся к одному классу Caudoviricetes, можно предположить большую вероятность второго варианта, нежели первого.
Ссылка на проект Jalview.
Для выполнения задания был выполнен поиск в BLAST аналогично предыдущему, но с ограничением найденных белков среди вирусов. Список находок не изменился, изменилось лишь значение E-value для двух белков. В обоих этих поисках изменяется только размер базы данных и значение E-value. Можно получить зависимость n1/n2 = E-value1/E-value2. Выбирая любую из этих двух находок в разных вариантах поиска (например с AC: O64210), получим долю вирусных белков в Swiss-Prot: n2/n1 = 2*10-10/5*10-9 = 0,04 или 4%.
Ссылка на текстовую выдачу BLAST.