1. Гомологии белка в Swiss-Prot

Поиск производился для белка Ribose-phosphate pyrophosphokinase из практикума 7

Параметры поиска в системе BLAST

Database: UniProtKB/Swiss-Prot(swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 5000
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment

выдача программы

Всего находок: 175
Из них было выбрaно 5 для выравнивания. результат выравнивания

Белок-запрос (рибозо-фосфат пирофосфокиназа) высококонсервативен у Vescimonas, с минимальными вариациями у разных видов. Наиболее близкий гомолог — WP_337490733.1 (99.69% идентичность), что делает его идеальным кандидатом для дальнейших исследований (например, моделирования структуры или функционального анализа).

2. Гомологии зрелого вирусного белка, вырезанного из полипротеина в Swiss-Prot

Был выбран вирус: West Nile Virus
Данные полипептида вируса ID: POLG_WNV9 AC: Q9Q6P4
Зрелый белок в полипротеине: Serine protease/Helicase NS3 (1506-2124)
вырезанная последовательность белка из полипротеина
Команда которая использовалась: seqret 'sw:POLG_WNV9[1506:2124]' sirene.fasta

Параметры поиска в системе BLAST

Database: UniProtKB/Swiss-Prot(swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment
выдача программы
Всего находок 65, из них было выбрaно 5 для выравнивания.
результат выравнивания

3. Исследование зависимости E-value от объёма банка

Параметры поиска в системе BLAST

Database: UniProtKB/Swiss-Prot(swissprot)
Organism: Viruses (taxid:10239)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment

Всего находок 65

E-value изменился

Таблица 1. Сравнение характеристик BLAST вируса с начилием фильтра и без.

параметры Scientific Name Max Score Total Score Query Cover E-value Per. Ident Accession
Без фильтра на вирусы Tick-borne encephalitis virus (STRAIN SOFJIN) 546 546 97% 2е-173 48.18% 3412
С фильром на вирусы Tick-borne encephalitis virus (STRAIN SOFJIN) 546 546 97% 5е-172 48.18% 3412

Применение фильтра на вирусы незначительно изменило параметр E-value (с 2е-173 до 5е-172), Изменение E-value (хоть и остающееся крайне низким, но также указывает на высокую достоверность совпадения) может быть связано с уменьшением размера базы данных после фильтрации. Доля вирусных организмов: 2е-173\5е-172=0,04 или 4%.