δ-субъединица АТФ-синтазы курицы (Gallus gallus)
Идентификатор белка: XP_015155437.2
последовательность в формате fasta
Идентификатор нуклеотидной записи, содержащей ген, кодирующий данный белок: NC_052559
последовательность гена с окрестностью(координаты гена 363-2774)
Так как курица относится к вторичноротым, для бласта я использовал группу Araneae(пауков), которые относятся к первичноротым, чтобы проверить, насколько консервативен ген δ-субъединицы АТФ-синтазы. В программу я подавал файл последовательности гена с указанием координатов гена(363-2774). Для нахождения похожих нуклеотидных последовательностей я использовал алгоритм blastn(megablast не подходит, так как ищет очень похожие последовательности, а организмы, которые взяты здесь, очень далекие). Длина слова была стандартная(11). Для задания использовал базу данных refseq_genomes. Среди четырех референсных геномов не нашлось схожих последовательностей. Это говорит о том, что этот ген не сильно консервативен.
Для бласта по аминокислотной последовательности δ-субъединицы АТФ-синтазы я использовал ту же группу и ту же базу данных. Для поиска был использован метод tblastn(так как этот алгоритм нужен для сравнения белка-запроса с транслированными последовательностями из базы данных). Была использована стандартная длина слова(5).
Выдача tblastn
Было найдено четыре находки, процент покрытия 22-34%, процент идентичности 67-75%. E-value небольшой, поэтому можно сказать, что белок является высококонсервативным.
В этом задании я попытался отыскать гомологи 16S рРНК и 23S рРНК E. coli у курицы c помощью blastn(так как он подходит для поиска похожих некодирующих белки нуклеотидных последовательностей)
Команды, которые я использовал:
wget https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/016/699/485/GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b/GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b_genomic.fna.gz
gunzip GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b_genomic.fna.gz
makeblastdb -in GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b_genomic.fna -dbtype nucl
blastn -task blastn -query 16S_rRNA.fna -db GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b_genomic.fna -out res16_2 -outfmt 7
blastn -task blastn -query 23S_rRNA.fna -db GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b_genomic.fna -out res23_2 -outfmt 7
Выдача для 16S РНК
Выдача для 23S РНК
Для 16S РНК найдено 366 находок, гомологом для нее является 18S РНК. Я насчитал 19 гомологов в нуклеотидной записи NC_052547.1, 4 гомолога в нуклеотидной записи NC_052535.1 и 1 гомолог в нуклеотидной записи NC_052534.1. Считал я следующим образом. Сначала убрал все находки с большим e-value, а потом смотрел на координаты участков запроса и на координаты находок, чтобы они не пересекались.
Для 23S РНК найдено 96 находок, гомологом для нее является 26S РНК. Я насчитал 19 гомологов в нуклеотидной записи NC_052547.1, а также по одному гомологу в каждой из следующих нуклеотидных записях: NC_052544.1, NC_052533.1, NC_052538.1, NC_052572.1, а также два гомолога в нуклеотидной записи NC_052533.1
рРНК необходимы для работы рибосом. 16S рРНК необходима для связывания с мРНК во время трансляции (по последовательности Шайно-Дельгарно). 23S рРНК катализирует реакцию роста пептидной цепи в ходе трансляции.