Обзор Протеома

Поиск протеома, соответствующего геномной сборке


Индификатор геномной сборки Vescimonas fastidiosa в RefSeq: GCF_018326305.1
Ccылка на страницу из NCBI Datasets Genome: GCF_018326305.1
Индификатор последней версии сборки INSDC: GCA_018326305.1
Поисковый запрос по UniProt Proteomes: genome_assembly: GCA_018326305.1
Индификатор протеома: UP000681343
Статус протеома: Reference proteome

Поиск и скачивание референсного протеома

Вначале был поиск штаммов бактерии Vescimonas fastidiosa (taxonomy_id:2714353) AND (proteome_type:1), но он не увенчался успехом. Было принято решение искать референсный протеом у бактерий принадлежищих этому же роду ( Vescimonas ). Из 4 организмов вышедших по запросу, схожее количество последовательностей белков имеел только вид Vescimonas coprocola , поэтому и был выбран.


Полная команда для скачивания протеома: wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=%28%28proteome%3AUP000681035%29%29' -O UP000681035.swiss.gz

Оценка количества ферментов в протеоме

Попробуем вывести белки по ключевым словам: (proteome:UP000681035) AND (keyword:KW-0378) OR (keyword:KW-0560) OR (keyword:KW-0808) OR (keyword:KW-0436) OR (keyword:KW-0456) OR (keyword:KW-0413) OR (keyword:KW-1278)

Вывод: 589 записей.

Также были поисковые запросы по отдельности (proteome:UP000681035) AND (keyword:KW-хххх):
Гидролазы: 179
Трансферазы: 226
Лигазы: 46
Лиазы: 29
Изомеразы: 36
Транслоказы: 17
Оксидоредуктазы: 56

Конвейер: zgrep '^CC' UP000681035.swiss.gz | grep 'CATALYTIC ACTIVITY'| wc -l

Вывод: 379

Всего в протеоме Vescimonas coprocola 2426 белков. Как правило ферменты составляют 30-40% от всех белков. Можно сделать вывод, что количество ферментов, которое было найдено путем поисковых запросов в UniProtKB более правдоподобное, но недостаточно достоверное, могу предположить, это связано с тем, что не все ферменты содержат ключевые слова. ( 589 фермента - 24% от всех белков, 379 - 15%)

Анализ протеома консольными средствами

Vescimonas coprocola – это грамотрицательная бактерия, выделенная из кишечника человека, где она существует в сложной микробной экосистеме. В такой среде, секретируемые белки важны для конкуренции за ресурсы с другими бактериями и взаимодействия с клетками хозяина. Именно поэтому было принято решение посчитать количество этих белков.

Конвейер: zgrep '^DE' UP000681035.swiss.gz | grep "Secreted"| wc -l


Поробуем найти секретируемые белки по названию-функции.
Вывод: 3 белка.
Если на весь протеом всего 3 секретируемых белка, можно предположить, что они высокоспецифичны.