Вначале был поиск штаммов бактерии Vescimonas fastidiosa (taxonomy_id:2714353) AND (proteome_type:1), но он не увенчался успехом. Было принято решение искать референсный протеом у бактерий принадлежищих этому же роду ( Vescimonas ). Из 4 организмов вышедших по запросу, схожее количество последовательностей белков имеел только вид Vescimonas coprocola , поэтому и был выбран.
Попробуем вывести белки по ключевым словам: (proteome:UP000681035) AND (keyword:KW-0378) OR (keyword:KW-0560) OR (keyword:KW-0808) OR (keyword:KW-0436) OR (keyword:KW-0456) OR (keyword:KW-0413) OR (keyword:KW-1278)
Вывод: 589 записей.
Также были поисковые запросы по отдельности (proteome:UP000681035) AND
(keyword:KW-хххх):
Гидролазы: 179
Трансферазы: 226
Лигазы: 46
Лиазы: 29
Изомеразы: 36
Транслоказы: 17
Оксидоредуктазы: 56
Конвейер: zgrep '^CC' UP000681035.swiss.gz | grep 'CATALYTIC ACTIVITY'| wc -l
Вывод: 379
Всего в протеоме Vescimonas coprocola 2426 белков. Как правило ферменты составляют 30-40% от всех белков. Можно сделать вывод, что количество ферментов, которое было найдено путем поисковых запросов в UniProtKB более правдоподобное, но недостаточно достоверное, могу предположить, это связано с тем, что не все ферменты содержат ключевые слова. ( 589 фермента - 24% от всех белков, 379 - 15%)
Vescimonas coprocola – это грамотрицательная бактерия, выделенная из кишечника человека, где она существует в сложной микробной экосистеме. В такой среде, секретируемые белки важны для конкуренции за ресурсы с другими бактериями и взаимодействия с клетками хозяина. Именно поэтому было принято решение посчитать количество этих белков.
Конвейер: zgrep '^DE' UP000681035.swiss.gz | grep "Secreted"| wc -l