Мотивы
Для выполнения практической работы мною был выбран домен SH3 domain (AC - PF00018).
В выравнивании seed этого домена 55 последовательностей, среди них не было очень похожих. В Jalview я выбрала способ покраски Above identity threshold 100%, покрасилась одна колонка. Далее я постепенно снижала порог, чтобы найти самый консервативный мотив. На пороге 58% появился мотив с координатами 2-6. Информационное содержание мотива не очень высокое.
Рис. 1. Выравнивание seed
Паттерн мотива: [AVT][RLVEKIMQA][YFHNKLAS][DESNPAG][FLY]. Паттерн был найден во всех последовательностях.
По паттерну A-L-Y-D-Y в Prosite было получено 333 совпадения в 330 последовательностях. Найденные белки выполняют разные функции и принадлежат разным организмам (и бактериям, и эукариотам), поэтому, скорее всего, нашлись случайно. Выравнивание получилось ужасным, в том числе не выровнялись мотивы.
По выравниванию было построено филогенетическое дерево. Я выбрала одну из клад и построила выравнивание ее последовательностей. В этой кладе много консервативных мотивов, я выбрала FPANYVE (531-537). Я поискала этот мотив во всем выравнивании. Мотив встречается во всех последовательностях клады и не встречается больше нигде в выравнивании. Вывод: мотив специфичен для клады.
Из списка я выбрала белок с идентификатором P19954 (Ribosome-binding factor PSRP1). Он принадлежит Spinacia oleracea, функция - связывается с каналом мРНК малой субъединицы рибосомы хлоропласта и взаимодействует с нуклеотидами 16S рРНК в А-участке и Р-участке.
Номер итерации | Число находок выше порога (0,005) | Идентификатор худшей находки выше порога | E-value этой находки | Идентификатор лучшей находки ниже порога | E-value этой находки |
1 | 17 | P30334.1 | 0,004 | ||
2 | 28 | P9WMA8.1 | 0,003 | Q0C0T0.1 | 0.028 |
3 | 28 | P9WMA8.2 | 8,00E-13 | ||
4 | 28 | P9WMA8.3 | 8,00E-13 |
Табл. 1. Результаты 4 итераций PSI-BLAST
Список находок сошелся, значит, нашлось обособленное семейство.
С помощью Pfam скачала последовательности белков, содержащие домен PF00018 (Reviewed). Нашла 4 мотива, используя MEME - выдача. У всех мотивов низкий E-value, среди них был и найденный мною ранее мотив ALYDY, значит, он является важным для домена.
С помощью cbcalc на kodomo получила представленность сайта GATC в геноме бактерии Vescimonas Coprocola и по результатам построила диаграмму.
Рис. 2. Гистограмма представленности сайтов
Представленность сайта метилирования GATC не очень высокая, возможно, сайтом метилирования является какой-то другой сайт.