Для выполнения этого задания я выбрала одну из предложенных последовательностей - последовательность Козак. Она представляет собой окрестность ATG кодона - старта транскрипции в человеческом геноме.
letter | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
A | 2.10 | 2.03 | 2.24 | 2.26 | 2.97 | 2.65 | 2.02 | 3.74 | -4.08 | -4.08 | 2.17 | 2.48 | 1.73 |
T | 2.22 | 1.96 | 2.23 | 1.76 | 1.06 | 1.95 | 1.32 | -4.08 | 3.74 | -4.08 | 1.79 | 2.03 | 2.29 |
G | 2.81 | 3.29 | 2.72 | 2.84 | 3.08 | 2.47 | 2.86 | -3.72 | -3.72 | 4.11 | 3.38 | 2.51 | 3.16 |
C | 2.95 | 2.56 | 2.93 | 3.06 | 1.90 | 2.92 | 3.30 | -3.72 | -3.72 | -3.72 | 2.31 | 3.01 | 2.70 |
На основе данной матрицы, были посчитаны веса последовательностей и построена гистограмма. Нижний порог веса для определения правильности находки 37.
Гистограмма
Обучение | Положительный контроль | Отрицательный контроль | |
Сигнал (+) | 370 (74.0%) | 343 (68.6%) | 130 (26.0%) |
Сигнал (-) | 130 (26.0%) | 157 (31.4%) | 370 (74.0%) |
Буква | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
A | 7.37 | 6.60 | 8.97 | 9.33 | 24.92 | 15.96 | 6.49 | 67.56 | 0.00 | 0.00 | 8.16 | 12.74 | 4.20 |
T | 8.74 | 5.95 | 8.86 | 4.39 | 1.30 | 5.84 | 2.09 | 0.00 | 67.56 | 0.00 | 4.60 | 6.60 | 9.68 |
G | 13.91 | 26.10 | 12.28 | 14.47 | 19.91 | 8.64 | 14.74 | 0.00 | 0.00 | 74.13 | 29.54 | 9.15 | 22.14 |
C | 16.72 | 9.78 | 16.29 | 19.46 | 3.78 | 16.15 | 26.72 | 0.00 | 0.00 | 0.00 | 6.93 | 18.15 | 11.88 |
IC(j) | 46.74 | 48.43 | 46.40 | 47.65 | 49.90 | 46.59 | 50.04 | 67.56 | 67.56 | 74.13 | 49.23 | 46.64 | 47.89 |
С помощью сайта WebLOGO 3 был построен LOGO
Консервативный участок ATG (старт-кодон), при этом позиции, окружающие ATG, тоже довольно консервативны (в основном там гуанин и цитозин).