Практикум 8

Для выполнения этого задания я выбрала одну из предложенных последовательностей - последовательность Козак. Она представляет собой окрестность ATG кодона - старта транскрипции в человеческом геноме.

Позиционная весовая матрица с псевдоотсчетами (PWM)

letter 1 2 3 4 5 6 7 8 9 10 11 12 13
A 2.10 2.03 2.24 2.26 2.97 2.65 2.02 3.74 -4.08 -4.08 2.17 2.48 1.73
T 2.22 1.96 2.23 1.76 1.06 1.95 1.32 -4.08 3.74 -4.08 1.79 2.03 2.29
G 2.81 3.29 2.72 2.84 3.08 2.47 2.86 -3.72 -3.72 4.11 3.38 2.51 3.16
C 2.95 2.56 2.93 3.06 1.90 2.92 3.30 -3.72 -3.72 -3.72 2.31 3.01 2.70

На основе данной матрицы, были посчитаны веса последовательностей и построена гистограмма. Нижний порог веса для определения правильности находки 37.

Гистограмма

Результаты находок

Обучение Положительный контроль Отрицательный контроль
Сигнал (+) 370 (74.0%) 343 (68.6%) 130 (26.0%)
Сигнал (-) 130 (26.0%) 157 (31.4%) 370 (74.0%)

Матрица информационного содержания

Буква 1 2 3 4 5 6 7 8 9 10 11 12 13
A 7.37 6.60 8.97 9.33 24.92 15.96 6.49 67.56 0.00 0.00 8.16 12.74 4.20
T 8.74 5.95 8.86 4.39 1.30 5.84 2.09 0.00 67.56 0.00 4.60 6.60 9.68
G 13.91 26.10 12.28 14.47 19.91 8.64 14.74 0.00 0.00 74.13 29.54 9.15 22.14
C 16.72 9.78 16.29 19.46 3.78 16.15 26.72 0.00 0.00 0.00 6.93 18.15 11.88
IC(j) 46.74 48.43 46.40 47.65 49.90 46.59 50.04 67.56 67.56 74.13 49.23 46.64 47.89

С помощью сайта WebLOGO 3 был построен LOGO

Консервативный участок ATG (старт-кодон), при этом позиции, окружающие ATG, тоже довольно консервативны (в основном там гуанин и цитозин).