ПредишенСледващото

  1. Определяне на трансфер РНК, която участва в присъединяването четвърти аминокиселинен остатък на нарастващото AAT_ECOLI протеинова верига.

Четвъртият верига E.coli аспартат остатък е аспарагин. че е лесно да се определи, като погледнете в последователността. Имайте предвид, че в този случай има две възможни решения: пропусне първото метионин, или да го игнорира, когато резултатът (известно е, че в началото на кодона AU (T) G # 150; едновременно кодон за метионин). Но тъй като ние не знаем за функционалното натоварване на баланса (ако това се разцепва посттранслационно, или се изисква да изпълнява други функции), тя решава да го вземе от него. В допълнение, всички предишни проучвания взеха предвид първия метионин.

В един от документите. съдържащ информация за AAT_ECOLI гена, кодиращ, ние откриваме, подходящ кодон. Това кодон е 5'-AAC -3 "(наричана по подразбиране полярност вериги по време на запис кодон 5 'към 3' края). Използване на стандартна таблица генетичен код. Научихме, че аспарагин може да се кодира не само в такава тройка, но ПЕЕ триплетния (T). С други думи, в изродени случай, както и в повечето други, това е третият Кодонът позиция.

Анализ на данните, можем да кажем, че, от една страна, "перфектен антикодона" тРНК, които биха могли да бъдат включени в присъединяването към веригата на аспарагин AAT_ECOLI в синтеза, # 150; GUU. Разбираемо е, че на първо място е единствено число. На второ място, хипотетично за аспарагин в Е. коли трябва да има две isoacceptor тРНК: Проверете кодон AAC чрез антикодона AAU GUU и локализиран чрез AUU. Въпреки това, ние знаем, че клетката не е всъщност вид тРНК се колкото се може повече семантични кодони и по-малко. За да разберете дали това е потвърдено в нашия случай, ние обжалва пред EMBL.

Използвайте командата UNIX Впиши съдържа в документ EMBL, съдържащ информация за пълния геном на E.coli. тези линии, които включват името и аспарагин са описани тРНК. Team (с пренасочване на стандартния изход към конвейер) за poika на аспарагин тРНК запис изглежда така:
Впиши кодон * аспарагин ecoli.embl |. повече

В резултат на това е установено, четири записа (вж. Последният ред на Таблица 1). Всички 4 случаи на мач намерени. Антикодонните вписва напълно (идентичен с "идеал"), но Кодонът призната тази тРНК # 150; AAY # 150; "Включва" две кодони: ААТ и AAC (като Y # 150; Описанието в пиримидин, ппрнмидини) .Това е в нашия случай, това тРНК е подходящ, но ААТ кодон тя намира вярно. По този начин, ние открихме, че Е. Coli аспарагин тРНК "един за всички случаи", вместо две # 150; по един за всяка възможна кодон, както можеше да се предположи.

Аспаргинът E.coli тРНК от същия тип, но е кодиран в генома на четири. Всички четири от тези гени са идентични. е установено, че чрез изграждането на съставното подреждане на последователностите извлича seqret команда от пълен геном. Затова изборът е направен на случаен принцип за по-нататъшно проучване.

Резултатите от проучванията са дадени в таблица 1.

Таблица 1: Определяне на резултатите от желания аспарагин-тРНК

Търсене аспарагин-тРНК: Теория и практика

аминокиселинен остатък в 4-та позиция протеин AAT_ECOLI

* Забележка 1: може да се настрои до 12, ситуацията остава същата (поне в нашия случай).

** Забележка 2: Дължината и координатите, дадени директно подравняване. същите резултати, както е посочено вече последователност (180 бд координира 11440-11620) с централна част, и които са подравнени posledovaelnosti проучен тРНК.

*** Бележка 3: Лесно е да се забележи, че общата дължина на всички малки области на добри трасета повече от два пъти дължината на последователността аспарагин-тРНК! Това означава, че резултатите са от случаен характер. В допълнение, този факт се отразява операция алгоритъм BLASTN на. Разбираемо е, че съвпадението на дължината на арматура от 11 нуклеотиди (взети от всяка част от нашите тРНК последователности, тъй като файла с индекс включва различни дължини котва 11) с един сегмент на подравняването на генома сено бацил продължи и в двете посоки, докато тя се откъсва и тези откъслечни резултати ни водят , Потвърждението може да служи като дължината на участъците от подравнявания: не по-кратък от 11 нуклеотида. Най-малкото, # 150; 12: това може да означава, че тези, подравняване, където само съответства на котвата, нито право, нито в ляво не е съвпадение, но не е показано. Тя не зависи от д-стойност: ангажиране с опцията -e и уточни д-стойност от 50, получили нов резултат. области, в които още повече, но сред тях все още няма дължина от 11 подравняване.

UNIX команди, които са били използвани в търсенето:

  1. Използването FASTA

Струваше ми се, не да се въведе по-удобни част параметри на част от # 150; След това, една програма да отговаря на въпроси за ценностите на различни параметри (дължината на котвата, броят на показаните резултати и подравнявания и др ..). И все пак само на етапа на писане на команди може да се види една от разликите от FASTA описано по-долу BLASTN и MEGABLAST защото последният се нуждае от индекс файла и FASTA правя без него, питам като база, за да търсят директно FASTA файл с генома.

  • С помощта на BLASTN

    blastall -р BLASTN -d BS -i tRNA.fasta -о blastn.txt

    Тук tRNA.fasta и blastn.txt # 150; Имената на файловете с желаната последователност и търсене на файлове резултати по съответния начин. и BS # 150; базовата името на файловете на индекса.

  • С MegaBLAST.

    megablast -d BS -i tRNA.fasta -о megablast.txt -D 2

    В сравнение с отбора за търсене BLASTN добавка само опция -D на. В различните си стойности (от 1 до 4) промяна на името на файла от резултатите от търсенето. Стойност 2 е избран, защото тя отговаря на изходния формат познатия (BLAST-формат). В действителност, в отсъствието на каквито и да било резултати не ми пука какъв формат да изберете. Въпреки това, всички възможности са били изпробвани ценности -D и се разглеждат като подходящи формати. За съжаление за това търсене не е намерено нищо, и пълно сравнение не е възможно.

    Освен това се опита със стойността на параметъра L -F # 150; филтриране на ниските райони сложност (ниска сложност), ние сме запознати с работата с BLASTP функция. Въпреки това, по същата причина (липса на "хитове"), никакви различия не могат да хванат.

  • С използване допира MegaBlast

    16 megablast -T -W 1 -N 11 -i tRNA.fasta -о dis16_1.fasta -D 2

    От сравнението на екипите, които работят на нормалната версия Megablast и допира MegaBlast, ясно е, че те се различават само по параметрите, сред които има специален за втория (по желание). Това -t и -N. Първият задава "допира дума шаблон" # 150; дължина модел (по-точно, един от трите модела на модела на различни дължини). Ясно е, че колкото по-малка тази дължина, толкова по-чувствителен търсенето. В друг случай, би било полезно, но идеята не се допира MegaBlast (и Mega_Blast като цяло) не съвпада. За тези програми не е важно чувствителност е важна скоростта. А намаляването на дължината на модела може да се увеличи броят на нежелания (без значение) открива. Въпреки това, в този случай, в зависимост от трите възможни стойности -T (16, 18, 21) изберете, резултатите са еднакво разочароващи. Това, за съжаление, не позволява помисли разлики търсят различни модели на практика.

    -N параметър определя типа на модел (кодиране, без кодиране, или и двете) От нашия кодиращата последователност не се избра втория вариант (стойност 1). Чрез използването на такъв модел MegaBlast търсят най-вече в средно положение на тройка, а не първите две, като в случай на кодиране, пренебрегват изродени третата позиция. В допълнение, за който не се допира MegaBlast версия изисква определена дължина на котва # 150; 11 или 12 нуклеотиди (-W параметри стойности). Избрахме първата стойност, а втората резултатите не се променят.

  • Дискусия. Сравнение на ефективността на различните изследователски програми на нуклеотидните последователности.

    Резултатите от изследването са разочароващи. Разбира се, първото нещо, което може да бъде предложена ролята на хомолог на аспарагинова тРНК един организъм # 150; аспарагинова тРНК друг организъм. Въпреки това, единствената значима находка (което е предвидено FASTA) # 150; е изолевцин тРНК. Останалата част от програмата или не намери нищо (опции MegaBlast), или да намерят съвсем незначителни малки площи последователности, разпръснати из генома (BLASTN). Погледнете всяка програма поотделно, а след това сравнение и избор на най-ефективна за търсене на не-кодираща последователност хомология.

    По този начин, FASTA. Тази програма се оказа най-чувствителни от всички. Само с негова помощ е било възможно да се намери конкретен смислен последователност. Въпреки че има неразбираем точка: вместо само да доведе подравняване, или най-малко на ген, който се съдържа в част намерено, това води също съседни участъци на последователности (като гени и всички неанотираното) установи повишаване резолюция. Обяснението на това явление е трудно да се намери, дори и въвеждане на механизъм FASTA работен. Ето защо, описание ще разгледа само на генната последователност, в която се намира точно подравняване. За съжаление, тази последователност кодира изолевцин тРНК. Веднага повдига няколко въпроса: дали хомолог на находка, а защо не би трябвало хомолози намерен # 150; аспарагин-тРНК сено бацил? Първият въпрос е трудно да се отговори: ние не знаем как да се провери некриптирани хомологични последователности, с изключение на изравняване.

    Ние считаме, с помощта на същите UNIX Впиши и seqret отбори в документа с пълния геном на В. subtiliis гени, кодиращи аспарагин-тРНК. Тези четири подобни последователности. Да се ​​приведе в съответствие с нашата тРНК (виж тук). Поредиците са доста близки, защо да не ги намерите FASTA? За да се гарантира нейната способност (или неспособност) да ги намерят, ще експеримент: да изготви "Търси мини-база данни" на всички последователности за аспарагин-тРНК В. subtiliis. изолевцин-тРНК ген и "дълги" (включващи части на съседните гени) намира FASTA. Нека погледнем на нашата последователност в него. неочаквани резултати # 150; Намерихме всички аспарагин тРНК и изолевцин, също! Следователно, FASTA може да се намери хомолози на малки не-кодиращи последователности. но в малки бази данни (други разлики, освен от размера на двете бази не е). За да се изследва тази хипотеза, търсене на В. subtiliis геномни последователности аспарагин-тРНК екстрахира от самата геном. Резултатът е много интересно: необходимата последователност не е открит, въпреки че със сигурност е в генома е. Най-добрият откритие # 150; Отново, изолевцин тРНК (може би наистина е хомолог на чревни пръчки аргинин-тРНК и сено). Единственото нещо, което може да се предложи да се обясни механизма на знаейки, FASTA # 150; това е една малка част от "кука котви" на десния диагонал, което се дължи на това не се взема предвид. Но защо тези котви могат да бъдат малки, не е много ясно.

    не BLASTN се справи със задачата перфектно. Намерени използва множество korotenkih подравнявания малко по-дълги от котвата. Ясно е, че такъв резултат не е стойност не нося. BLASTN за намиране некодиращи последователности, но хомоложна и идентична (или почти идентични) изисква. От нашия тРНК-аспарагин в генома на В. subtiliis не. За да сте сигурни, че взривът в общи линии не може да намери аспарагин-тРНК сено бацил, погледнете изравняването на посочения предишен. Сред областите, които не се припокриват аудио с дължина, равна или по-голяма от 11. Ясно е, че дължината на котвата 11 е свързан не могат.

    И най-вече котва MegaBlast. състояща се от 28 нуклеотида. Очевидно, в сравнение последователности (тРНК и геном) не е толкова широки припокриващи се области. Затова MegaBlast не намери нищо, и е съмнително, че той може да се намери. В крайна сметка, в тази ситуация той е подходящ дори и по-малко от BLASTN, тъй като тя е била първоначално предназначена за намиране на точни копия на последователности и дори подмяната най-примитивната матрица не е така.

    В допира MegaBlast версия на тази матрица е също там, но котвата е по-малък и малко по-различен за търсещи машини (се използват модели, което позволява не проверява всеки остатък за прилики, което го прави по-бързо). Фактът, че такъв MegaBlast не намери нищо, ние се правят заключения за годността му за малко не-кодиращи последователности хомоложни търсене. И тук е една и съща или много подобна последователност, той намира # 150; Той е бил претърсен последователности аспарагин-тРНК сено бацил в генома на последния. "Имаше" четири тРНК ген (е-стойност 3 х 10 # 150; 37), и, в допълнение, множество малки порции съвпадащи незначително. И ако прекарате същото търсене с "просто" Megablast, има четири гена, и само тях. По този начин, тази програма е по-малко чувствителен от допира MegaBlast, но резултатите от търсенето с помощта на последните съдържат някои ненужни при търсене на точни копия на "шум".

    Де да знам въз основа на резултатите от търсенето, за да се направят изводи за ефективността на подобни програми. Необходимостта да се използва, ако искаме да намерите хомолог некодиращите последователности? Вероятно по-подходящ за FASTA, въпреки че има проблем # 150; на проблема с "големи бази данни" (вж. по-горе). BLASTN, MegaBlast и допира MegaBlast не е подходящ. Тъй като нито едното, нито другото, нито третото не поема никаква хомология търсене на последователности. Ниска чувствителност, големи дължини котви (особено MegaBlast), липса на добро (или дори на всяко) на матрици замествания не позволяват да се открие променена в резултат на еволюционен процес последователност. FASTA има по-ниска котва и малко по-различен алгоритъм, който най-вероятно я дава възможност да се намери по-далечни последователности. Megablast и допира MegaBlast и всички са проектирани, за да търсят идентични posedovatelnostey; Подробности за механизма на опростени (28 анкерни нуклеотиди) или модифицирани ( "бинарни" моделите за търсене), специално за тази задача. Оказва се, че сред изследваните не е програма, идеален за търсене на хомолози на некодирана нуклеотидни последователности.

    Подкрепете проекта - споделете линка, благодаря!