15 Aralık 2015 Salı

Ders 10: Primer Tasarlama - Biyoinformatik-Lab


Currently Monsanto owns the patent on glyphosate, which is commonly known as Roundup®. It is the most popular herbicide used today because it kills a broad spectrum of weeds and is easily broken down into non-toxic compounds. The catch is that Monsanto also owns the patent on the gene that confers resistance to glyphosate, which they have transformed into several crops such as corn and soybean to make them “Round-up Ready”, or resistant to glyphosate. Many researchers are trying to find novel genes that will also confer resistance to glyphosate for both evolutionary and economic reasons. Recently, a Chinese group found a bacterium, Pseudomonas putida strain 4G-1, which is naturally resistant to glyphosate[1]. They have cloned the novel gene, aroA, that is significantly different in sequence from the previous AroA gene, and are hopeful that it will be another source of glyphosate resistance.

The AroA gene encodes the enzyme 3-phosphoshikimate 1-carboxyvinyltransferase, which plays a key role in the biosynthesis of aromatic amino acids. Glyphosate works by disrupting this enzyme and thus the biosynthesis of aromatic amino acids. Resistance is found by mutating the AroA gene such that glyphosate cannot bind to the resulting protein.

You have just been hired to select strains of Pseudomonas putida with the new aroA gene to provide a new glyphosate resistant cultivar. Your first challenge will be to create primer pairs (forward and reverse) that will amplify a portion of the aroA gene that contains the underlined region (see sequence below).

1. Given the sequence on the following page, choose forward and reverse primers that will amplify the underlined portion of the aroA gene.

        a. Underline the primer sequence on the following page. Then write out your primers below and indicate the 5’ and 3’ ends. Remember that the 3’ or reverse primer is the reverse complement of the template (think about which direction DNA extends).

         b. What is the size of your target DNA? (Note: each line contains 70 nucleotide bases)
 

>gi|51587624|emb|AJ812018.1| Pseudomonas putida aroA gene for 3-phosphoshikimate 1-carboxyvinyltransferase
5’-GATCATAAAACATGCTTGTATAAAGGATGCTGCCATGTTCCGTGAACTGGAAGCGAACAATCTTGCGGTA
TATCAGAAAAAGCCAAAGCTGATTGCAGTGCTTCTTCAGCGTAATGCTCAGTTAAAAGCGAAGGTTGTTC
AGGAGGATGAGTTCGAAAAGTCGGTAAGGCGTTTGTTGAACTTTGGTCATACATTGGGGCATGCCATCGA
AAATGAATATGCGTTGATGCATGGCCATGCGGTTGCTATAGGAATGACATACGCGTGTCATATTTCTGAG
CAATTGTCTGGATTCAAACAAACAAATCGCGTGGTAGAAGTGTTGGAACAATATGGGTTACCGACTTATA
TGGCATTCGATAGGGAAAAGGCTTTTAATCTGTTGAAAATGGACAAGAAGCGTGAAAAAAAGGAAATGAA
CTATGTGTTGCTGGAAAAAGTAGGGAAGGGAGTGGTGAAGAGTATTCCACTGGTTCAATTAGAAAAAATC
ATTCAAGCATTACCAAAGTGAAAGTAACAATACAGCCCGGAGATCTGACTGGAATTATCCAGTCACCCGC
TTCAAAAAGTTCGATGCAGCGAGCTTGTGCTGCTGCACTGGTTGCAAAAGGAATAAGTGAGATCATTAAT
CCCGGTCATAGCAATGATGATAAAGCTGCCAGGGATATTGTAAGCCGGCTTGGTGCCAGGCTTGAAGATC
AGCCTGATGGTTCTTTGCAGATAACAAGTGAAGGCGTAAAACCTGTCGCTCCTTTTATTGACTGCGGTGA
ATCTGGTTTAAGTATCCGGATGTTTACTCCGATTGTTGCGTTGAGTAAAGAAGAGGTGACGATCAAAGGA
TCTGGAAGCCTTGTTACAAGACCAATGGATTTCTTTGATGAAATTCTTCCGCATCTCGGTGTAAAAGTTA
AATCTAACCAGGGTAAATTGCCTCTCGTTATACAGGGGCCATTGAAACCAGCAGACGTTACGGTTGATGG
GTCCTTAAGCTCTCAGTTCCTTACAGGTTTGTTGCTTGCATATGCGGCCGCAGATGCAAGCGATGTTGCG
ATAAAAGTAACGAATCTCAAAAGCCGTCCGTATATCGATCTTACACTGGATGTGATGAAGCGGTTTGGTT
TGAAGACTCCCGAGAATCGAAACTATGAAGAGTTTTATTTCAAAGCCGGGAATGTATATGATGAAACGAA
AATGCAACGATACACCGTAGAAGGCGACTGGAGCGGTGGTGCTTTTTTACTGGTAGCGGGGGCTATTGCC
GGGCCGATCACGGTAAGAGGTTTGGATATAGCTTCGACGCAGGCTGATAAAGCGATCGTTCAGGCTTTGA
TGAGTGCGAACGCAGGTATTGCGATTGATGCAAAAGAGATCAAACTTCATCCTGCTGATCTCAATGCATT
TGAATTTGATGCTACTGATTGCCCGGATCTTTTTCCGCCATTGGTTGCTTTGGCGTCTTATTGCAAAGGA
GAAACAAAGATCAAAGGCGTAAGCAGGCTGGCGCATAAAGAAAGTGACAGAGGATTGACGCTGCAGGACG
AGTTCGGGAAAATGGGTGTTGAAATCCACCTTGAGGGAGATCTGATGCGCGTGATCGGAGGGAAAGGCGT
AAAAGGAGCTGAAGTTAGTTCAAGGCACGATCATCGCATTGCGATGGCTTGCGCGGTGGCTGCTTTAAAA
GCTGTGGGTGAAACAACCATCGAACATGCAGAAGCGGTGAATAAATCCTACCCGGATTTTTACAGCGATC
TTAAACAACTTGGCGGTGTTGTATCTTTAAACCATCAATTTAATTTCTCATGAATAGCTTCGGCCGCATC
TTCAGGGTGCATATTTTTGGCGAATCACATGGTGAATCAGTAGGCATCGTTATTGATGGTTGTCCTGCTG
GTCTGTCATTGTCCGAAGAAGATC-3’
 
2. For each primer you designed, use the website and the guidelines on the instruction sheet to determine whether they meet the basic primer requirements. Record the Tm, length, molecular weight, and possibility of secondary structures or primer dimers and use the statistics to qualify your decision to use or not use the primers for a PCR reaction.


3. To determine the specificity of your primer pair to the aroA sequence, run a nucleotide BLAST by following the directions on the instruction page.

a. What does the E-value indicate? What is another way to determine homology between two sequences?
           

b. Write down the organism and E-value score from the two highest matches
                 for each primer sequence. Did you get back the sequence you put in?
         


c. How many nucleotides aligned between your sequences and the first
                match for each?




[1] Sun, Y. et al. 2005. Novel AroA with high tolerance to glyphosate, encoded by a gene of Pseudomonas putida 4G-1 isolated from an extremely polluted environment in China. Applied and Environmental Microbiology. 71 (8): 4771-4776

17 Kasım 2015 Salı

Ders 6: Multiple Sequence Alignment Uygulamaları - Biyoinformatik-Lab

Multiple Sequence Alignment Homepage: http://www.ebi.ac.uk/Tools/msa

Linkteki çalışmayı tamamlayınız.
https://docs.google.com/forms/d/1lXRibDoizmV05k0M9UVNOMzoUFKdIbxQ0IYyiZXz_1M/viewform?usp=send_form

Protein Dizileri
>gi|6288724|gb|AAF06717.1|AF078906_1 interleukin 7 receptor alpha chain [Mus musculus]
MMALGRAFAIVFCLIQAVSGESGNAQDGDLEDADADDHSFWCHSQLEVDGSQHLLTCAFN
DSDINTANLEFQICGALLRVKCLTLNKLQDIYFIKTSEFLLIGSSNICVKLGQKNLTCKN
MAINTIVKAEAPSDLKVVYRKEANDFLVTFNAPHLKKKYLKKVKHDVAYRPARGESNWTH
VSLFHTRTTIPQRKLRPKAMYEIKVRSIPHNDYFKGFWSEWSPSSTFETPEPKNQGGWDP
VLPSVTILSLFSVFLLVILAHVLWKKRIKPVVWPSLPDHKKTLEQLCKKPKTSLNVSFNP
ESFLDCQIHEVKGVEARDEVESFLPNDLPAQPEELETQGHRAAVHSANRSPETSVSPPET
VRRESPLRCLARNLSTCNAPPLLSSRSPDYRDGDRNRPPVYQDLLPNSGNTNVPVPVPQP
LPFQSGILIPVSQRQPISTSSVLNQEEAYVTMSSFYQNK
>gi|4504679|ref|NP_002176.1| interleukin 7 receptor [Homo sapiens]
MTILGTTFGMVFSLLQVVSGESGYAQNGDLEDAELDDYSFSCYSQLEVNGSQHSLTCAFE
DPDVNTTNLEFEICGALVEVKCLNFRKLQEIYFIETKKFLLIGKSNICVKVGEKSLTCKK
IDLTTIVKPEAPFDLSVIYREGANDFVVTFNTSHLQKKYVKVLMHDVAYRQEKDENKWTH
VNLSSTKLTLLQRKLQPAAMYEIKVRSIPDHYFKGFWSEWSPSYYFRTPEINNSSGEMDP
ILLTISILSFFSVALLVILACVLWKKRIKPIVWPSLPDHKKTLEHLCKKPRKNLNVSFNP
ESFLDCQIHRVDDIQARDEVEGFLQDTFPQQLEESEKQRLGGDVQSPNCPSEDVVVTPES
FGRDSSLTCLAGNVSACDAPILSSSRSLDCRESGKNGPHVYQDLLLSLGTTNSTLPPPFS
LQSGILTLNPVAQGQPILTSLGSNQEEAYVTMSSFYQNQ
>gi|11230786|ref|NP_068687.1| interleukin 21 receptor [Mus musculus]
MPRGPVAALLLLILHGAWSCLDLTCYTDYLWTITCVLETRSPNPSILSLTWQDEYEELQD
QETFCSLHRSGHNTTHIWYTCHMRLSQFLSDEVFIVNVTDQSGNNSQECGSFVLAESIKP
APPLNVTVAFSGRYDISWDSAYDEPSNYVLRGKLQYELQYRNLRDPYAVRPVTKLISVDS
RNVSLLPEEFHKDSSYQLQVRAAPQPGTSFRGTWSEWSDPVIFQTQAGEPEAGWDPHMLL
LLAVLIIVLVFMGLKIHLPWRLWKKIWAPVPTPESFFQPLYREHSGNFKKWVNTPFTASS
IELVPQSSTTTSALHLSLYPAKEKKFPGLPGLEEQLECDGMSEPGHWCIIPLAAGQAVSA
YSEERDRPYGLVSIDTVTVGDAEGLCVWPCSCEDDGYPAMNLDAGRESGPNSEDLLLVTD
PAFLSCGCVSGSGLRLGGSPGSLLDRLRLSFAKEGDWTADPTWRTGSPGGGSESEAGSPP
GLDMDTFDSGFAGSDCGSPVETDEGPPRSYLRQWVVRTPPPVDSGAQSS
>gi|7212777|gb|AAB20029.2| erythropoietin receptor; EPOR [Mus sp.]
MDKLRVPLWPRVGPLCLLLAGAAWAPSPSLPDPKFESKAALLASRGSEELLCFTQRLEDL
VCFWEEAASSGMDFNYSFSYQLEGESRKSCSLHQAPTVRGSVRFWCSLPTADTSSFVPLE
LQVTEASGSPRYHRIIHINEVVLLDAPAGLLARRAEEGSHVVLRWLPPPGAPMTTHIRYE
VDVSAGNRAGGTQRVEVLEGRTECVLSNLRGGTRYTFAVRARMAEPSFSGFWSAWSEPAS
LLTASDLDPLILTLSLILVLISLLLTVLALLSHRRTLQQKIWPGIPSPESDFEGLFTTHK
GNFQLWLLQRDGCLWWSPGSSFPEDPPAHLEVLSEPRWAVTQAGDPGADDEGPLLEPVGS
EHAQDTYLVLDKWLLPRTPCSENLSGPGGSVDPVTMDEASETSSCPSDLASKPRPEGTSP
SSFEYTILDPSSQLLCPRALPPELPPTPPHLKYLYLVVSDSGISTDYSSGGSQGVHGDSS
DGPYSHPYENSLVPDSEPLHPGYVACS
>gi|5853248|gb|AAD54385.1|AF178684_1 class I cytokine receptor [Homo sapiens]
MPAGRRGPAAQSARRPPPLLPLLLLLCVLGAPRAGSGAHTAVISPQDPTLLIGSSLLATC
SVHGDPPGATAEGLYWTLNGRRLPPELSRVLNASTLALALANLNGSRQRSGDNLVCHARD
GSILAGSCLYVGLPPEKPVNISCWSKNMKDLTCRWTPGAHGETFLHTNYSLKYKLRWYGQ
DNTCEEYHTVGPHSCHIPKDLALFTPYEIWVEATNRLGSARSDVLTLDILDVVTTDPPPE
VHVSRVGGLEDQLSVRWVSPPALKDFLFQAKYQIRYRVEDSVDWKVVDDVSNQTSCRLAG
LKPGTVYFVQVRCNPFGIYGSKKAGIWSEWSHPTAASTPRSERPGPGGGACEPRGGEPSS
GPVRRELKQFLGWLKKHAYCSNLSFRLYDQWRAWMQKSHKTRNQDEGILPSGRRGTARGP

DNA Dizileri
http://www.foodmicrobe.com/Fig1.txt

Ekstra Çalışma
http://www.molgen.ua.ac.be/bioinfo/course/exercises_alignment-example.html


18 Ekim 2015 Pazar

Ders 4: NCBI, Blast - Biyoinformatik-Lab




https://docs.google.com/forms/d/1WUdzdcE966K-IHCnuwy-Oy4uTsOXx6UW1-KvJctyxlg/viewform?usp=send_form

Ders 3: Protein Veribankaları (UniProt) - Biyoinformatik-Lab

UniProt


You will learn about:
  • Querying UniProtKB using both text and sequence searches
  • Mining a UniProtKB/SwissProt entry
  • Understanding the difference between UniProtKB/SwissProt and UniProtKB/TrEMBL entries
  • Creating a multiple sequence alignment

    Contents:
     EXERCISE 1: Searching UniProt using a Text Search 
    EXERCISE 2: SwissProt General Information
    EXERCISE 3: SwissProt  Sequence
    EXERCISE 4: SwissProt General Annotation
page1image6120

13 Ekim 2015 Salı

Ders 2: NCBI Genel Bakış - Biyoinformatik-Lab



Aşağıdaki ön hazırlıkları yapınız.

Linkteki çalışmayı yapınız.


Ders 1: PubMed Sorgular - Biyoinformatik-Lab


Aşağıdaki ön hazırlıkları yapınız.


 Linkteki çalışmayı yapınız.

https://docs.google.com/forms/d/1hRcqNfi5eC2G99W_ls1n4YBTKo1RLsFJOcXN1HOxmOo/viewform?usp=send_form

11 Ekim 2015 Pazar

Ders 0: Biyoinformatik Nedir - Biyoinformatik-Lab


Biyoenformatik

Vikipedi, özgür ansiklopedi
Genome viewer screenshot small.png
Biyoenformatikbiyolojinin çeşitli dalları, ancak özellikle moleküler biyoloji ile bilgisayar teknolojisini ve bununla ilişkili veri işleme aygıtlarını bünyesinde barındıran bilimsel disiplin. Bir diğer tanımla, karmaşık biyolojik verilerin derlenmesi ve analiz edilmesi bilimidir.

Ortaya çıkışı

1960'larda başlayan bilgisayar uygulamalarının biyolojide kullanılması girişimi, her iki alandaki teknolojik gelişime paralel olarak hızla ilerlemiş ve böylelikle ortaya çıkan Biyoenformatik dalı bugün en popüler akademik ve endüstriyel sektörlerin başına geçmiştir.
Bilgisayarların moleküler biyolojide kullanımı üç boyutlu moleküler yapıların grafik temsili, moleküler dizilimler ve üç boyutlu moleküler yapı veritabanları oluşturulması ile başlamıştır. Kısa sürede çok yüksek miktarlarda veri üreten, endüstri düzeyinde gen ekspresyonu, protein-protein ilişkisi, biyolojik olarak aktif molekül araştırmaları, bakteri, maya, hayvan ve insan genom projeleri gibi biyolojik deneylerin doğurduğu talep sonucunda, bu alandaki bilişim uygulamaları neredeyse takip edilemez bir hızda gelişmiştir. Biyoenformatik dalının ayrı bir (disiplinlerarası) bilim dalı olarak tanınması da son 10 yılda gerçekleşmiştir.

Çalışma alanları

Biyoenformatik genel olarak biyolojik problemlerin çözümünde bilişim teknolojilerinin kullanılması olarak tanımlanabilir. En dar tanımı ile genomik sekansları destekleyen biyolojik veritabanlarının oluşturulması ve işletilmesi, en geniş tanımı ile de mevcut tüm bilgisayar uygulamalarının biyolojik problemlerin çözümünde kullanılması olarak anlaşılır.
Biyoinformatik modern biyolojinin iki temel bilgi akışını kapsar:
1.Genetik bilgi akışı: Bir organizmanın DNAsı incelenerek özelliklerinin belirlenmesinden, incelenen bu organizma türünün oluşturduğu toplulukların karakteristik özelliklerine kadar olan bilgi akışı. Elde edilen DNA bilgisi tekrar genetik havuzun tanımlanması için kullanılır.
2.Deneysel bilgi akışı: Biyolojik olaylar gözlenerek elde edilen enformasyon, açıklayıcı matematiksel modeller ile tarif edilir, daha sonra bu modellerin doğruluğu yeni deneyler ile test edilir.
Son yirmi yılda temel biyolojik araştırmaların klinik tıp uygulamaları ve klinik tıp bilgi sistemleri üzerindeki etkisi daha da belirleyici olmuş ve bugün yeni kuşak epidemiyolojik, tanı, teşhiş ve tedavi amaçlı modüllerin ortaya çıkmasına yol açmıştır. Biyoenformatik çalışmalar temel bilimsel araştırmalara yönelik görünmekle beraber önümüzdeki on yıl içinde klinik bilişim için vazgeçilmez olacaktır. Örneğin hastaların tıbbi kayıtlarında giderek artan bir sıklıkla DNA dizilim bilgileri yer almaya başlayacaktır. Bugün ABD'de bazı sigorta şirketleri, risk primleri belirlenirken mevcut genetik tarama test sonuçlarını talep edebilmektedir.Biyoenformatik araştırmalar için geliştirilen algoritmaların çok yakında klinik bilişim sistemlerine entegre olması beklenmektedir.
Bu alanı kısaca tanımlamanın bir yolu da, biyoinformatik araçların kullanıldığı genel araştırma konularını özetlemek olabilir:

Metodolojik çalışmalar

  1. DNA sıra ve dizilimi araştırmaları
  2. Protein sıra ve dizilimi araştırmaları
  3. Makromoleküler yapıların (DNA, RNA, protein) üç boyutlu yapı araştırmaları
  4. Küçük moleküllerin (potansiyel terapötik maddeler, aktif peptidler, ribozimler vs.) ligandlarıyla etkileşiminin araştırılması
  5. Heterojen biyolojik veritabanlarının entegrasyonu
  6. Biyolojik enformasyonun paylaşımının kolaylaştırılması
  7. Bilgisayar ile otomize edilmiş veri analizi ve iletimi
  8. Etkileşimde bulunan gen ürünleri için bilgi ağları oluşturulması
  9. Kimyasal reaksiyonlardan hücrelerarası iletişime kadar pek çok biyolojik faaliyet sürecinin matematiksel modellenmesi ve simülasyonu
  10. Büyük çaplı biyolojik deneylerden (GENOM projeleri gibi) çıkan sonuçların analizi

Biyolojik çalışmalar

  1. Proteinlerin yapılarının ve fonksiyonlarının belirlenmesi
  2. Herhangi bir biyolojik fonksiyonu arttıran ya da engelleyen küçük moleküllerin tasarlanması
  3. Karmaşık genetik fonksiyon ya da regülasyon faaliyetlerinin tanımlanması
  4. Tıbbi ya da endüstriyel amaçlı yeni makromoleküller üretilmesi
  5. Genetik faktörlerin hastalık yatkınlığına etkilerini ortaya çıkarılması