Korunan dizi - Conserved sequence

Beş memeli histon H1 proteininin çoklu dizi hizalaması Diziler , proteinlerin 120-180 kalıntıları için amino asitlerdir . Tüm dizilerde korunan kalıntılar gri renkle vurgulanır. Protein dizisi hizalamasının her bölgesinin (yani konumun) altında, korunan siteleri (*), konservatif değiştirmeleri (:), yarı-koruyucu değiştirmeleri (.) ve konservatif olmayan ikameleri ( ) gösteren bir anahtar bulunur . .

İçinde evrimsel biyoloji , korunmuş dizileri aynı ya da benzer olan sekanslar içinde nükleik asitler ( DNA ve RNA ) ya da proteinler türler arasında ( ortolog dizileri ) ya da bir mesafede olan genom ( paralog sekansları ) veya verici ve alıcı takson (arasında ksenolog sekansları ). Korunma, bir dizinin doğal seçilim tarafından korunduğunu gösterir .

Yüksek düzeyde korunmuş bir dizi, filogenetik ağacın çok gerilerinde ve dolayısıyla jeolojik zamanda çok gerilerde nispeten değişmeden kalmış bir dizidir . Yüksek ölçüde korunmuş sekansların örnekleri arasında , RNA bileşenlerinin arasında ribozomlar tüm mevcut etki yaşam, homeobox arasında yaygın sekansları ökaryotlarda ve tmRNA içinde Bakteri . Dizi koruma çalışmaları genomik , proteomik , evrimsel biyoloji , filogenetik , biyoinformatik ve matematik alanlarıyla örtüşmektedir .

Tarih

Rolü keşfi DNA içinde kalıtım ile ve gözlemler Frederick Sanger hayvan arasındaki varyasyon insülinler 1949, çalışma için erken moleküler biyologlar istendiğinde sınıflandırmayı moleküler bakış açısıyla,. 1960'lardaki araştırmalar, hemoglobin ve sitokrom c gibi bilinen ortolog proteinler arasındaki benzerliği ölçmek için DNA hibridizasyonu ve protein çapraz reaktivite tekniklerini kullandı . 1965 yılında, Émile Zuckerkandl ve Linus Pauling , moleküler saat kavramını ortaya koydular ve iki organizma birbirinden ayrıldığından bu yana geçen süreyi tahmin etmek için sabit amino asit değiştirme oranlarının kullanılabileceğini öne sürdüler . İlk filogeniler fosil kayıtlarıyla yakından örtüşürken, bazı genlerin farklı hızlarda evrimleştiği gözlemleri moleküler evrim teorilerinin gelişmesine yol açtı . Margaret Dayhoff'un 1966'daki ferrodoksin dizileri karşılaştırması, doğal seçilimin yaşam için gerekli olan protein dizilerini korumak ve optimize etmek için hareket edeceğini gösterdi .

mekanizmalar

Birçok kuşak boyunca, içinde nükleik asit dizileri genomun bir bir evrimsel soy nedeniyle kademeli tesadüfi mutasyonlar ve zaman içinde değişebilir silme . Diziler ayrıca kromozomal yeniden düzenlemeler nedeniyle yeniden birleşebilir veya silinebilir . Korunmuş diziler, bu tür kuvvetlere rağmen genomda kalan ve arka plan mutasyon hızından daha yavaş mutasyon oranlarına sahip olan dizilerdir.

Koruma, kodlayan ve kodlamayan nükleik asit dizilerinde meydana gelebilir . Yüksek düzeyde korunmuş DNA dizilerinin işlevsel değere sahip olduğu düşünülmektedir, ancak yüksek düzeyde korunmuş kodlamayan birçok DNA dizisinin rolü tam olarak anlaşılmamıştır. Bir dizinin korunma derecesi, değişen seçim baskılarından , mutasyona karşı sağlamlığından , popülasyon büyüklüğünden ve genetik sürüklenmeden etkilenebilir . Pek çok fonksiyonel sekans ayrıca modülerdir ve protein alanları gibi bağımsız seçim basınçlarına tabi olabilen bölgeleri içerir .

kodlama sırası

Kodlama dizilerinde, nükleik asit ve amino asit dizisi, genetik kodun dejenerasyonu, bir kodlama dizisindeki eşanlamlı mutasyonların , protein ürününün amino asit dizisini etkilemediği anlamına geldiğinden , farklı derecelerde korunabilir .

Amino asit dizileri, bir proteinin veya alanın yapısını veya işlevini korumak için korunabilir . Korunmuş proteinler daha az amino asit değişimine maruz kalır veya benzer biyokimyasal özelliklere sahip amino asitleri ikame etme olasılığı daha yüksektir . Bir dizi içinde, katlanma , yapısal stabilite için önemli olan veya bir bağlanma bölgesi oluşturan amino asitler daha yüksek oranda korunabilir.

Bir protein kodlayan genin nükleik asit dizisi, diğer seçici basınçlar tarafından da korunabilir. Kodon kullanım yanlılığı bazı organizmalarda bir dizide eşanlamlı mutasyonların tiplerini kısıtlayabilir. Kodlayan bir genin mRNA'sında ikincil yapıya neden olan nükleik asit dizileri, bazı yapılar translasyonu olumsuz etkileyebileceği için seçilebilir veya mRNA'nın aynı zamanda işlevsel kodlamayan bir RNA olarak hareket ettiği durumlarda korunabilir.

kodlamayan

Ribozomların bağlanma veya tanıma bölgeleri ve transkripsiyon faktörleri gibi gen düzenlemesi için önemli olan kodlamayan diziler bir genom içinde korunabilir. Örneğin, korunmuş bir genin veya operonun promotörü de korunabilir. Proteinlerde olduğu gibi, kodlamayan RNA'nın (ncRNA) yapısı ve işlevi için önemli olan nükleik asitler de korunabilir. Bununla birlikte, ncRNA'larda dizi koruması, protein kodlayan dizilere kıyasla genellikle zayıftır ve bunun yerine yapıya veya işleve katkıda bulunan baz çiftleri genellikle korunur.

Kimlik

Korunan diziler tipik olarak dizi hizalamasına dayalı biyoinformatik yaklaşımlarla tanımlanır . Yüksek verimli DNA dizileme ve protein kütle spektrometrisindeki ilerlemeler, 2000'lerin başından beri karşılaştırma için protein dizilerinin ve bütün genomların mevcudiyetini önemli ölçüde artırmıştır.

Homoloji arama

Korunan diziler, BLAST , HMMER , OrthologR ve Infernal gibi araçlar kullanılarak homoloji araştırması ile tanımlanabilir . Homoloji arama araçları, girdi olarak tek bir nükleik asit veya protein dizisini alabilir veya bilinen ilgili dizilerin çoklu dizi hizalamalarından oluşturulan istatistiksel modelleri kullanabilir . Profil-HMM'ler gibi istatistiksel modeller ve yapısal bilgileri de içeren RNA kovaryans modelleri, daha uzaktan ilişkili dizileri ararken yardımcı olabilir. Girdi dizileri daha sonra ilgili bireylerden veya diğer türlerden gelen dizilerin bir veritabanına göre hizalanır. Ortaya çıkan hizalamalar daha sonra eşleşen amino asitlerin veya bazların sayısına ve hizalama tarafından oluşturulan boşlukların veya silmelerin sayısına göre puanlanır. Kabul edilebilir koruyucu ikameler, PAM ve BLOSUM gibi ikame matrisleri kullanılarak tanımlanabilir . Yüksek puanlı hizalamaların homolog dizilerden olduğu varsayılır. Bir dizinin korunması daha sonra geniş bir filogenetik aralıkta oldukça benzer homologların saptanmasıyla çıkarılabilir.

Çoklu dizi hizalama

Gram pozitif bakterilerin LexA bağlayıcı motifi için bir dizi logosu . As adenozin 5 pozisyonda son derece korunmuş, bunun diğer karakterden daha büyük görünür.

Korunan dizileri görselleştirmek için çoklu dizi hizalamaları kullanılabilir. CLUSTAL biçimi (*), tutucu mutasyon (:), yarı-koruyucu mutasyonlar (.) Ve konservatif olmayan mutasyon () Sıra logoları da gösterebilir korunmuş dizisini gösteren, hizalama Annotatesekmesindeki korunmuş sütununa bir düz metin anahtarı içerir Hizalamanın her noktasındaki karakterlerin oranlarını yüksekliğe göre temsil ederek korunmuş dizi.

Genom hizalaması

ECR tarayıcısından alınan bu görüntü, farklı omurgalı genomlarının korunmuş OTX2 genindeki insan genomuna hizalanmasının sonucunu göstermektedir . Üst: OTX2 geninin ekzon ve intronlarının gen açıklamaları . Her genom için, insan genomuna kıyasla dizi benzerliği (%) çizilir. Parçalar göstermek Zebra balığı , köpek , tavuk , batı pençeli kurbağası , keseli sıçan , fare , makak maymunu ve şempanze genomları. Zirveler, tüm genomlarda yüksek dizi benzerliği olan bölgeleri gösterir ve bu dizinin yüksek oranda korunduğunu gösterir.

Tüm genom hizalamaları (WGA'lar), türler arasında yüksek oranda korunmuş bölgeleri belirlemek için de kullanılabilir. Şu anda WGA araçlarının doğruluğu ve ölçeklenebilirliği , yeniden düzenlemeler, tekrar bölgeleri ve birçok ökaryotik genomun büyük boyutu ile uğraşmanın hesaplama karmaşıklığı nedeniyle sınırlı kalmaktadır. Bununla birlikte, 30 veya daha fazla yakından ilişkili bakterinin (prokaryotların) WGA'ları artık giderek daha uygun hale geliyor.

Puanlama sistemleri

Diğer yaklaşımlar , beklenen bir arka plan (nötr) mutasyon oranına göre farklı şekilde mutasyona uğrayan dizileri tanımlamaya çalışan istatistiksel testlere dayalı koruma ölçümlerini kullanır .

GERP (Genomic Evolutionary Rate Profiling) çerçevesi, türler arasında genetik dizilerin korunmasını puanlar. Bu yaklaşım, çoklu dizi hizalamasından bir dizi türdeki nötr mutasyon oranını tahmin eder ve ardından dizinin beklenenden daha az mutasyon sergileyen bölgelerini tanımlar. Bu bölgelere daha sonra, gözlemlenen mutasyon oranı ile beklenen arka plan mutasyon oranı arasındaki farka dayalı olarak puanlar atanır. Yüksek bir GERP puanı daha sonra yüksek oranda korunmuş bir diziyi gösterir.

LIST (Local Identity and Shared Taxa), insanla yakından ilişkili türlerde gözlemlenen varyasyonların, koruma değerlendirilirken, uzak akraba türlere kıyasla daha önemli olduğu varsayımına dayanmaktadır. Bu nedenle LIST, çoklu dizi hizalamasındaki (MSA) ilgili dizileri tanımlamak için her bir konum etrafındaki yerel hizalama kimliğini kullanır ve daha sonra bu dizilerin insana göre sınıflandırma mesafelerine dayalı korumayı tahmin eder. Diğer araçlardan farklı olarak LIST, MSA'daki varyasyonların sayısını/sıklığını yok sayar.

Aminode , homolog proteinlerdeki değişiklikleri analiz etmek ve yerel evrimsel değişim oranlarını gösteren bir grafik oluşturmak için filogenetik analizle çoklu hizalamayı birleştirir. Bu yaklaşım, saflaştırma seçimine tabi olan ve tipik olarak normal protein işlevi için kritik olan segmentler olan bir proteindeki Evrimsel Olarak Kısıtlanmış Bölgeleri tanımlar .

PhyloP ve PhyloHMM gibi diğer yaklaşımlar , ikame oranlarının olasılık dağılımlarını karşılaştırmak için istatistiksel filogenetik yöntemleri içerir, bu da hem koruma hem de hızlandırılmış mutasyonun saptanmasına olanak tanır. İlk olarak, bir filogenetik ağaca dayalı olarak, çoklu dizi hizalamasında bir sütun için gerçekleşmesi beklenen ikame sayısının bir arka plan olasılık dağılımı oluşturulur . İlgilenilen türler arasındaki tahmini evrimsel ilişkiler, herhangi bir ikamenin önemini hesaplamak için kullanılır (yani, yakından ilişkili iki tür arasındaki bir ikame, uzaktan ilişkili olanlardan daha az olası olabilir ve bu nedenle daha önemli olabilir). Korumayı saptamak için, çoklu dizi hizalamasının bir alt kümesi için bir olasılık dağılımı hesaplanır ve olabilirlik-oran testi veya puan testi gibi istatistiksel bir test kullanılarak arka plan dağılımıyla karşılaştırılır . İki dağılımın karşılaştırılmasından elde edilen P değerleri daha sonra korunan bölgeleri belirlemek için kullanılır. PhyloHMM, olasılık dağılımları oluşturmak için gizli Markov modellerini kullanır . PhyloP yazılım paketi, olasılık -oran testi veya puan testinin yanı sıra GERP benzeri bir puanlama sistemi kullanarak olasılık dağılımlarını karşılaştırır .

Aşırı koruma

Ultra korunmuş öğeler

Ultra-korunmuş elemanlar veya UCE'ler, çoklu taksonomik gruplar arasında oldukça benzer veya özdeş olan dizilerdir . Bunlar ilk olarak omurgalılarda keşfedildi ve daha sonra çok farklı taksonlarda tanımlandı. UCE'lerin kökeni ve işlevi tam olarak anlaşılmasa da, amniyotlarda , böceklerde ve hayvanlar ile bitkiler arasındaki derin zaman farklılıklarını araştırmak için kullanılmıştır .

Evrensel olarak korunmuş genler

En yüksek düzeyde korunmuş genler, tüm organizmalarda bulunabilen genlerdir. Bunlar esas olarak , tüm yaşamın son evrensel ortak atasından korunduğu varsayılan, transkripsiyon ve translasyon için gerekli olan ncRNA'lardan ve proteinlerden oluşur .

Evrensel olarak korunduğu bulunan genler veya gen aileleri, GTP bağlayıcı uzama faktörleri , Metionin aminopeptidaz 2 , Serin hidroksimetiltransferaz ve ATP taşıyıcılarını içerir . RNA polimeraz ve helikazlar gibi transkripsiyon makinelerinin ve ribozomal RNA'lar , tRNA'lar ve ribozomal proteinler gibi çeviri makinelerinin bileşenleri de evrensel olarak korunur.

Uygulamalar

Filogenetik ve taksonomi

Benzer dizilere sahip organizmaların yakından ilişkili olduğu varsayılabileceğinden , korunmuş dizi kümeleri genellikle filogenetik ağaçların üretilmesi için kullanılır . Sekans seçimi, çalışmanın taksonomik kapsamına bağlı olarak değişebilir. Örneğin, bu tür 16S RNA ve diğer ribozomal dizileri gibi, en iyi muhafaza genler derin filogenetik ilişki yeniden bakteriyel belirlenmesi için yararlı olan filumlar içinde metagenomik çalışmaları. Bir bölüm içinde korunan ancak bazı mutasyonlara uğrayan diziler , örneğin temizlik genleri , tür ilişkilerini incelemek için kullanılabilir. İç transkripsiyonlu ayırıcı korunmuş rRNA genleri fakat tabi tutulmakta hızlı evrimi aralığı için gereklidir (ITS) bölge, genel olarak sınıflandırmak için kullanılan mantar ve hızla gelişen bakteri suşlarının.

Tıbbi araştırma

Yüksek oranda korunan diziler genellikle önemli biyolojik fonksiyonlara sahip olduğundan, genetik hastalıkların nedenini belirlemek için bir başlangıç ​​noktası olabilirler . Birçok konjenital metabolik bozukluk ve Lizozomal depo hastalığı , bireysel olarak korunan genlerdeki değişikliklerin sonucudur ve bu, hastalığın semptomlarının altında yatan neden olan eksik veya hatalı enzimlerle sonuçlanır. Genetik hastalıklar, insanlar ve fareler veya meyve sinekleri gibi laboratuvar organizmaları arasında korunan dizileri tanımlayarak ve bu genlerin nakavtlarının etkilerini inceleyerek tahmin edilebilir . Genom çapında ilişkilendirme çalışmaları , hastalık veya sağlık sonuçlarıyla ilişkili korunmuş dizilerdeki varyasyonu belirlemek için de kullanılabilir. Alzehimer hastalığında iki düzineden fazla yeni potansiyel duyarlılık lokusu keşfedilmişti.

İşlevsel açıklama

Korunan dizilerin tanımlanması, genler gibi fonksiyonel dizilerin keşfedilmesi ve tahmin edilmesi için kullanılabilir. Protein alanları gibi bilinen bir işlevi olan korunmuş diziler de bir dizinin işlevini tahmin etmek için kullanılabilir. Pfam ve Conserved Domain Database gibi korunmuş protein alanlarının veritabanları , tahmin edilen protein kodlama genlerinde fonksiyonel alanlara açıklama eklemek için kullanılabilir.

Ayrıca bakınız

Referanslar