DNA ve Data Depolamak
DNA, Deoksiribo Nükleik asit, canlıların kullanım kılavuzudur. Nasıl ve nelerden meydana geldiğimiz bu kılavuzda 4 adet baz ile yazılıdır. Bu bazlar orta okuldan hatırlayabileceğiniz üzere Adenin, Timin, Sitozin ve Guanindir. İnsan DNA’sında milyarlarca baz çifti bulunur. Bu DNA hücrede kıvrılmış, sıkışmış, yüksek bir yoğunlukta bulunur. Eğer bu DNA’yı esnetirsek, kabaca, bir hücredeki DNA 2m uzunluğa ulaşır. Vücudumuzda yaklaşık 10¹³ hücre bulunur. Vücudumuzdaki tüm DNA’yı uç uca eklersek Dünyadan Güneşe 70 kere gidip gelebiliriz.
Peki bu DNA’nın depolama kapasitesi ne kadardır? Bildiğimiz gibi bilgisayar bilimleri “binary” yani ikili sistemi kullanır. Yani aslında bilgisayar üstünde yaptığımız her işlemin 0'lar ve 1'ler tarafından karşılığı vardır. Buradaki her 0 veya 1 bir bite karşılık gelir. Şimdi az önce bahsettiğimiz DNA bazlarını düşünelim: A,T,G,S. A = 00, T = 01, S =10, G=11 olsun. Yani her baz 2 biti temsil etsin. Böyle bir temsil etme durumunda beş exabyte (1000⁶ byte, 1 byte= 8 bit) büyüklüğünde DNA datası ki bu insanlığın şimdiye kadar söylediği tüm sözler kadardır, 5 mm³ yer kaplar. Anlamamızı kolaylaştıracak bir başka karşılaştırma ise şöyledir: 1 gram DNA 215 milyon gigabyte data depolayabilir. Şu an bu yazıyı okuduğunuz cihazınızın hard diski ise bunun milyonda birinden daha azını yapar. İşte DNA’nın bu bilgi yoğunluğu, onu depolama anlamında bu kadar önemli kılıyor.
DNA Depolaması Çalışmaları
1959 yılında tarihin en önemli fizikçilerinden Feynman tarihe “aşağıda daha çok yer var” şeklinde geçen dersini verdiğinde sadece fiziğin değil biyolojinin de yönünü değiştirdi ve çalışmalara ilham verdi.
İlk somut çalışma 1988 yılında sanatçı Joe Davis ve Harvard’dan araştırmacıların “microvenus” projesi ile gerçekleşti. Bu projede E.coli bakterisinin DNA’sına antik Alman kültüründe kadını ve yaşamı temsil eden bir figürün kodlanması ile oldu. 5x7'lik matrise dönüştürülen bu figür 0 ve 1ler ile temsil edildi.
İlerleyen zamanlarda da konu hakkında pek çok çalışma yapıldı. 2011'de Regenesis kitabının 70 milyar kopyası DNA’ya kodlandı. Depolanan veri miktarı ondan önceki çalışmaların yaklaşık 1000 katı kadardı. 2019 yılında Catalog adlı startup İngilizce vikipedideki 16GB’lık bilgiyi DNA’ya kodladığını duyurdu. DNA’ya bilgi şifrelemek/kodlamak üzerine pek çok çalışma yapılmış ve yapılmaya da devam ediyor. Önümüzdeki günlerde de heyecan verici gelişmelerin yaşanacağı kesin. Peki bilgiler DNA’nın üzerine nasıl kodlanıyor?
DNA’ya Bilgiyi Kodlamak
Tahmin edebileceğimizden çok daha kolay çalışan bir sistem aslında. Elimizdeki data öncelikle 0 ve 1'lik koddan A,T,G,S’li kodlama sisteme çevriliyor. Daha sonra çeşitli teknikler ve enzimler ile elde ettiğimiz kod gerçek bir molekülde sentezleniyor. Ve süreç burada bitiyor. Kodladığınız DNA’yı okumak görece daha karışık. Bunun için öncelikle PCR(Polimeraz zincir reaksiyonu) yöntemi ile istenilen DNA bölgesi kopyalanır, ve okunur. Tüm bu süreçler tabii ki anlattığımız kadar kolay değil. Hangi bölgenin kopyalanacağını belirlemek, yapay olarak bir sentezi gerçekleştirmek, DNA sentez sürecinin kendi içinde pek çok “hata” oluşturması gibi zorlukları barındırır. Fakat tüm bunlar geliştirilebilir ve çözülebilir problemlerdir.
İsrail Teknoloji Enstitüsünden bir grup araştırmacı Nature’da yayınlanan makalelerinde DNA depolaması konusunda önemli gelişmelere imza attılar. Tüm Youtube datasını bir çay kaşığına sığdırılabiliyor. Çalışmacılar bu çalışmada odaklandıkları konuları şu şekilde açıkladı : Kullanılan “harf” sayısını arttırma(4 bazdan daha fazla baz kullanma); datayı depolamak için gerekli sentez sayısını düşürme; hata düzeltme mekanizmasını iyileştirmek.
Bir diğer zorluk ise şüphesiz zaman ve paradır. İnsan Genomu Projesi 1990'da başladı ve tam 13 yıl sonra 2003 yılında taslaklar tamamlandı, yaklaşık 3 milyar dolar harcandı. Bugün ise özel şirketler birkaç yüz dolara DNA’nızı analiz edip gen haritanızı çıkarmaya başladılar. DNA depolamasındaki bu sorunu çözmek için de çalışmalar başladı. Microsoft, Intel, Micron bu tarz çalışmaları fonlamaya başladı. Microsoft ve Washington Üniversitesinden araştırmacılar DNA’ya data depolamak ve okumak için ilk tam otomatik sistemi yapmak ve DNA depolama teknolojisini laboratuvardan çıkarıp data merkezlerinde kullanabilmek için ilk önemli adımları attılar. Catalog adlı startup şirketi okul otobüsü boyutunda DNA depolama makinesi için 9 milyon dolar fon almış ve prototipini inşaa etmeye başlamış. Şirket prototip bittikten sonra seri üretime geçmekten ise ilk etapta bunu partnerleri DNA depolama servisi olarak sunmayı planlıyor.
DNA’da veri depolama önümüzdeki günlerin en çok konuşulacak çalışma alanlarından biri olacak…