Araştırmacılar, Veriyi DNA’da Depolamak Üzerine Çalışıyor
Son birkaç yılda insanlık, tüm tarih boyunca toplanan bilginin toplamından daha fazla bilgi üretti ve görünüşe bakacak olursak bu, daha da katlanarak büyümeye devam edecek. Alışılmış hal bu türlü olunca da bir noktada herkesin aklına tek bir soru geliyor: Bu kadar bilgiyi nerede saklayacağız?
Her ne kadar bilim insanları, insanlığa ilişkin dataları saklamak ismine sabit disk boyutlarını devamlı olarak artırsa ve hatta kimileri bunun sonsuza kadar yapılabileceğine insansa da, üstün data üretme suratımızın yanında bu gayretlerin yetersiz kalacağına inanan bir kısım bulunuyor. Bu kaygıya karşılık olarak bilim adamları artık de ‘eşsiz’ bir tahlil üretmeye çalışıyor: Belgeleri, fotoğrafları ve dokümanları tabiatın kendine has data tabanında, yani DNA’da depolamak.
Birkaç petabayt bilgiyi depolamak için yalnızca bir gram DNA kâfi
Geçtiğimiz ay Nano Letters isimli bilim mecmuasında yayımlanan çalışmanın, DNA bilgi depolama konseptini büyük boyutlara taşıyabilme potansiyeli bulunduruyor. Aslında bakacak olursanız çalışmanın arkasındaki grup, devasa depolama kapasitelerine imkan sağlayabilecek ve epey çok seviyede dijital data barındırabilecek DNA alfabesini yapay olarak genişleten birinci grup olma özelliğini taşıyor.
Hiper küçük alanlarda akıl almaz ölçüde bilgi içerecek kadar geniş ve ağır olan DNA’da bulunan çift sarmal ipliklerin, sırf 10 mikrometre genişliğindeki hücre çekirdeğinin içine sıkışmış olmasına karşın bedenimizin tüm verisini saklaması ve tabiatta bol ölçüde bulunan DNA’nın muhteşem kuvvetli şartlara bile sağlam olması, bilginin korunması için aslında DNA’nın mükemmelbir bellek olduğu manasına geliyor. Bu mevzuya dair konuşan çalışmanın ortak müelliflerinden Beckman İleri Bilimler ve Teknoloji Enstitüsü’nden araştırmacı Kasra Tabatabaei, “İnternette her gün birkaç petabayt bilgi üretiliyor. Bu dataları depolamak için sırf bir gram DNA kâfi olacaktır. DNA bir depolama ortamı olarak bu kadar ağırdır.” halinde kaydediyor.
DNA, yalnızca dört ‘harf’ kullanarak bütün canlıların genetik bilgilerini kodluyor
Pekala, biyolojik açıdan bakacak olursak, DNA’nın bilgi toplaması süreci nasıl işliyor? Şöyle ki DNA, genetik bilgiyi nükeotid ismi verilen, adenin (A), guanin (G), sitozin (S) ve timin (T) olmak üzere dört farklı molekül sayesinde kodluyor. Bir bakıma DNA’nın bu dört molekülü temsil eden harflerden oluşan 4 harflik bir alfabesi olduğu ve farklı harf kombinasyonlarının farklı bilgi bitlerini temsil ettiği söylenebilir. Bu da demek oluyor tabiat, yalnızca bu dört harfi kullanarak dünya üzerindeki bütün canlıların genetik bilgisini kodluyor. Teknik olarak düşünürsek bu, DNA’daki harfler aracılığıyla bizim de bir ton dijital bilgi depolayabilmemiz gerektiği manasına geliyor.
Pekala, ya bu alfabe dört değil de daha fazla harften oluşsaydı? Bunun olması durumunda bilgi depolama kapasitesi çok, çok daha büyük olurdu ki, çalışma grubunun yapmaya çalıştığı şeyin de aslında tam olarak bu olduğu söylenebilir.
Bu durumu yazı yazmak için kullandığımız alfabeden yola çıkarak açıklayan ve şayet elimizde yalnızca 4 harf olsaydı üretebileceğimiz sözlerin sayısının epey kısıtlı olacağını belirten Tabatabei, “Alfabenin tamamı olursa, sınırsız söz kombinasyonu üretebilirsiniz. DNA’da da tıpkı şey. Sıfırları ve birleri A, G, C ve T’ye dönüştürmek yerine, sıfırları ve birleri A, G, C, T’ye ve depolama alfabesindeki yedi yeni harfe dönüştürebiliriz.” sözlerini kullanıyor.
Grup, DNA tarafından kodlanan datanın algılanmasını ve geri aktarılmasını sağlayan bir düzenek da geliştirdi
Buna ek olarak araştırmacılar, bu 11 harfle kodlanan bilgilerin talep üzerine geri aktarılmasını sağlayan, sentetik DNA’nın bilgilerini tam olarak geri okuyan yeni bir sistem da geliştirdiler. DNA’nın harf kombinasyonlarının son derece net bir formda okunmasını sağlayan düzeneğin, insan üretimi DNA harfleri ile doğal olanları ayırt etmek ve her şeyi birbirinden ayırmak için derin öğrenme algoritmaları ve yapay zeka kullandığı bildiriliyor.
Çalışmanın ortak müelliflerinden Illinois Urbana-Champaign Üniversitesi’nden yüksek lisans öğrencisi Chao Pan ise, sisteme ait olarak “11 nükleotidin 77 farklı kombinasyonunu denedik ve metodumuz her birini harika bir biçimde ayırt edebildi” diyor ve “Farklı nükleotidleri belirleme sistemimizin bir modülü olan derin öğrenme çerçevesi üniversaldir, bu da yaklaşımımızın öbür birçok uygulamaya genelleştirilebilirliğini sağlar.” diye de kelamlarına ekliyor.