Teknoloji
Yeni Yapay Zeka Aracı Karmaşık Hastalıklardan Sorumlu Ana Gen Setlerini Belirleyebiliyor
Northwestern Üniversitesi biyofizikçileri, diyabet, kanser ve astım gibi karmaşık hastalıkların altında yatan gen kombinasyonlarını belirlemek için yeni bir hesaplama aracı geliştirdiler.
Tek gen bozukluklarının aksine, bu durumlar birlikte çalışan birden fazla genin oluşturduğu bir ağdan etkilenir. Ancak olası gen kombinasyonlarının sayısı çok fazladır ve bu da araştırmacıların hastalığa neden olan belirli olanları belirlemesini inanılmaz derecede zorlaştırır.
Üretken bir yapay zeka (AI) modeli kullanan yeni yöntem, sınırlı gen ifadesi verilerini çoğaltarak araştırmacıların karmaşık özelliklere neden olan gen aktivitesi modellerini çözmesini sağlar. Bu bilgi, birden fazla genle ilişkili moleküler hedefleri içeren yeni ve daha etkili hastalık tedavilerine yol açabilir.
Çalışmanın kıdemli yazarı Northwestern’den Adilson Motter, « Birçok hastalık sadece bir genin değil, bir gen kombinasyonu tarafından belirlenir, » dedi. « Kanser gibi bir hastalığı bir uçak kazasına benzetebilirsiniz. Çoğu durumda, bir uçağın düşmesi için birden fazla arızanın meydana gelmesi gerekir ve farklı arıza kombinasyonları benzer sonuçlara yol açabilir. Bu, nedenleri belirleme görevini zorlaştırır. Modelimiz, kilit oyuncuları ve bunların toplu etkilerini belirleyerek işleri basitleştirmeye yardımcı olur. »
Karmaşık sistemler konusunda uzman olan Motter, Northwestern’in Weinberg Sanat ve Bilim Koleji’nde Charles E. ve Emma H. Morrison Fizik Profesörü ve Ağ Dinamikleri Merkezi’nin direktörüdür. Çalışmanın diğer yazarları —hepsi Motter’s Lab ile ilişkili— doktora sonrası araştırmacı Benjamin Kuznets-Speck, lisansüstü öğrenci Buduka Ogonor ve araştırma görevlisi Thomas Wytock’tur.
Mevcut yöntemler yetersiz kalıyor
Araştırmacılar onlarca yıldır karmaşık insan özelliklerinin ve hastalıklarının genetik temellerini çözmek için çabalıyor. Boy, zeka ve saç rengi gibi hastalık dışı özellikler bile gen koleksiyonlarına bağlıdır. Genom çapında ilişki çalışmaları gibi mevcut yöntemler, bir özellik ile bağlantılı bireysel genleri bulmaya çalışır. Ancak gen gruplarının toplu etkilerini tespit etmek için istatistiksel güçten yoksundurlar.
Motter, « İnsan Genomu Projesi bize tek hücreli bir bakteriden yalnızca altı kat daha fazla genimiz olduğunu gösterdi, » dedi. « Ancak insanlar bakterilerden çok daha karmaşıktır ve gen sayısı tek başına bunu açıklamaz. Bu, çok genli ilişkilerin yaygınlığını ve karmaşık yaşamın ortaya çıkmasına neden olan şeyin genler arasındaki etkileşimler olması gerektiğini vurgular. »
« Tek genleri tanımlamak hala değerlidir, » diye ekledi Wytock. « Ancak tek genlerdeki değişikliklerle açıklanabilen gözlemlenebilir özelliklerin veya fenotiplerin çok küçük bir kısmı vardır. Bunun yerine, fenotiplerin birçok genin birlikte çalışmasının sonucu olduğunu biliyoruz. Bu nedenle, birden fazla genin tipik olarak bir özelliğin çeşitliliğine katkıda bulunması mantıklıdır. »
Genetik yapı (genotip) ile gözlemlenebilir özellikler (fenotip) arasındaki uzun süredir var olan bilgi boşluğunu kapatmaya yardımcı olmak için araştırma ekibi, makine öğrenimini optimizasyonla birleştiren gelişmiş bir yaklaşım geliştirdi.
Transkriptome-Geniş Koşullu Varyasyonel Oto-Kodlayıcı (Twave) olarak adlandırılan model, insanlarda sınırlı gen ifadesi verilerinden örüntüleri tanımlamak için üretken AI’dan yararlanır. Buna göre, gen ifadesindeki değişikliklerin fenotipteki değişikliklerle eşleştirilebilmesi için hastalıklı ve sağlıklı durumları taklit edebilir. Model, tek tek genlerin etkilerini izole bir şekilde incelemek yerine, toplu olarak karmaşık bir özelliğin ortaya çıkmasına neden olan gen gruplarını belirler. Daha sonra yöntem, bir hücrenin durumunu sağlıklıdan hastaya veya tam tersine kaydırma olasılığı en yüksek olan belirli gen değişikliklerini belirlemek için bir optimizasyon çerçevesi kullanır.
« Gen dizisine değil, gen ifadesine bakıyoruz, » dedi Wytock. « Modelimizi klinik deneylerden gelen verilerle eğittik, bu sayede hangi ifade profillerinin sağlıklı veya hastalıklı olduğunu biliyoruz. Daha az sayıda gen için, gen açıldığında veya kapatıldığında ağın nasıl tepki verdiğini söyleyen deneysel verilerimiz de var, bu verileri ifade verileriyle eşleştirerek hastalıkta rol oynayan genleri bulabiliriz. »
Gen ifadesine odaklanmanın birden fazla faydası vardır. Birincisi, hasta mahremiyeti sorunlarını atlatır. Genetik veriler -bir kişinin gerçek DNA dizisi- doğası gereği bir bireye özgüdür ve sağlık, genetik yatkınlıklar ve aile ilişkileri hakkında oldukça kişisel bir plan sunar. Öte yandan ifade verileri, hücresel aktivitenin dinamik bir anlık görüntüsü gibidir. İkincisi, gen ifadesi verileri, çeşitli işlevleri yerine getirmek için genleri « yukarı » veya « aşağı » çevirebilen çevresel faktörleri dolaylı olarak hesaba katar.
Motter, « Çevresel faktörler DNA’yı etkilemeyebilir, ancak gen ifadesini kesinlikle etkiler, » dedi. « Bu nedenle, modelimiz çevresel faktörleri dolaylı olarak hesaba katma avantajına sahiptir. »
Twave’in etkinliğini göstermek için ekip, bunu birkaç karmaşık hastalıkta test etti. Yöntem, mevcut yöntemler tarafından gözden kaçırılan genleri başarıyla tanımladı. Twave ayrıca farklı gen setlerinin farklı kişilerde aynı karmaşık hastalığa neden olabileceğini ortaya koydu. Bu bulgu, kişiselleştirilmiş tedavilerin bir hastanın hastalığın belirli genetik itici güçlerine göre uyarlanabileceğini gösteriyor.
Motter, « Bir hastalık iki farklı bireyde benzer şekilde ortaya çıkabilir, » dedi. « Ancak prensipte, genetik, çevresel ve yaşam tarzı farklılıkları nedeniyle her kişide farklı bir gen seti söz konusu olabilir. Bu bilgi kişiselleştirilmiş tedaviyi yönlendirebilir. »
Yazar: Bassma Bouanani