Genome-wide association studies (GWAS)
Genome-wide association studies (GWAS) Workflow

Biyoinformatikte, tek nükleotid polimorfizmleri (SNP'ler) ile hastalıklar gibi fenotipik özellikler arasındaki ilişkileri istatistiksel olarak çeşitli yazılımsal araçlar yardımıyla ortaya koymak için genom-boyu ilişkilendirme çalışmaları (GWAS) kullanılmaktadır.

Genom-boyu ilişkilendirme çalışmaları (GWAS), belirli bir özellik veya hastalıkla istatistiksel olarak ilişkili genetik varyantları bulmak, kalıtsallıklarını tahmin etmek veya genetik korelasyonlarını hesaplamak için çok sayıda genomda yüz binlerce genetik varyantı ölçmekte ve analiz etmekte kullanılan bir dizi uygulamaya sahip analitik bir yaklaşımdır.

Genetik bağlantı(genetic linkage) ve aday gen çalışmalarının, karmaşık ve yaygın hastalıkların tüm kalıtsallığını açıklamada yetersiz kalması ve son gelişmelerle birlikte genetik varyant veri sayısının artmasıyla birlikte GWAS, ilgilenilen bir özellikten sorumlu genleri veya genomik bölgeleri tanımlamak için güçlü bir yöntem olarak kabul edilmektedir ve tıp biliminde kanser, diyabet, ilaca duyarlılık vb. nedensel lokusları incelemek için yaygın olarak kullanılmaktadır.

Bir GWAS'ın başarılı bir şekilde yürütülebilmesi için öncelikle yeterli büyüklükte veri kümelerine ihtiyaç vardır ancak bu çoğu bireysel laboratuvarın zaman ve para açısından kapasitesini aşan büyük yatırımlar gerektirmektedir. Buna karşılık veri kaynağı olarak hem genotipik hemde fenotipik bilgilere sahip büyük gruplara erişim sağlayan birkaç çok iyi biyobankası ve kamu kuruluşu mevcuttur.

Biyobankalar ve Veri Tabanları

En bilinen biyobankaları, katılımcıları gönüllülerden oluşan UK Biobank ya da hastalık durumlarına göre hastanelerden katılımcıların bilgilerini kullanan Biobank Japan (BBJ)’dır.

  1. UK Biobank
  2. BioBank Japan (BBJ)
  3. dbGaP Veri Tabanı
  4. NIAGADS Veri Tabanı(NIA Genetics of Alzheimer's Disease Data Storage Site )
  5. EGA Veri Tabanı(The European Genome-phenome Archive)

Genotip Veri Formatları

GWAS analizi gerçekleştirmek için fenotip ve genotip verileri gereklidir. Fenotip verileri basit CSV veya TSV dosya formatlarında saklanabilirken, genotip verileri son derece büyük olabildikleri için daha uygun veri depolama formatlarında saklanmaktadırlar. Bununla birlikte, işlenmemiş(ham) varyant genotip verileri, genellikle insanlar tarafından kolayca incelenebilen basit metin tabanlı dosya formatları olan Variant Call Format (VCF) dosyalarında saklanmaktadır. Ancak, GWAS analizi için kullanılan en yaygın yazılım olan PLINK gibi araçlar, VCF dosyalarını doğrudan GWAS'ta kullanmazlar ve bunun yerine önce VCF dosyalarını PED formatına veya BED dosyasına dönüştürürler. Gerçek analizde metin tabanlı PED versiyonu yerine binary kodlanmış bir BED dosyası kullanmak daha yaygındır. Ayrıca PLINK, BED dosyalarıyla birlikte en az iki tamamlayıcı dosya gerektirir: BIM ve FAM dosyaları

PED, MAP, BED, FAM ve BIM dosya formatları, PLINK programına ait dosya formatlarıdır. PLINK programına ait bu dosya formatları dışında yaygın olarak HapMap, VCF ve Structure genotip dosya formatları da kullanılmaktadır.

Yaygın Genotip Dosya Formatları
Yaygın Genotip Dosya Formatları

GWAS Avantajları ve Dezavantajarı

Günümüzde çok yaygın olarak kullanılan genom boyu ilişkilendirme çalışmalarının avantajları ve dezavantajları da bulunmaktadır.

GWAS’ın bir başlangıç hipotezine ihtiyaç duymaması, işlenebilen dijital bilgi kullanması, hem sekans hem de kopya sayısı varyasyonları hakkında bilgi sağlaması önemli avantajlarıdır.

Genom boyu ilişkilendirme çalışmalarının ilk önemli dezavantajı, çok sayıda örneğe ihtiyaç duyulmasıdır bu nedenle organize edilmesi ve uygulanması zor olabilir. Başka bir kısıtlayıcı özelliği ise popülasyonda sadece yaygın olan, yani %5’ten daha fazla görülen alelleri belirleyebilmesidir. Bu nedenle genom boyu ilişkilendirme çalışmalarının, hastalık ile ilişkili bütün genetik varvasyonlar hakkında bilgi sağladığı düşünülmesi önemli bir hata olacaktır.

GWAS için başka bir sınırlama, istatistiksel analizde çoklu testlerin düzeltilmesidir. Bonferroni düzeltmesi en sık kullanılan yöntemdir.