Biyoinformatik dünyasına kaliteli, özgün ve Türkçe içerikler kazandırmayı hedefleyen bir platform..

friends friends friends

GENEPOP Dosya Formatı

GENEPOP dosyası, içerisindeki veri hakkında açıklayıcı bir bilgi satırı ile başlar. Açıklayıcı bilgi satırı içinde her karakter kullanılabilir. İkinci satır lokus isimlerinin başladığı satırdır. Lokus isimleri 2 farklı şekilde yazılabilir. Lokus isimleri tek satırda aralarında virgül ya da virgül + boşluk (space) kullanılarak yazılabilir

Resim 1: GENEPOP Dosya Formatı Görünümü-1

İkinci kullanımda ise 2. satırdan başlayarak, virgül (,) kullanmadan art arda satırlarda sadece lokus isimleri yazılarak devam edilir.

Resim 2: GENEPOP Dosya Formatı Görünümü-2

Lokus isimleri içinde virgül (,) haricinde boşluk (space) dâhil herhangi bir karakter kullanılabilir. Çünkü lokus isimleri birbirlerinden ancak virgül(,) ile ayrılabilir. Lokus isimlerinden sonraki satırda, bir popülasyonun başladığını belirtmek için satır başında “POP” kelimesi kullanılır. Bu kelimede büyük-küçük harf duyarlılığı olmadığı için “Pop” veya “pop” kelimeleri de kullanılabilir. “POP” kelimesi ile başlayan satırda, isteğe bağlı olarak, bu kelimeden sonra boşluk bırakılıp popülasyon ismi yazılabilir. Eğer popülasyon ismi belirtilmemişse GENEPOP programının versiyonlarına ya da türlerine göre (desktop veya web), popülasyonun ilk bireyinin ya da son bireyinin ismi, otomatik olarak bu popülasyona isim olarak verilebilir. “POP” kelimesinin bulunduğu satırdan sonraki her satırda, bu popülasyona ait bir bireyin bilgileri verilir. Bu satırlar birey isimleri ile başlar ve virgül (,) kullanıldıktan sonra genotip veriler yazılır. Birey isimleri zorunlu değildir fakat boş bırakıldıktan sonra yine virgül (,) den sonra genotip veriler yazılır. Dosya formatını çevireceğimiz diğer formatta birey ismi zorunlu olacaksa, birey ismi olarak (“ind_”+birey numarası), bireye isim olarak verilebilir.

Resim 3: GENEPOP Dosya Formatı Görünümü-3

Genotip verilerin içinde bulunan her bir lokus bir veya daha fazla boşluk (space) ile birbirlerinden ayrılır. Lokus isimlerinin sayısı ile genotip veriler içindeki lokus sayıları aynı olmalıdır. Eğer değilse uygun bir şekilde eşitlemek gereklidir aksi halde hata olarak kabul edilir.

Resim 4: GENEPOP Dosya Formatı Görünümü (Boşluk)

Genotip verilerde lokus içindeki “0102” verisi 4 tane rakama (digit) sahip olduğu için diploit olarak kabul edilir. İlk allel “01”, ikinci allel” 02”dir. Eğer lokus içindeki bu veri 4 rakamdan küçük, “01” ya da “010” ise haploittir ve tek allel olarak kabul edilir. 2 rakam (digit) alleller, “01-99” arasında numaralandırılırken 3 rakam (digit) alleler, “001-999” arası numaralandırılırlar. Aynı GENEPOP dosyasında, genotip veriler içinde, SSR/MICROSAT dosya tiplerinde, haploit ve diploit veriler birlikte (mixed) kullanılabilir.

Resim 5: GENEPOP Dosya Formatı (Mixed) Görünümü

Genotip veriler içindeki eksik veriler (missing data), 2 rakam (digit) allellerde 00 ile gösterilirken 3 rakam (digit) allellerde 000 ile gösterilirler. GENEPOP dosyası içinde boş satır olamaz. Dosya sonunda ise birden fazla boş satır bulunmamalıdır.

Resim 6: GENEPOP Dosya Formatı Eksik Veri (Missing Data) Görünümü

GENEPOP dosya uzantıları ya “.txt” uzantılıdır ya da dosya uzantısına sahip değillerdir. Ancak dosya uzantısına sahip olmayanlar ASCII metin dosyaları olmak zorundadır. GENEPOP dosya formatları içerisinde DNA, AFLP, SSR/MICROSAT ve SNP dosya tiplerinden herhangi birisi bulunabilir [31]. Bu çalışmada GENEPOP dosya formatının çevrileceği dosya formatları STRUCTURE ve ARLEQUIN dosya formatlarıdır.

GENEPOP
0 Beğeni
Önceki Yazı

STRUCTURE Dosya formatı

20 Ağu. 2022 tarihinde yayınlandı.
Sonraki Yazı

Biyoteknolojik Bitkilerin Kullanım Nedenleri

20 Ağu. 2022 tarihinde yayınlandı.
arrow