Structure programının kendine ait veri depolama ve analiz formatıdır. STRUCTURE dosyası iki bölümden oluşur, ilk satırda TAB ile ayrılmış lokus isimleri, sonraki satırlarda ise genotipik veriler bulunmaktadır. Genotipik verilerin sütunları sırasıyla:
- 11. Birey Numarası
- 12. Popülasyon numarası(Rakamlarla kodlanır)
- 13. Allel özellikleri
STRUCTURE dosyasında eksik-veriler(missing-data), genotip veriler içinde olmayan bir sayı ( 0,-9 veya -99) ile gösterilmektedir.
Resim 1: Structure(*.txt) Dosya Formatı Görünümü
STRUCTURE dosya formatı matris gibi düzenlenmiştir. Satırlarda birey isimleri kolonlarda lokus isimleri yer alır. Dosyanın ilk satırında, isteğe bağlı olarak lokus isimleri yer alır. Lokus isimleri arasında 2 tab (boşluk) kullanılır. Lokus isimleri içinde boşluk veya tab karakterleri kullanılamaz. Sonraki satırlarda birey isimleri ve genotip veriler yer alır. Genotip veriler içinde sırasıyla birey adı, popülasyon numarası ve allel uzunlukları birer tab (boşluk) arayla yazılır. Birey isimleri ve popülasyon numaraları isteğe bağlı olarak kullanılabilir. Diploit organizmalar için veriler istenirse ardışık satırlar halinde ya da her bir lokus için iki ardışık kolon üzerine yazılabilir
Resim 2: STRUCTURE Dosya Formatı Görünümü
STRUCTURE veriler içindeki eksik veriler (missing data) için, genotip verilerin içinde bulunmayan bir sayı olan “-9” veya “-1” ile gösterilir. STRUCTURE içerisinde sadece hapoloit ya da sadece diploit veriler bulunur. STRUCTURE dosya uzantıları “.txt” ya da “.str” uzantılıdır. STRUCTURE dosya formatları içerisinde AFLP (Amplified Fragment Length Polymorphism), RFLP (Restriction Fragment Length Polymorphism), SSR/MICROSAT (Simple Sequence Repeats) ve SNP (Single Nucleotid Polymorphism) dosya tiplerinden herhangi birisi bulunabilir.