MEGA dosya formatı içindeki nükleotid sekans verileri farklı, genetik farklılık verileri farklı yapılardadır. Nükleotid veri tipleri için MEGA dosyasının ilk satırında, “#MEGA” ifadesi bulunurken sonraki satırlardaki “!Title” ifadesi ile başlık, “!Description” ifadesi ile açıklama, “!Gene” ifadesi ile gen kimliği ve özelliklerini gösteren açıklama yazılabilir. Genotip verilerin başladığı yer, diez (#) işaretinin olduğu satırdır, diez (#) işareti birey isimlerinin önüne bitişik yazılır. Birey isimlerinin uzunluklarında herhangi bir sınırlama yoktur. Birden fazla kelime kullanılan isimlendirmelerde boşluklar yerine alt çizgi (_) kullanılabilir. Sekans verileri genellikle IUPAC (International Union of Pure and Applied Chemistry) standart tek harfli kodlar ile kaydedilir ve büyük-küçük harf beraber kullanılabilir
Resim 1: MEGA Dosya Formatı Görünümü
MEGA dosyaları “.txt”, “.meg” uzantısına sahiptirler ya da ASCII metin dosyaları olmak zorundadır. MEGA dosya formatları içerisinde DNA, RNA, Distance ve Protein dosya tiplerinden herhangi birisi bulunabilir. Eksik veriler (missing data) için soru işareti (?) ve boşluklar (gap) için ise tire işareti (-) kullanılır. Sekans verileri eşit uzunluklarda olmalıdır. Bu çalışmada MEGA dosya formatının çevrileceği dosya formatları FASTA, PHYLIP, ARLEQUIN ve NEXUS dosya formatlarıdır.
Interleaved (aralıklı) ve Sequential (sıralı) olmak üzere 2 çeşit MEGA formatı vardır.
Resim 2: MEGA Interleaved Dosya Formatı Görünümü
Resim 3: MEGA Sequential (Noninterleaved) Dosya Formatı Görünümü
Resim 4: MEGA Distance Veri Tipi Dosya Formatı Görünümü
MEGA dosyaları içinde Distance dosya tipleri için ayrı bir yazım şekli vardır. Bu dosyasının ilk satırında, “#MEGA” ifadesi bulunur ve sonraki satırlarda ki “!Title”, “!Description” ve “!Format” ifadeleri isteğe bağlı olarak kullanılabilir. Daha sonra lokus isimleri gelir. Lokus isimlerinden sonra genetik farklılık matrisi (distance matrix) yazılır