EBI'de dünyanın en büyük tekrarsız ver tabanı olan UniProtKB[uniprot] toplam 65 milyon protein dizisi içermektedir. EBI, SIB ve GeorgeTown Üniversitesi'nin ortak veri tabanı olup, Swissprot, TrEMBL ve PIR veri tabanlarına ait bilgilerin tamamını içermektedir ve protein bilgisinin merkezi havuzu olarak hizmet etmektedir.
Verilen bir genin fonksiyonunu ve protein sekansını UniProt üzerinden bulabiliriz.
Gen Fonksiyonu Bulmak
Protein Lipoprotein lipase proteinin fonksiyonlarını bulmak için Uniport veri tabanını ve protein adını kullanacağız. İlgili proteinin fonksiyonunu bulmak için sırasıyla:
- https://www.uniprot.org/ adresine gidiniz,
- Arama kutucuğuna Protein Lipoprotein lipase yazınız ve arama butonuna tıklayınız.
İlgili proteini bularak kutucuğun yanındaki (P06858) ismi üzerine tıklayarak detaylarına bakabiliriz.
Gelen sayfadan Function sekmesine bakıyoruz.
Protein Sekansını Bulmak
Protein sekansını elde etmek için Uniprot ID'sini ve uniprot veri tabanını kullanacağız. Uniprot ID'si P06858 'in protein sekansını elde etmek için sırasıyla:
- https://www.uniprot.org/ adresine gidiniz,
- Arama kutucuğuna P06858 yazınız ve arama butonuna tıklayınız.
Protein ID'si ile arama yaptıktan sonra gelen yeni sayfada, protein sekansını FASTA formatında elde etmek için sırasıyla:
- Sol tarafta bulunan menüden Sequence'i seçiniz,
- FASTA formatında dosyayı indirmek için Download butonuna tıklayınız.
Tüm adımları sorunsuz bir şekilde tamamladıktan sonra FASTA formatına erişmiş olmanız gerekir. İsterseniz dosyayı bilgisayarınıza kaydedebilir ya da kopyalayıp kullanabilirsiniz.
https://www.uniprot.org/uniprot/P06858.fasta adresinden P06858’e ait protein sekansı aşağıdaki gibi elde edilmelidir.
>sp|P06858|LIPL_HUMAN Lipoprotein lipase OS=Homo sapiens OX=9606 GN=LPL PE=1 SV=1
MESKALLVLTLAVWLQSLTASRGGVAAADQRRDFIDIESKFALRTPEDTAEDTCHLIPGV
AESVATCHFNHSSKTFMVIHGWTVTGMYESWVPKLVAALYKREPDSNVIVVDWLSRAQEH
YPVSAGYTKLVGQDVARFINWMEEEFNYPLDNVHLLGYSLGAHAAGIAGSLTNKKVNRIT
GLDPAGPNFEYAEAPSRLSPDDADFVDVLHTFTRGSPGRSIGIQKPVGHVDIYPNGGTFQ
PGCNIGEAIRVIAERGLGDVDQLVKCSHERSIHLFIDSLLNEENPSKAYRCSSKEAFEKG
LCLSCRKNRCNNLGYEINKVRAKRSSKMYLKTRSQMPYKVFHYQVKIHFSGTESETHTNQ
AFEISLYGTVAESENIPFTLPEVSTNKTYSFLIYTEVDIGELLMLKLKWKSDSYFSWSDW
WSSPGFAIQKIRVKAGETQKKVIFCSREKVSHLQKGKAPAVFVKCHDKSLNKKSG