GO termを得る方法はさまざまな方法がありますが,ここでは網羅的な解析についてのみお話します。
データの取得
the Gene Ontology websiteのUnfiltered FilesのUniProt [multispecies] GO Annotations @ EBIをダウンロードする。ちょっと加工して,Uniprot_IDとGO termのセットを作る。
その後Uniprot_IDに相当するタンパク質の配列を
Uniprotからダウンロードする。
ここまで,Uniprot_IDとGOのセットとUniprot_IDに相当するタンパク質配列の2つのファイルができました。
BLASTと変換
後者の配列に対しBLASTを行い,ベストヒットした配列のUniprot_IDからGO termを得る。
統計処理
fisher's exact testで有意なGO termを検出する。