TopHatでゲノムDNAに対してRNA-Seqをマッピングした結果を入力して、既知のアノテーション情報に依存しない遺伝子構造予測とその発現量情報を出力するツール。私は,発現量解析は自分の方法でやりたいので,cufflinksは遺伝子構造予測にしか用いていない。マッピングしただけの状態だとエキソンの場所はわかるのですが,どのような遺伝子の構成しているのか分かりません。そこでcufflinks(パイプライン名)のcufflinks(プログラム名)を用います。cuffliksはGT-AGルールに基づきtophatで予測したエクソン部分の末端配列から転写方向を予測しエクソンの島を繋ぎ遺伝子構造を予測します。
トランスクリプトをcufflinksでアセンブルします。
cfflinks -p 8 accepted_hits.bam |
-p コア数
複数サンプルがある場合は,アセンブルした結果をcuffmergeでmergeします。
cuffmerge -p 8 transcript_assemble.txt |
transcript_assemble.txt:transcripts.gtfのファイル場所を絶対パスで書かれたテキストファイル
mergeされた情報の元に,ゲノム配列にmapされたリードをcuffquantで定量する。
cuffcompare -r ref.gtf -i input.gtf |
既存の遺伝子座標データがある場合は,cuffmergeで得られたデータと比較することも可能です。だたし,ref.gtfをcuffcompareで読み込める形式にしなくてはなりません。
cuffquant -p 8 merged.gtf <aligned_reads.(sam/bam)> |
最後に,cuffdiffで発現変動している遺伝子を検出します。
cuffdiff -p 8 <transcripts.gtf> <sample1_rep1.(sam/bam/cxb)> <sample1_rep2.(sam/bam/cxb)> <sample2_rep1.(sam/bam/cxb)> <sample2_rep2.(sam/bam/cxb)> |
manual
Cufflinks : NGS Surfer's Wiki
Wolf Ears ≫
Tophat・Cufflinksを用いた遺伝子発現解析の方法 (3)
Wolf Ears ≫
Tophat・Cufflinksを用いた遺伝子発現解析の方法 (4)