本文へスキップ


AUGUSTAS 遺伝子予測ツール

インストール

 まずここでダウンロードしてくる。回答してファイル内のsrcに移動後,makeでインストールする。
私の場合以下のようなエラーがでた。
 

ld: library not found for -lcrt0.o
collect2: ld returned 1 exit status
make: *** [augustus] Error 1

調べるといくつかのキーワードが・・・gccとかicc・・コンパイラが問題?・・まぁ素人には意味わからん。

でも解決策はあって,srcファイル内のMakefile内に書かれている-staticの文字(私やった時は2か所あった)
を取り除いて再度makeをたたけばきちんとインストールされる。

方法


ココを参考にしてます。

intron hintsの取得


イントロン情報を得るため,tophatでmappingします。
indexの作成
 bowtie2-build genome.masked.fa genome_database

Mapping
 tophat2 -p 4 genome_database rnaseq_R1.fastq rnaseq_R2.fastq


Filtering raw alignments
 samtools sort -n accepted_hits.bam accepted_hits.s

filterBam --uniq --paired --in accepted_hits.s.bam --out accepted_hits.sf.bam

samtools view -H output_directory/accepted_hits.sf.bam > header.txt

sortする
 samtools sort accepted_hits.sf.bam both.ssf

イントロン情報を抽出
 bam2hints --intronsonly --in=both.ssf.bam --out=hints.gff

参考サイト


CDSpart hintの取得


参考サイト




Nonexonpart hintの取得



参考サイト



parametersを準備


[SOURCES]
M RM E W

exonpart 1 .992 M 1 1e+100 RM 1 1 E 1 1 W 1 1.005
intron 1 .34 M 1 1e+100 RM 1 1 E 1 1e5 W 1 1
CDSpart 1 1 0.985 M 1 1e+100 RM 1 1 E 1 1 W 1 1
UTRpart 1 1 0.985 M 1 1e+100 RM 1 1 E 1 1 W 1 1
nonexonpart 1 1 M 1 1e+100 RM 1 1.01 E 1 1 W 1 1

Augustusの実行

 augustus --species=yourSpecies --extrinsicCfgFile=extrinsic.cfg --alternatives-from-evidence=true
--hintsfile=hints.gff --allow_hinted_splicesites=atac --introns=on --genemodel=complete genome.fa > aug1.out


パラメーターを補正

 gff2gbSmallDNA.pl both.gff genome.fa 10000 both.gb


 optimize_augustus.pl --species=yourSpecies genes.gb.train


 etraining --species=yourSpecies genes.gb.train



Augustusの再実行

 augustus --species=yourSpecies --extrinsicCfgFile=extrinsic.cfg --alternatives-from-evidence=true
--hintsfile=hints.gff --allow_hinted_splicesites=atac --introns=on --genemodel=complete genome.fa > aug1.out



inserted by FC2 system