本文へスキップ


SNPの検出Calling SNPs


方法

1.mapping

Preparation for mapping
  bowtie2-build reference_genome.fasta reference_genome.fasta

Mapping
 bowtie2 [options]* -1 data_R1.fasta -2 data_R2.fasta > output.sam
使い方の詳細


2.samtoolsを用いて,sam fileをbam fileに変換します。

 samtools view -bS aln.sam> aln.bam
samtoolsの使い方でも紹介しました。


3.Calling SNPs

これを行う前に,samtoolsをダウンロードした時に一緒にフォルダに入っているbcftoolsをインストールします。makeだけでいけたと思います。その後パスを通して以下のコマンドを打てばOKです。
 samtools mpileup -uf ref.fasta aln1.bam | bcftools view -bvcg - > var.raw.bcf
 bcftools view var.raw.bcf | vcfutils.pl varFilter -D100 > var.flt.vcf
-D100のオプションはかなりきつい条件です。カバレッジ100と言う意味なので,自分がどのくらいのカバレッジで
リシークエンスしたのか,考えて変えていってください。

4. SNPsの場所の配列確認

 samtools mpileup -l var.flt.vcf -f ref.fasta aln1.bam> target.txt

記号  記号の意味
純鎖 リファレンスと一致
 , 逆鎖 リファレンスと一致
A, C, G, T, N  純鎖 リファレンスと不一致
a, c, g, t, n  逆鎖 リファレンスと不一致
+数字(数字と同数のACGTNまたはacgtn)  挿入部位
,+1a: 逆鎖に"a"が1塩基挿入"
-数字(数字と同数のACGTNまたはacgtn)  欠損部位
+1A: 純鎖"A"が1塩基欠損
 ^とその後の一文字  リードの開始位置とマップ品質値 ^~は"~"文字がASCIIコードの126番目なので、126-33=93がマップ品質値。
 $  リードの終了
 *  短い欠損の最中 近傍に2以上の欠損があり、近傍の欠損に含まれる場合。例えば-2ATの次の位置には"*"が含まれる
 < >  長い欠損


参考資料

samtools manual
inserted by FC2 system