1.mapping
Preparation for mapping
bowtie2-build reference_genome.fasta
reference_genome.fasta |
Mapping
bowtie2 [options]* -1 data_R1.fasta -2 data_R2.fasta >
output.sam |
使い方の詳細
2.samtoolsを用いて,sam fileをbam fileに変換します。
samtools view -bS aln.sam> aln.bam |
samtoolsの使い方でも紹介しました。
3.Calling SNPs
これを行う前に,samtoolsをダウンロードした時に一緒にフォルダに入っているbcftoolsをインストールします。makeだけでいけたと思います。その後パスを通して以下のコマンドを打てばOKです。
samtools mpileup -uf ref.fasta aln1.bam | bcftools view -bvcg - > var.raw.bcf |
bcftools view var.raw.bcf | vcfutils.pl varFilter -D100 > var.flt.vcf |
-D100のオプションはかなりきつい条件です。カバレッジ100と言う意味なので,自分がどのくらいのカバレッジで
リシークエンスしたのか,考えて変えていってください。
4. SNPsの場所の配列確認
samtools mpileup -l var.flt.vcf -f ref.fasta aln1.bam> target.txt |
記号 |
記号の意味 |
. |
純鎖 リファレンスと一致 |
, |
逆鎖 リファレンスと一致 |
A, C, G, T, N |
純鎖 リファレンスと不一致 |
a, c, g, t, n |
逆鎖 リファレンスと不一致 |
+数字(数字と同数のACGTNまたはacgtn) |
挿入部位
,+1a: 逆鎖に"a"が1塩基挿入" |
-数字(数字と同数のACGTNまたはacgtn) |
欠損部位
+1A: 純鎖"A"が1塩基欠損 |
^とその後の一文字 |
リードの開始位置とマップ品質値 ^~は"~"文字がASCIIコードの126番目なので、126-33=93がマップ品質値。 |
$ |
リードの終了 |
* |
短い欠損の最中 近傍に2以上の欠損があり、近傍の欠損に含まれる場合。例えば-2ATの次の位置には"*"が含まれる |
< > |
長い欠損 |
参考資料
samtools manual