我们提供:专业可靠的NGS基因测序数据分析服务


VarScan2Somatic


分析肿瘤有对照样本靶向深度测序数据样本somatic突变,SNP与INDEL结果分开于不同文件。


项目简介

Varscan2 somatic 模块是由华盛顿大学基因组研究所开发的开源算法,可用分析肿瘤有对照样本靶向测序数据,是业内最早用于深度测序数据分析的算法,速度快,结果稳定灵敏可靠,被广大肿瘤数据分析者所使用,同类算法中有最高的引用率。通过本公司二次开发,灵敏度高,检测范围更广。通过简单灵活的统一参数界面,输入fastq文件,输出注释好的vcf格式文件,并转换成表格,方便无生物信息基础的人员使用Excel分析。

参考基因组 hg19

平台/数据

Illumina各测序平台、BGISEQ系列产品。Paired-end测序,数据质量Q30>85%,无接头序列。

使用方法

上传测序数据文件至我的云盘,支持fq、fq.gz、fastq、fastq.gz后缀文件,推荐gz压缩格式。参见如何上传文件

1、点击对照文件按钮选择一对正常样本测序文件。例如SRR2496716_1.fastq.gz,SRR2496716_2.fastq.gz,仅支持paired-end成对文件。

2、点击肿瘤文件按钮选择一对肿瘤样本测序文件。例如SRR2496717_1.fastq.gz,SRR2496717_2.fastq.gz,仅支持paired-end成对文件。

3、点击计算参数按钮设置参数

4、点击提交云计算按钮

5、我的云计算下载结果

6、解压后用excel导入或打开filename.somatic.txt/filename.txt进行分析。

本平台采用异步并行计算,可提交1000+计算请求,并可退出网站等待结果。

计算参数说明

target-positions:  选项为区间文件,一般后缀为bed。符合bed格式即可,本平台设CosmicAllGene.bed为默认。CosmicAllGene基因列表
max-depth:1~500000的整数,默认20000,最大测序深度。
min-qual:10~40的整数,默认30,最小碱基质量值,小于的忽略掉。
min-coverage:1~10000的整数,默认50,设置正常样本与肿瘤样本覆盖度之和的最小值。
min-coverage-normal:1~10000的整数,默认50,正常样本最小覆盖度,小于的忽略。
min-coverage-tumor:1~10000的整数,默认40,肿瘤样本最小覆盖度,小于的忽略。
min-var-freq:0~1的小数,默认0.001,肿瘤样本突变最小频率。
min-freq-for-hom:0~1的小数,默认0.75,纯合子最小频率。
normal-purity:0~1的小数,默认1.0,正常样本纯度。
tumor-purity:0~1的小数,默认1.0,肿瘤样本纯度。
p-value:0~1的小数,默认0.99,正常样本p-value值。
somatic-p-value:0~1的小数,默认0.05,somatic p-value值。
是否删除PCR重复的数据: 是否,默认否。

输出结果

输出结果压缩包中包含如下文件

filename.snp.vcf         VarScan2Somatic输出的snp vcf格式突变文件

filename.snp.hg19_multianno.vcf       Annovar注释后snp vcf格式文件

filename.snp.txt         格式转换成tab间隔并添加Hotscore值

filename.snp.somatic.txt         从filename.snp.txt提取标记为somatic的文件

filename.indel.vcf         VarScan2Somatic输出的indel vcf格式突变文件

filename.indel.hg19_multianno.vcf       Annovar注释后indel vcf格式文件

filename.indel.txt         格式转换成tab间隔并添加Hotscore值

filename.indel.somatic.txt         从filename.indel.txt提取标记为somatic的文件