产品服务


多种多样,强大的云计算项目

VarScan2


无对照肿瘤组织(Tumor)单样本二代测序原始数据 SNPs and indels深度计算。


项目简介

VarScan2是由华盛顿大学基因组研究所开发的开源算法,可用分析单样本靶向测序数据,是业内最早用于深度测序数据分析的算法,速度快,结果稳定灵敏可靠,被广大肿瘤数据分析者所喜欢,同类算法中有最高的引用率。可用于单样本多重pcr扩增子,探针捕获测序数据分析。通过本公司二次开发,灵敏度高,检测范围更广。通过简单灵活的统一参数界面,无需命令行操作。输入fastq文件,输出注释好的vcf格式文件,并转换成表格,方便无生物信息基础的人员使用Excel分析。

参考基因组 hg19

平台/数据

Illumina、Ion Torrent、BGISEQ测序平台。Paired-end、Single-read测序,数据质量Q30>85%,无接头序列。

使用方法

上传测序数据文件至我的云盘,支持fq、fq.gz、fastq、fastq.gz后缀文件,推荐gz压缩格式。参见如何上传文件

1、点击选择文件按钮选择一对Paired-end样本测序文件或一个Single-read,Paired-end之一数据文件。如果两个文件必须是paired-end成对文件,例如SRR2496717_1.fastq.gz,SRR2496717_2.fastq.gz。

2、点击计算参数按钮设置参数

3、点击提交云计算按钮

4、我的云计算下载结果

5、解压后用excel导入或打开filename.cosmic.txt/filename.txt进行分析。

本平台采用异步并行计算,可提交1000+计算请求,并可退出网站等待结果。

计算参数说明

target-positions:  选项为区间文件,一般后缀为bed。符合bed格式即可,本平台设CosmicAllGene.bed为默认。CosmicAllGene基因列表
min-qual:10~40的整数,默认30,最小碱基质量值,小于的忽略。
max-depth:1~500000的整数,默认20000,最大测序深度。
min-coverage:1~10000的整数,默认100,最小测序深度,小于的忽略。
min-var:1~1000的整数,默认2,突变最小的reads支持数。
min-var-freq:0~1的小数,默认0.001,突变最小的频率。
p-value:0~1的小数,默认0.05,突变最大p-value值。
是否删除重复的数据:是否,默认否。

输出结果

输出结果压缩包中包含如下文件

filename.snp.vcf         VarScan2输出的snp vcf格式文件

filename.snp.hg19_multianno.vcf       Annovar注释后snp vcf格式文件

filename.snp.txt         格式转换成tab间隔并添加Hotscore值

filename.snp.cosmic.txt         从filename.snp.txt提取cosmic数据库中有记录的文件

filename.indel.vcf         VarScan2输出的indel vcf格式文件

filename.indel.hg19_multianno.vcf       Annovar注释后indel vcf格式文件

filename.indel.txt         格式转换成tab间隔并添加Hotscore值

filename.indel.cosmic.txt         从filename.indel.txt提取cosmic数据库中有记录的文件

参考文献

Koboldt DC, et al. VarScan 2: somatic mutation and copy number alteration discovery in cancer by exome sequencing. Genome Res. 2012; 22: 568-576.