写这篇博客,可真是太无奈了,因为庙小,自己又是课题组用到这些东西唯一怨种。用到的路径均是绝对路径,这也是我的一向风格。
首先本博客是参考前人的,所以有一样是正常的
1、批量序列合并和重命名,本命令是遍历所有你的前端和后端fq文件,相信大家的不会只有一个fq文件。
for i in `tail -n+1 /home/user/dna_data/design.csv`; do
vsearch --fastq_mergepairs /home/user/dna_data/${i}.R1.fq
--reverse /home/user/dna_data/${i}.R2.fq
--fastqout /home/user/dna_merge/${i}.merged.fq
--relabel ${i}
done
design.csv:文件一定是要utf-8,而且从window上传进Linux一定要从新另存为Linux的文件,不然容易出错
tail -n+1:指的是从第一行开始reading文件也可以使用cat替换
${i}:你文件名的例如:CK1.R1.fq中的CK1
2、当所有序列合并以后,再将所有的序列文件整合到一个文件中
cat /home/user/dna_merge/*.merged.fq > /home/user/dna_merge/all.fq
3、完成切除引物与质控
vsearch --fastx_filter /home/user/dna_merge/all.fq
--fastq_stripleft 29 --fastq_stripright 18
--fastq_maxee_rate 0.01
--fastaout /home/user/vsearch_quality_filter/filtered.fa
4、去冗余
vsearch --derep_fulllength /home/user/vsearch_quality_filter/filtered.fa
--minuniquesize 10 --sizeout --relabel Uni_
--output /home/user/vsearch_quality_filter/dereplicate/uniques.fa
5、聚类
vsearch --cluster_fast /home/user/vsearch_quality_filter/dereplicate/uniques.fa
--id 0.97
--centroids /home/user/vsearch_quality_filter/cluster/otu.fa
--relabel OTU_
--sizeout
6、去噪
vsearch --cluster_unoise /home/user/vsearch_quality_filter/dereplicate/uniques.fa
--minsize 10
--centroids /home/user/vsearch_quality_filter/denoise/asv.fa
--relabel ASV_
--sizeout
7、去嵌合体
# otu去嵌合体: 去嵌合体有两种方法:一是基于参考数据库,一是基于无参考数据库的 denovo 方法。
(1)vsearch --uchime3_denovo /home/user/vsearch_quality_filter/cluster/otu.fa
--nonchimeras /home/user/vsearch_quality_filter/denovo_chimera_detect/otus.fa
(2)vsearch --uchime_ref /home/user/vsearch_quality_filter/cluster/otu.fa
--db /home/user/vsearch_quality_filter/database/rdp_16s_v18.fa
--nonchimeras /home/user/vsearch_quality_filter/denovo_chimera_detect/otus.fa
8、生成特征表
vsearch --usearch_global /home/user/vsearch_quality_filter/filtered.fa
--db /home/user/vsearch_quality_filter/denovo_chimera_detect/otus.fa
--id 0.97
--threads 4
--otutabout /home/user/vsearch_quality_filter/otu_table/otu_tab.txt
9、物种注释
该步骤使用usearch进行注释,首先在USEARCH下载 (drive5.com)
在Linux里解压,不用命令也可以解压,右键Extract Here然后把解压的换名,例如:usearch11.0.667_i86linux32换成usearch,这样是更方便使用,然后把解压的usearch 移动到/usr/bin,依然是右键然后Rename。
为什么要这样做呢,因为是sintax官网说的。
命令:
/usr/bin/usearch11 --sintax /home/user/vsearch_quality_filter/denovo_chimera_detect/otus.fa
--db /home/user/vsearch_quality_filter/database/rdp_16s_v18.fa
--tabbedout /home/user/vsearch_quality_filter/taxonomic_classification/16S1_otus.sintax
--strand both --sintax_cutoff 0.8
至于我为什么要用usearch而不用vsearch进行物种注释,是因为使用得出的注释表是空的,如果自己安装有vsearch可以把上述命令的usearch11替换成vsearch。失败案例如下图:
至于说烂电脑也能物种注释呢因为vsearch我用RDP库是失败的,然后换成SILVA库更不行,会在虚拟机中死机。
最后:
很感谢“微生物“Xiyao”,”热情似火“,”Pinocchio“的解疑。
参考链接:
病原微生物扩增子数据分析实战(三):vsearch软件鉴定物种组成 - 知乎 (zhihu.com)
16S扩增子之Vsearch使用 - 简书 (jianshu.com)
扩增子分析流程 —— 数据处理(vsearch)_vsearch安装-CSDN博客
使用vsearch进行OTU聚类实战 - 知乎 (zhihu.com)