烂电脑也能利用vsearch+usearch注释物种和out_table, 摆脱qiime2.

写这篇博客,可真是太无奈了,因为庙小,自己又是课题组用到这些东西唯一怨种。用到的路径均是绝对路径,这也是我的一向风格。

首先本博客是参考前人的,所以有一样是正常的

1、批量序列合并和重命名,本命令是遍历所有你的前端和后端fq文件,相信大家的不会只有一个fq文件。
for i in  `tail -n+1 /home/user/dna_data/design.csv`; do 
vsearch --fastq_mergepairs /home/user/dna_data/${i}.R1.fq
--reverse /home/user/dna_data/${i}.R2.fq
--fastqout /home/user/dna_merge/${i}.merged.fq
--relabel ${i}
done

design.csv:文件一定是要utf-8,而且从window上传进Linux一定要从新另存为Linux的文件,不然容易出错

tail -n+1:指的是从第一行开始reading文件也可以使用cat替换

${i}:你文件名的例如:CK1.R1.fq中的CK1

2、当所有序列合并以后,再将所有的序列文件整合到一个文件中

cat /home/user/dna_merge/*.merged.fq > /home/user/dna_merge/all.fq

3、完成切除引物与质控
vsearch --fastx_filter /home/user/dna_merge/all.fq                                   
  --fastq_stripleft 29 --fastq_stripright 18
  --fastq_maxee_rate 0.01
  --fastaout /home/user/vsearch_quality_filter/filtered.fa

4、去冗余
vsearch --derep_fulllength /home/user/vsearch_quality_filter/filtered.fa
  --minuniquesize 10 --sizeout --relabel Uni_
  --output /home/user/vsearch_quality_filter/dereplicate/uniques.fa

5、聚类
vsearch --cluster_fast /home/user/vsearch_quality_filter/dereplicate/uniques.fa
--id 0.97
--centroids /home/user/vsearch_quality_filter/cluster/otu.fa
--relabel OTU_
--sizeout

6、去噪
vsearch --cluster_unoise /home/user/vsearch_quality_filter/dereplicate/uniques.fa
--minsize 10
--centroids /home/user/vsearch_quality_filter/denoise/asv.fa
--relabel ASV_
--sizeout

7、去嵌合体
# otu去嵌合体: 去嵌合体有两种方法:一是基于参考数据库,一是基于无参考数据库的 denovo 方法。
(1)vsearch --uchime3_denovo /home/user/vsearch_quality_filter/cluster/otu.fa
--nonchimeras /home/user/vsearch_quality_filter/denovo_chimera_detect/otus.fa
(2)vsearch --uchime_ref /home/user/vsearch_quality_filter/cluster/otu.fa
--db /home/user/vsearch_quality_filter/database/rdp_16s_v18.fa
--nonchimeras /home/user/vsearch_quality_filter/denovo_chimera_detect/otus.fa

8、生成特征表
vsearch --usearch_global /home/user/vsearch_quality_filter/filtered.fa
--db /home/user/vsearch_quality_filter/denovo_chimera_detect/otus.fa
--id 0.97
--threads 4
--otutabout /home/user/vsearch_quality_filter/otu_table/otu_tab.txt

9、物种注释

该步骤使用usearch进行注释,首先在USEARCH下载 (drive5.com)

在Linux里解压,不用命令也可以解压,右键Extract Here然后把解压的换名,例如:usearch11.0.667_i86linux32换成usearch,这样是更方便使用,然后把解压的usearch 移动到/usr/bin,依然是右键然后Rename。

为什么要这样做呢,因为是sintax官网说的。

命令:

/usr/bin/usearch11 --sintax /home/user/vsearch_quality_filter/denovo_chimera_detect/otus.fa
 --db /home/user/vsearch_quality_filter/database/rdp_16s_v18.fa
 --tabbedout /home/user/vsearch_quality_filter/taxonomic_classification/16S1_otus.sintax
 --strand both --sintax_cutoff 0.8

至于我为什么要用usearch而不用vsearch进行物种注释,是因为使用得出的注释表是空的,如果自己安装有vsearch可以把上述命令的usearch11替换成vsearch。失败案例如下图:

至于说烂电脑也能物种注释呢因为vsearch我用RDP库是失败的,然后换成SILVA库更不行,会在虚拟机中死机。

最后: 

很感谢“微生物“Xiyao”,”热情似火“,”Pinocchio“的解疑。

参考链接:

病原微生物扩增子数据分析实战(三):vsearch软件鉴定物种组成 - 知乎 (zhihu.com)

16S扩增子之Vsearch使用 - 简书 (jianshu.com)

扩增子分析流程 —— 数据处理(vsearch)_vsearch安装-CSDN博客

使用vsearch进行OTU聚类实战 - 知乎 (zhihu.com)