使用poretools处理fast5格式数据

目前三代测序主要为PacBio公司的SMRT测序技术和Oxford Nanopore Technology的纳米孔测序技术。相比于第一代和第二代测序技术,三代测序技术最为核心的特点就是单分子和长读长。第三代测序下机数据以fast5 (本质上为HDF5格式)格式存储。

HDF5的文件组织:一个HDF5文件就是一个由两种基本数据对象(groups and datasets)存放多种科学数据的容器:

图片.png

图片.png

网上很多教程,此处省略…

1	conda create -p ~/envs/poretools

1	conda search poretools

1	conda install -p ~/envs/poretools poretools=0.6.0

1
2
3

conda activate ~/envs/poretools
# 推出激活命令为:
conda deactivate ~/envs/poretools

1
2
3

poretools fastq test.fast5
#批量提取
poretools fastq *.fast5

1	poretools fasta test.fast5

1	poretools squiggle test.fast5

图片.png