当前位置: 首页 > 工具软件 > Singularity > 使用案例 >

HiC-Pro的Singularity简明使用指南

谭奕
2023-12-01

关于原理部分和更详细的介绍,见HiC-Pro: Hi-C数据预处理高效工具, 这里只介绍如何快速使用Singularity的HiC-Pro进行数据分析。

关键内容就是,config-hicpro.txt 里的文件路径信息都必须是绝对路径,否则默认都位于annotation目录下。切记,切记,切记。

第零步: Singularity的HiC-Pro镜像下载,

# 下载
mkdir -p /opt/biosoft/HiC-Pro 
cd /opt/biosoft/HiC-Pro 
wget https://zerkalo.curie.fr/partage/HiC-Pro/singularity_images/hicpro_latest_ubuntu.img
# 使用
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img HiC-Pro -h

第一步:建立输入数据文件夹, 数据不能是软连接形式,只能是复制或者移动

mkdir -p fastq/xxx
cp xxx_R1.fastq.gz xxx_R2.fastq.gz  fastq/xxx/
# 如果有多个样本
mkdir -p fastq/yyy
cp yyy_R1.fastq.gz yyy_R2.fastq.gz  fastq/yyy/

第二步:创建参考数据库,需要修改ENZYME

ENZYME=DpnII
# build reference
mkdir reference
mv 你的参考序列.fasta  reference/genome.fa
# enzyme site
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img \
    /usr/local/bin/HiC-Pro_2.11.4/bin/utils/digest_genome.py -r $ENZYME \
    -o reference/genome_${ENZYME}.bed reference/genome.fa
# genome size
seqkit fx2tab -nl reference/genome.fa | awk '{print $1"\t"$2}' > reference/genome.chrom.size
# bowtie/2.3.4.3
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img \
    bowtie2-build --threads 60 reference/genome.fa reference/genome

第三步: 复制配置文件并修改

# config
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img \
  cp /usr/local/bin/HiC-Pro_2.11.4/config-hicpro.txt  config-hicpro.txt

修改其中的如下项,

  • N_CPU=80 线程数
  • BOWTIE2_IDX_PATH: 必须是绝对路径,例如 /home/xzg/reference
  • REFERENCE_GENOME=genome
  • GENOME_SIZE=必须是绝对路径, 例如/home/xzg/reference/genome.chrom.size
  • GENOME_FRAGMENT= 必须是绝对路径 例如/home/xzg/reference/genome_DpnII.bed
  • LIGATION_SITE=根据实际酶切位点来, 例如DpnII和MBoI都是GATCGATC

第四步:运行

singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img HiC-Pro -i fastq -o results -c config-hicpro.txt ```
 类似资料: