从EBI批量下载数据

ERR地址的规律:差别在于后三个地址,先是ERR number字符串的前6个字符,然后是ERR完整字符串,最后是ERR字符串加上 _1_2

如:

image.png

根据此规律批量从EBI下载数据:

1
for i in $(cat ERR_numlist);do wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/${i:0:6}/$i/$i\_*.fastq.gz; done
  • 首先从excel 表格中提取Lane.accession列,即ERR number列,命名为ERR_numlist,然后上传到服务器;
  • 切记所有从windows上传到服务器的文件最好先进行格式转化,否则由于文件格式,容易报错。 dos2unix ERR_numlist
  • ${i:0:6} :是指输出字符串i的前6个字符, 0 :表示从第几位开始, 6 :表示截取的长度