ERR地址的规律:差别在于后三个地址,先是ERR number字符串的前6个字符,然后是ERR完整字符串,最后是ERR字符串加上 _1
或 _2
如:
根据此规律批量从EBI下载数据:
1 | for i in $(cat ERR_numlist);do wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/${i:0:6}/$i/$i\_*.fastq.gz; done |
- 首先从excel 表格中提取Lane.accession列,即ERR number列,命名为ERR_numlist,然后上传到服务器;
- 切记所有从windows上传到服务器的文件最好先进行格式转化,否则由于文件格式,容易报错。
dos2unix ERR_numlist
${i:0:6}
:是指输出字符串i的前6个字符,0
:表示从第几位开始,6
:表示截取的长度