635 字
3 分钟
cngb数据下载

cngb数据库中的数据有公开数据和需要申请权限才能下载的,这里以公开数据举例

1

例如:ARTISTA: Axolotl Regenerative Telencehpalon Interpretation via Spatiotemporal Transcriptomic Atlas - STOMICS DataBase

在网页中直接下载目前是无法下载的,目前不知道是什么问题,可能是http/https的下载权限比较严格,ftp下载匿名访问是没有问题的

PixPin_2025-09-10_17-23-51

以这个文件链接为例:

文件下载链接
https://ftp.cngb.org/pub/SciRAID/stomics/STDS0000056/stomics/10DPI_1.h5ad

在Linux环境中下载指令如下:

Terminal window
wget -c -r -nH -nd -P ./ ftp://ftp.cngb.org/pub/SciRAID/stomics/STDS0000056/stomics/10DPI_1.h5ad --ftp-user=anonymous --ftp-password=anonymous@example.com
  1. -c--continue
    • 作用:启用断点续传。如果下载中断,重新运行此命令会从上次中断的位置继续下载,而不是重新开始。
    • 适用场景:大文件下载时特别有用,避免因网络问题导致重复下载。
  2. -r--recursive
    • 作用:递归下载,即不仅下载指定文件,还会下载该目录下的所有文件和子目录(如果适用)。
    • 适用场景:如果你想下载整个目录而不仅仅是单个文件,可以加上这个参数。但在这个命令中,由于指定的是具体文件(10DPI_1.h5ad),-r 可能不会产生额外效果。
  3. -nH--no-host-directories
    • 作用:下载时不创建以服务器主机名(如 ftp.cngb.org)命名的目录。
    • 示例:
      • 默认行为wget 可能会创建一个 ftp.cngb.org 文件夹,然后把文件放在里面。
      • 使用 -nH:直接下载到当前目录(或 -P 指定的目录),不创建额外层级。
  4. -nd--no-directories
    • 作用:不保留远程服务器的目录结构,所有文件都直接下载到目标目录(-P 指定的目录或当前目录)。
    • 示例:
      • 默认行为wget 会尝试在本地重建远程目录结构(如 pub/SciRAID/stomics/...)。
      • 使用 -nd:所有文件直接下载到目标目录,不创建子目录。
  5. -P ./--directory-prefix=./
    • 作用:指定下载文件的存储目录。./ 表示当前目录(也可以写绝对路径,如 -P /home/user/data)。
    • 适用场景:如果你想下载到特定目录而不是当前工作目录,可以用这个参数。
  6. ftp://ftp.cngb.org/pub/SciRAID/stomics/STDS0000056/stomics/10DPI_1.h5ad
    • 作用:指定要下载的文件的 FTP 地址。
  7. --ftp-user=anonymous
    • 作用:指定 FTP 登录用户名。anonymous 是公共 FTP 服务器的默认匿名用户。
  8. --ftp-password=anonymous@example.com
    • 作用:指定 FTP 登录密码。对于匿名 FTP,通常可以随便填一个邮箱格式的字符串(如 anonymous@example.com),有些服务器会检查但大多数不会

参考#

  1. 可以使用Aspera从CNGBdb数据库高速下载fastq测序数据啦~ - 知乎
cngb数据下载
https://fuwari.cbba.top/posts/cngb数据下载/
作者
Chen_Feng
发布于
2025-09-10
许可协议
CC BY-NC-SA 4.0