收藏本站 劰载中...网站公告 | 吾爱海洋论坛交流QQ群:835383472

nsidc数据wget批量下载操作说明

[复制链接]
以下资源来自网络,本文仅转载,希望可以帮到有需要的同学们!  I$ o  W* {: Q, M

& C4 `$ @3 z& A9 s$ F9 v  O【前提】 最近有同学问如何批量下载海冰密集度的数据,很久前在家园里了解到了wget,今天以这个为例整理一哈…当然,实现的方式还有很多,这里用的是shell来完成。
: X* H; M3 S6 t- m7 x/ D$ h3 b2 W/ L+ W1 k
A【数据】
A.1 数据名Sea Ice Concentrations from Nimbus-7 SMMR and DMSP SSM/I-SSMISPassive Microwave Data, Version 1
A.2 数据主页 https://nsidc.org/data/nsidc-0051/
数据说明 www.52ocean.cn
表1 数据介绍
9 z" P3 ?: n6 w+ I2 N$ d* V; K
% }' g! X& `/ p  k* z
B 【需求】
B.1 需要下载该数据集海冰的数据,由于数据存放方式是根据时间建立的路径,需要遍历下载。如/n5eil01u.ecs.nsidc.org/PM/NSIDC-0051.001/2000.04.22
. s9 o! U+ H  Q, X1 B
图1 数据存放示意图
C【实现方式】
创建文件$ vim down_sea_ice.sh
根据需求修改代码
2 X0 ~" k: ^$ i$ {8 ~$ V
在终端中$bashdown_sea_ice.sh
# j' \; z- ~7 b# \7 |" n( ^

' ?6 a6 _; e3 W- }/ [
图2 下载示意图

4 E% n! \- F4 w7 T5 H0 q

/ q3 k) f  r2 q% P3 }# B8 \1 L
C.1 使用语言:shell。MATLAB、python等也可,后面介绍。
C.2 思路:通过wget进行下载
利用shell,设置起始时间和结束时间,循环生成每个路径后,再利用wget进行下载。
$ ^! B5 W; Y* }9 |
C.3 代码
  • #
  • # www.52ocean.cn
  • startdate=2000-01-01
  • enddate=2010-12-31
  • sDateTs=`date -j -f "%Y-%m-%d" $startdate "+%s"`
  • eDateTs=`date -j -f "%Y-%m-%d" $enddate "+%s"`
  • dateTs=$sDateTs
  • offset=86400
  • while [ "$dateTs" -le "$eDateTs" ]
  • do
  •           date=`date -j -f "%s" $dateTs "+%Y-%m-%d"`
  •           year=`date -j -f "%s" $dateTs "+%Y"`
  •           month=`date -j -f "%s" $dateTs "+%m"`
  •           day=`date -j -f "%s" $dateTs "+%d"`
  •           printf "wget --load-cookies ~/.urs_cookies --save-cookies ~/.urs_cookies --keep-session-cookies --no-check-certificate --auth-no-challenge=on -r --reject \047index.html*\047 -np -e robots=off www.52ocean.cn\n" $year $month $day $year $month $day
  •          wget --load-cookies ~/.urs_cookies --save-cookies ~/.urs_cookies --keep-session-cookies --no-check-certificate --auth-no-challenge=on  -r --reject 'index.htm;*' -c -np -e robots=off -A "*_n.*" "https://n5eil01u.ecs.nsidc.org/PM/NSIDC-0051.001/${year}.${month}.${day}/"
  •           dateTs=$(($dateTs+$offset))
  • done

  • ) d4 Q. @5 ~" D1 h4 }

9 ^% y' b/ z; H[color=rgb(255, 0, 0) !important]复制代码5 o' l- C2 e; w2 T9 M' s% M5 K, A

& n  l7 u! S+ ^0 A
代码中配置时间,循环时间,生成路径,wget下载【linux】
wget--load-cookies ~/.urs_cookies --save-cookies ~/.urs_cookies--keep-session-cookies --no-check-certificate --auth-no-challenge=on  -r --reject 'index.htm;*' -c -np -erobots=off -A "*_n.*" "https://n5eil01u.ecs.nsidc.org/PM/NSIDC-0051.001/${year}.${month}.${day}/"   
【windows】
wget--http-user=[USERNAME] --http-password=[PASSWORD] --load-cookies mycookies.txt--save-cookies mycookies.txt --keep-session-cookies--no-check-certificate--auth-no-challenge -r --reject "index.html*" –c-np -e robots=off -A "*_n.*""https://n5eil01u.ecs.nsidc.org/PM/NSIDC-0051.001/${year}.${month}.${day}/"   
基本参考冰雪中心给的下载方式(下面有网址),额外加了
1. -c:断点
2. -A "*_n.*" :通配符,可下载北极的数据,见图1中的蓝色方框。若只下载bin文件,则改为-A "*_n.bin"
3. www.52ocean.cn${year}.${month}.${day}/路径用变量传入
4 Y; ~$ E7 n4 Q4 }. A( J
参考网址:https://nsidc.org/support/faq/what-options-are-available-bulk-downloading-data-https-earthdata-login-enabled

: D* |2 g; ^; Z& d4 {
/ l% f" J* v' w" c4 F1 [
% W& j0 E1 P) S$ A4 n* U0 b0 y$ A
图3 程序示意图
C.4 遇到的问题:
最初使用了绝对路径,发现出现了404错误,排查发现是
文件名是nt_20100105_f17_v1.1_n.bin。之前以为‘f17‘是不变的。
下面是错误记录
1 r7 w' z; t! p

4 h6 J4 F# P) _4 U4 @' v* w* V3 x
【报错】 下载2000年的数据发现404报错
wget --load-cookies ~/.urs_cookies --save-cookies~/.urs_cookies --keep-session-cookies --no-check-certificate--auth-no-challenge=on -r --reject 'index.html*' -np -e robots=offwww.52ocean.cn
--2019-06-11 16:12:15-- www.52ocean.cn
Resolving n5eil01u.ecs.nsidc.org... 128.138.97.102
Connecting to n5eil01u.ecs.nsidc.org|128.138.97.102|:443...connected.
HTTP request sent, awaiting response... 404 Not Found
2019-06-11 16:12:17 ERROR 404: Not Found.
【原因】 文件名发生变化 变成了f07 不是 n07
nt_20100105_f17_v1.1_n.bin
【解决思路】
1 找到f编号的规则
或者 变通配符

* _. ^$ }6 O" O( F" F
参考
a 通配符www.52ocean.cn
a2 wget 说明,与a.1相似www.52ocean.cn
b 数据下载说明:www.52ocean.cn
. b! h/ B9 q& [+ O4 h* {
同时我也记录在了气象家园的网上 www.52ocean.cn

- C& [9 }9 ]! V5 Y7 F1 S
回复

举报 使用道具

相关帖子

全部回帖
暂无回帖,快来参与回复吧
懒得打字?点击右侧快捷回复 【吾爱海洋论坛发文有奖】
您需要登录后才可以回帖 登录 | 立即注册
admin
活跃在2026-4-23
快速回复 返回顶部 返回列表