curl
利用URL规则在命令行下工作的文件传输工具
补充说明
curl命令 是一个利用URL规则在命令行下工作的文件传输工具。它支持文件的上传和下载,所以是综合传输工具,但按传统,习惯称curl为下载工具。作为一款强力工具,curl支持包括HTTP、HTTPS、ftp等众多协议,还支持POST、cookies、认证、从指定偏移处下载部分文件、用户代理字符串、限速、文件大小、进度条等特征。做网页处理流程和数据检索自动化,curl可以祝一臂之力。
语法
代码语言:javascript复制curl [选项] [参数]
选项
- -a/–append:上传文件时,附加到目标文件
- -A/–user-agent:设置用户代理发送给服务器
- -anyauth:可以使用“任何”身份验证方法
- -b/–cookie:cookie字符串或文件读取位置
- –basic:使用HTTP基本验证
- -B/–use-ascii:使用ASCII /文本传输
- -c/–cookie-jar:操作结束后把cookie写入到这个文件中
- -C/–continue-at:断点续传
- -d/–data:HTTP POST方式传送数据
- –data-ascii:以ascii的方式post数据
- –data-binary:以二进制的方式post数据
- –negotiate:使用HTTP身份验证
- –digest:使用数字身份验证
- –disable-eprt:禁止使用EPRT或LPRT
- –disable-epsv:禁止使用EPSV
- -D/–dump-header:把header信息写入到该文件中
- –egd-file:为随机数据(SSL)设置EGD socket路径
- –tcp-nodelay:使用TCP_NODELAY选项
- -e/–referer:来源网址
- -E/–cert:客户端证书文件和密码 (SSL)
- –cert-type:证书文件类型 (DER/PEM/ENG) (SSL)
- –key:私钥文件名 (SSL)
- –key-type:私钥文件类型 (DER/PEM/ENG) (SSL)
- –pass:私钥密码 (SSL)
- –engine:加密引擎使用 (SSL). “–engine list” for list
- –cacert:CA证书 (SSL)
- –capath:CA目录 (made using c_rehash) to verify peer against (SSL)
- –ciphers:SSL密码
- –compressed:要求返回是压缩的形势 (using deflate or gzip)
- –connect-timeout:设置最大请求时间
- –create-dirs:建立本地目录的目录层次结构
- –crlf:上传是把LF转变成CRLF
- -f/–fail:连接失败时不显示http错误
- –ftp-create-dirs:如果远程目录不存在,创建远程目录
- –ftp-method [multicwd/nocwd/singlecwd]:控制CWD的使用
- –ftp-pasv:使用 PASV/EPSV 代替端口
- –ftp-skip-pasv-ip:使用PASV的时候,忽略该IP地址
- –ftp-ssl:尝试用 SSL/TLS 来进行ftp数据传输
- –ftp-ssl-reqd:要求用 SSL/TLS 来进行ftp数据传输
- -F/–form:模拟http表单提交数据
- –form-string:模拟http表单提交数据
- -g/–globoff:禁用网址序列和范围使用{}和[]
- -G/–get:以get的方式来发送数据
- -H/–header:自定义头信息传递给服务器
- –ignore-content-length:忽略的HTTP头信息的长度
- -i/–include:输出时包括protocol头信息
- -I/–head:只显示请求头信息
- -j/–junk-session-cookies:读取文件进忽略session cookie
- –interface:使用指定网络接口/地址
- –krb4:使用指定安全级别的krb4
- -k/–insecure:允许不使用证书到SSL站点
- -K/–config:指定的配置文件读取
- -l/–list-only:列出ftp目录下的文件名称
- –limit-rate:设置传输速度
- –local-port:强制使用本地端口号
- -m/–max-time:设置最大传输时间
- –max-redirs:设置最大读取的目录数
- –max-filesize:设置最大下载的文件总量
- -M/–manual:显示全手动
- -n/–netrc:从netrc文件中读取用户名和密码
- –netrc-optional:使用 .netrc 或者 URL来覆盖-n
- –ntlm:使用 HTTP NTLM 身份验证
- -N/–no-buffer:禁用缓冲输出
- -o/–output:把输出写到该文件中
- -O/–remote-name:把输出写到该文件中,保留远程文件的文件名
- -p/–proxytunnel:使用HTTP代理
- –proxy-anyauth:选择任一代理身份验证方法
- –proxy-basic:在代理上使用基本身份验证
- –proxy-digest:在代理上使用数字身份验证
- –proxy-ntlm:在代理上使用ntlm身份验证
- -P/–ftp-port:使用端口地址,而不是使用PASV
- -q:作为第一个参数,关闭 .curlrc
- -Q/–quote:文件传输前,发送命令到服务器
- -r/–range:检索来自HTTP/1.1或FTP服务器字节范围
- –range-file:读取(SSL)的随机文件
- -R/–remote-time:在本地生成文件时,保留远程文件时间
- –retry:传输出现问题时,重试的次数
- –retry-delay:传输出现问题时,设置重试间隔时间
- –retry-max-time:传输出现问题时,设置最大重试时间
- -s/–silent:静默模式。不输出任何东西
- -S/–show-error:显示错误
- –socks4:用socks4代理给定主机和端口
- –socks5:用socks5代理给定主机和端口
- –stderr:
- -t/–telnet-option:Telnet选项设置
- –trace:对指定文件进行debug
- –trace-ascii:Like --跟踪但没有hex输出
- –trace-time:跟踪/详细输出时,添加时间戳
- -T/–upload-file:上传文件
- –url:Spet URL to work with
- -u/–user:设置服务器的用户和密码
- -U/–proxy-user:设置代理用户名和密码
- -w/–write-out [format]:什么输出完成后
- -x/–proxy:在给定的端口上使用HTTP代理
- -X/–request:指定什么命令
- -y/–speed-time:放弃限速所要的时间,默认为30
- -Y/–speed-limit:停止传输速度的限制,速度时间
实例
文件下载
curl命令可以用来执行下载、发送各种HTTP请求,指定HTTP头部等操作。如果系统没有curl可以使用yum install curl安装,也可以下载安装。curl是将下载文件输出到stdout,将进度信息输出到stderr,不显示进度信息使用–silent选项。
将下载文件输出到终端,所有下载的数据都被写入到stdout:
代码语言:javascript复制curl URL --silent
使用选项-O将下载的数据写入到文件,必须使用文件的绝对地址:
代码语言:javascript复制curl http://example.com/text.iso --silent -O
选项-o将下载数据写入到指定名称的文件中,并使用–progress显示进度条:
代码语言:javascript复制curl http://example.com/test.iso -o filename.iso --progress
输出示例:######################################### 100.0%
不输出错误和进度信息
-s 参数将不输出错误和进度信息。
代码语言:javascript复制curl -s https://www.example.com
上面命令一旦发生错误,不会显示错误信息。不发生错误的话,会正常显示运行结果。
如果想让 curl 不产生任何输出,可以使用下面的命令。
代码语言:javascript复制curl -s -o /dev/null https://google.com
断点续传
curl能够从特定的文件偏移处继续下载,它可以通过指定一个便宜量来下载部分文件:
代码语言:javascript复制curl URL/File -C 偏移量
代码语言:javascript复制偏移量是以字节为单位的整数,如果让curl自动推断出正确的续传位置使用-C -:
curl -C -URL
使用curl设置参照页字符串
参照页是位于HTTP头部中的一个字符串,用来表示用户是从哪个页面到达当前页面的,如果用户点击网页A中的某个连接,那么用户就会跳转到B网页,网页B头部的参照页字符串就包含网页A的URL。
使用–referer选项指定参照页字符串:
代码语言:javascript复制curl --referer http://www.google.com http://wangchujiang.com
用curl设置用户代理字符串
有些网站访问会提示只能使用IE浏览器来访问,这是因为这些网站设置了检查用户代理,可以使用curl把用户代理设置为IE,这样就可以访问了。使用–user-agent或者-A选项:
代码语言:javascript复制curl URL --user-agent "Mozilla/5.0"
curl URL -A "Mozilla/5.0"
其他HTTP头部信息也可以使用curl来发送,使用-H"头部信息"传递多个头部信息,例如:
代码语言:javascript复制curl -H "Host:wangchujiang.com" -H "accept-language:zh-cn" URL