简介
kali系统自带的一款工具,会根据网页的内容,自动生成字典。
详解
cewl -h
查看帮助文档。
┌──(root㉿kali)-[/usr/share/wordlists]
└─# cewl -h
CeWL 5.5.2 (Grouping) Robin Wood (robin@digi.ninja) (https://digi.ninja/)
Usage: cewl [OPTIONS] ... <url>
OPTIONS:
-h, --help: Show help.
-k, --keep: Keep the downloaded file.
-d <x>,--depth <x>: Depth to spider to, default 2.
-m, --min_word_length: Minimum word length, default 3.
-o, --offsite: Let the spider visit other sites.
--exclude: A file containing a list of paths to exclude
--allowed: A regex pattern that path must match to be followed
-w, --write: Write the output to the file.
-u, --ua <agent>: User agent to send.
-n, --no-words: Don't output the wordlist.
-g <x>, --groups <x>: Return groups of words as well
--lowercase: Lowercase all parsed words
--with-numbers: Accept words with numbers in as well as just letters
--convert-umlauts: Convert common ISO-8859-1 (Latin-1) umlauts (ä-ae, ö-oe, ü-ue, ß-ss)
-a, --meta: include meta data.
--meta_file file: Output file for meta data.
-e, --email: Include email addresses.
--email_file <file>: Output file for email addresses.
--meta-temp-dir <dir>: The temporary directory used by exiftool when parsing files, default /tmp.
-c, --count: Show the count for each word found.
-v, --verbose: Verbose.
--debug: Extra debug information.
Authentication
--auth_type: Digest or basic.
--auth_user: Authentication username.
--auth_pass: Authentication password.
Proxy Support
--proxy_host: Proxy host.
--proxy_port: Proxy port, default 8080.
--proxy_username: Username for proxy, if required.
--proxy_password: Password for proxy, if required.
Headers
--header, -H: In format name:value - can pass multiple.
<url>: The site to spider.
Bash
参数讲解
-h、 --help | 显示帮助 |
---|---|
-k、 --keep | 保留下载的文件 |
-d,--depth | 探测网站路径的深度,默认值为2 |
-m、 --min_word_length | 最小单词长度,默认值为3 |
-o、 --offsite | 访问其他站点 |
--exclude | 包含要排除的路径列表的文件 |
--allowed | 路径必须匹配才能遵循的正则表达式模式 |
-w、 --write | 将输出写入文件 |
-u、 --ua<agent> | 要发送的用户代理 |
-n、 --no words | 不输出单词列表 |
-g,--groups | 同时返回单词组 |
--lowercase | 小写所有已分析的单词 |
--with-numbers | 接受带数字和字母的单词 |
--convert-umlauts | 转换常见的ISO-8859-1(拉丁语-1)元音变音(ä-ae,ö-oe,ü-ue,ß-ss) |
-a、 --meta | 包括元数据 |
--meta_file file | 元数据的输出文件 |
-e, --email | 包括电子邮件地址 |
--email_file<file> | 电子邮件地址的输出文件 |
--meta temp dir<dir> | exiftool在解析文件时使用的临时目录,默认为/tmp |
-c、 --count | 显示找到的每个单词的计数 |
-v、 --verbose | 显示详细信息 |
--debug | 额外的调试信息 |
--auth_type | 摘要或基本 |
--auth_user | 身份验证用户名 |
--auth_pass | 身份验证密码 |
--proxy_host | 代理主机 |
--proxy_port | 代理端口,默认8080 |
--proxy_username | 代理的用户名(如果需要) |
--proxy_password | 代理的密码(如果需要) |
--header,-H | 格式为name:value-可以传递多个 |
实例
代码语言:javascript复制┌──(root㉿kali)-[~]
└─# cewl -d 0 -m 8 http://onlinebooks.library.upenn.edu/
CeWL 5.5.2 (Grouping) Robin Wood (robin@digi.ninja) (https://digi.ninja/)
Listings
Everything
centered
February
Subjects
Everybody
Libraries
FEATURES
Celebration
ARCHIVES
Language
Specialty
Involved
Progress
Requested
Ockerbloom
onlinebooks
copyrights
licenses
Bash
结语
注意通过 -d 参数控制探测网站路径的深度。如果网站比较大,速度很慢,需要很长时间。