cewl----字典生成

2023-05-18 14:40:59 浏览数 (2)

简介

kali系统自带的一款工具,会根据网页的内容,自动生成字典。

详解

cewl -h查看帮助文档。

代码语言:javascript复制
┌──(root㉿kali)-[/usr/share/wordlists]
└─# cewl -h
CeWL 5.5.2 (Grouping) Robin Wood (robin@digi.ninja) (https://digi.ninja/)
Usage: cewl [OPTIONS] ... <url>

    OPTIONS:
        -h, --help: Show help.
        -k, --keep: Keep the downloaded file.
        -d <x>,--depth <x>: Depth to spider to, default 2.
        -m, --min_word_length: Minimum word length, default 3.
        -o, --offsite: Let the spider visit other sites.
        --exclude: A file containing a list of paths to exclude
        --allowed: A regex pattern that path must match to be followed
        -w, --write: Write the output to the file.
        -u, --ua <agent>: User agent to send.
        -n, --no-words: Don't output the wordlist.
        -g <x>, --groups <x>: Return groups of words as well
        --lowercase: Lowercase all parsed words
        --with-numbers: Accept words with numbers in as well as just letters
        --convert-umlauts: Convert common ISO-8859-1 (Latin-1) umlauts (ä-ae, ö-oe, ü-ue, ß-ss)
        -a, --meta: include meta data.
        --meta_file file: Output file for meta data.
        -e, --email: Include email addresses.
        --email_file <file>: Output file for email addresses.
        --meta-temp-dir <dir>: The temporary directory used by exiftool when parsing files, default /tmp.
        -c, --count: Show the count for each word found.
        -v, --verbose: Verbose.
        --debug: Extra debug information.

        Authentication
        --auth_type: Digest or basic.
        --auth_user: Authentication username.
        --auth_pass: Authentication password.

        Proxy Support
        --proxy_host: Proxy host.
        --proxy_port: Proxy port, default 8080.
        --proxy_username: Username for proxy, if required.
        --proxy_password: Password for proxy, if required.

        Headers
        --header, -H: In format name:value - can pass multiple.

    <url>: The site to spider.

Bash

参数讲解

-h、 --help

显示帮助

-k、 --keep

保留下载的文件

-d,--depth

探测网站路径的深度,默认值为2

-m、 --min_word_length

最小单词长度,默认值为3

-o、 --offsite

访问其他站点

--exclude

包含要排除的路径列表的文件

--allowed

路径必须匹配才能遵循的正则表达式模式

-w、 --write

将输出写入文件

-u、 --ua<agent>

要发送的用户代理

-n、 --no words

不输出单词列表

-g,--groups

同时返回单词组

--lowercase

小写所有已分析的单词

--with-numbers

接受带数字和字母的单词

--convert-umlauts

转换常见的ISO-8859-1(拉丁语-1)元音变音(ä-ae,ö-oe,ü-ue,ß-ss)

-a、 --meta

包括元数据

--meta_file file

元数据的输出文件

-e, --email

包括电子邮件地址

--email_file<file>

电子邮件地址的输出文件

--meta temp dir<dir>

exiftool在解析文件时使用的临时目录,默认为/tmp

-c、 --count

显示找到的每个单词的计数

-v、 --verbose

显示详细信息

--debug

额外的调试信息

--auth_type

摘要或基本

--auth_user

身份验证用户名

--auth_pass

身份验证密码

--proxy_host

代理主机

--proxy_port

代理端口,默认8080

--proxy_username

代理的用户名(如果需要)

--proxy_password

代理的密码(如果需要)

--header,-H

格式为name:value-可以传递多个

实例

代码语言:javascript复制
┌──(root㉿kali)-[~]
└─# cewl -d 0 -m 8 http://onlinebooks.library.upenn.edu/
CeWL 5.5.2 (Grouping) Robin Wood (robin@digi.ninja) (https://digi.ninja/)
Listings
Everything
centered
February
Subjects
Everybody
Libraries
FEATURES
Celebration
ARCHIVES
Language
Specialty
Involved
Progress
Requested
Ockerbloom
onlinebooks
copyrights
licenses

Bash

结语

注意通过 -d 参数控制探测网站路径的深度。如果网站比较大,速度很慢,需要很长时间。

0 人点赞