玩转企业常见应用与服务系列(八):开源代理服务软件 Squid 详解

2023-11-22 15:19:54 浏览数 (1)

前面介绍了企业常用服务 NFS FTP DHCPDNS SambalsyncdPostfix 相关的知识点,今天我将详细的为大家介绍代理服务 Squid相关知识,希望大家能够从中收获多多!如有帮助,请点在看、转发朋友圈支持一波!!!

Squid 简介

Squid是Linux系统中最常用的一款开源代理服务软件,可以很好地实现HTTP和FTP,以及DNS查询、SSL等应用的缓存代理,功能十分强大。

  • Squid 的作用:主要提供缓存加速、应用层过滤控制的功能。
  • Squid的功能:用于web代理,缓存网页对象,减少重复请求。
Web 代理的工作机制

缓存网页对象,减少重复请求。

  • 代替客户机向网站请求数据,从而可以隐藏用户的真实 IP 地址。
  • 将获得的网页数据(静态 Web 元素)保存到缓存中并发送给客户机,以便下次请求相同的数据时快速响应。
代理服务器的概念

代理服务器是一个位于客户端和原始服务器之间的服务器,为了从原始服务器取得内容,客户端向代理服务器发送一个请求并指定原始服务器,然后代理服务器向原始服务器转交请求并将获得的内容返回给客户端。

代理服务器的作用
  • 资源获取:代替客户端实现从原始服务器的资源获取。
  • 加速访问:代理服务器可能离原始服务器更近,从而起到一定的加速作用。
  • 缓存作用:代理服务器保存从原始服务器所获取的资源,从而实现客户端快速的获取。
  • 隐藏真实地址:代理服务器代替客户端去获取原始服务器资源,从而隐藏客户端真实信息。

Squid 代理的基本类型

传统代理

适用于 Internet,需在客户机指定代理服务器的地址和端口。

透明代理

客户机不需指定代理服务器的地址和端口,而是通过默认路由、防火墙策略将 Web 访问重定向给代理服务器处理。

反向代理

如果 Squid 反向代理服务器中缓存了该请求的资源,则将该请求的资源直接返回给客户端;否则反向代理服务器将向后台的 WEB 服务器请求资源,然后将请求的应答返回给客户端,同时也将该应答缓存(静态)在本地,供下一个请求者使用。

使用正向代理(传统代理、透明代理)的好处:

  • 提高 Web 访问速度
  • 隐藏客户机的真实 IP 地址
反向代理的工作机制
  • 缓存网页对象,减少重复请求
  • 将互联网请求轮询或按权重分配到内网 Web 服务器
  • 代理用户请求,避免用户直接访问 Web 服务器,提高内网服务器安全性

安装 Squid 服务

代码语言:javascript复制
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
编译安装 Squid
代码语言:javascript复制
yum -y install gcc gcc-c   make
tar zxvf squid-3.5.28.tar.gz -C /opt/
cd /opt/squid-3.5.28

编译参数如下:

代码语言:javascript复制
./configure --prefix=/usr/local/squid   #指定安装目录路径
--sysconfdir=/etc        #指定配置文件路径
--enable-arp-acl        #MAC地址管控,防止客户端使用IP欺骗
--enable-linux-netfilter      #使用内核过滤
--enable-linux-tproxy       #支持透明模式
--enable-async-io=100       #异步IO,提升存储性能
--enable-err-language="Simplify_Chinese"  #错误信息的显示语言
--enable-underscore       #允许URL中有下划线
--disable-poll        #关闭默认使用 poll 模式
--enable-epoll        #开启epoll模式提升性能
--enable-gnuregex       #使用GNU正则表达式
make && make install

ln -s /usr/local/squid/sbin/* /usr/local/sbin/

useradd -M -s /sbin/nologin squid

chown -R squid:squid /usr/local/squid/var/  #此目录用于存放缓存文件
修改 Squid 的配置文件
代码语言:javascript复制
vim /etc/squid.conf
......
--56行--插入
http_access allow all    #放在 http_access deny all 之前,允许任意客户机使用代理服务,控制规则自上而下匹配
http_access deny all
http_port 3128      #用来指定代理服务监听的地址和端口(默认的端口号为 3128)
--61行--插入
cache_effective_user squid   #添加,指定程序用户,用来设置初始化、运行时缓存的账号,否则启动不成功
cache_effective_group squid   #添加,指定账号基本组

coredump_dir /usr/local/squid/var/cache/squid  #指定缓存文件目录
Squid 的运行控制
代码语言:javascript复制
#检查配置文件语法是否正确
squid -k parse

#启动 Squid,第一次启动 Squid 服务时,会自动初始化缓存目录
squid -z      #-z 选项用来初始化缓存目录
squid      #启动 squid 服务

netstat -anpt | grep "squid"
创建 Squid 服务启动脚本
代码语言:javascript复制
vim /etc/init.d/squid
#!/bin/bash
#chkconfig: 2345 90 25
PID="/usr/local/squid/var/run/squid.pid"
CONF="/etc/squid.conf"
CMD="/usr/local/squid/sbin/squid"

case "$1" in
   start)
     netstat -natp | grep squid &> /dev/null
     if [ $? -eq 0 ]
     then
       echo "squid is running"
     else
       echo "正在启动 squid..."
       $CMD
     fi
   ;;
   stop)
     $CMD -k kill &> /dev/null
     rm -rf $PID &> /dev/null
   ;;
   status)
     [ -f $PID ] &> /dev/null
        if [ $? -eq 0 ]
          then
            netstat -natp | grep squid
          else
            echo "squid is not running"
        fi
   ;;
   restart)
      $0 stop &> /dev/null
      echo "正在关闭 squid..."
      $0 start &> /dev/null
      echo "正在启动 squid..."
   ;;
   reload)
      $CMD -k reconfigure
   ;;
   check)
      $CMD -k parse
   ;;
   *)
      echo "用法:$0{start|stop|status|reload|check|restart}"
   ;;
esac

#2345是默认自启动级别,如是-代表任何级别都不自启动;90是启动优先级,25是停止优先级,优先级范围是0-100,数字越大,优先级越低。
chmod  x /etc/init.d/squid
chkconfig --add squid
chkconfig --level 35 squid on

Squid 项目实践

构建传统代理服务器
代码语言:javascript复制
vim /etc/squid.conf
......
http_access allow all
http_access deny all
http_port 3128
cache_effective_user squid
cache_effective_group squid
--63行--插入
cache_mem 64 MB    #指定缓存功能所使用的内存空间大小,便于保持访问较频繁的WEB对象,容量最好为4的倍数,单位为MB,一般设为物理内存的1/3
cache_swap_high 95   #cache目录使用量大于95%时,开始清理旧的cache
cache_swap_low 90   #cache目录清理到90%时停止

reply_body_max_size 100 MB   #允许用户下载的最大文件大小,以字节为单位,当下载超过指定大小的Web对象时,浏览器的报错页面中会出现“请求或访问太大”的提示默认设置0表示不进行限制
maximum_object_size 512000 KB  #设置squid磁盘缓存最大文件,以KB为单位,超过的文件不保存到硬盘,而是直接转发给用户
maximum_object_size_in_memory 512 KB #设置squid内存缓存最大文件,超过的文件不保存到内存
minimum_object_size 0 KB   设置squid磁盘缓存最小文件
重启服务
代码语言:javascript复制
service squid restart
systemctl restart squid
代码语言:javascript复制
#生产环境中还需要修改防火墙规则
iptables -F
iptables -I INPUT -p tcp --dport 3128 -j ACCEPT

#客户机的代理配置
打开浏览器,工具-->Internet选项-->连接-->局域网设置-->开启代理服务器(地址:Squid服务器IP地址,端口:3128)。

#查看 Squid 访问日志的新增记录中的缓存命中情况
tail -f /usr/local/squid/var/logs/access.log
        TCP_MEM_HIT/200

#查看 Web 访问日志的新增记录
tail -f /var/log/httpd/access_log
在浏览器输入Web服务器IP地址访问,查看Web服务器访问日志,显示的是由代理服务器替客户机在访问。
在客户机中安装nginx服务,并进行代理设置。

打开浏览器,工具–>Internet选项–>连接–>局域网设置–>开启代理服务器(地址:192.168.44.100,端口:3128)。

代码语言:javascript复制
tail -f /usr/local/squid/var/logs/access.log:
代码语言:javascript复制
tail -f /var/log/nginx/access_log:
构建透明代理服务器

Squid服务器:

  • 双网卡,内网ens33:192.168.44.100 外网ens36:12.0.0.1
  • Web 服务器:12.0.0.12
  • 客户机:192.168.44.101
代码语言:javascript复制
-----Squid服务器配置-----  
vim /etc/squid.conf  
…  
http_access allow all  
http_access deny all  
–60行–修改添加提供内网服务的IP地址,和支持透明代理选项 transparent  
http_port 192.168.80.10:3128 transparent

systemctl restart squid

#开启路由转发,实现本机中不同网段的地址转发  
echo ‘net.ipv4.ip_forward = 1’ >> /etc/sysctl.conf  
sysctl -p

#修改防火墙规则  
iptables -F  
iptables -t nat -F  
iptables -t nat -I PREROUTING -i ens33 -s 192.168.44.0/24 -p tcp --dport 80 -j REDIRECT --to-ports 3128 #用于转发http协议  
iptables -t nat -I PREROUTING -i ens33 -s 192.168.44.0/24 -p tcp --dport 443 -j REDIRECT --to 3128 #用于转发https协议  
iptables -I INPUT -p tcp --dport 3128 -j ACCEPT
代码语言:javascript复制
-----Web服务器配置-----
yum install -y httpd
systemctl start httpd

关闭客户机的浏览器之前设置的代理服务器的功能后访问 http://12.0.0.12

代码语言:javascript复制
#查看 Squid 访问日志的新增记录
tail -f /usr/local/squid/var/logs/access.log
1631073624.552      0 192.168.80.200 TCP_MEM_HIT/200 449 GET http://12.0.0.12/ - HIER_NONE/- text/html

#查看 Web 访问日志的新增记录,显示的是由代理服务器的外网口代替客户机在访问
tail -f /var/log/httpd/access_log

ACL访问控制

在配置文件 squid.conf 中,ACL 访问控制通过以下两个步骤来实现:

  • 使用 acl 配置项定义需要控制的条件;
  • 通过 http_access 配置项对已定义的列表做“允许”或“拒绝”访问的控制。
定义访问控制列表

格式:acl 列表名称 列表类型 列表内容 …

代码语言:javascript复制
vim /etc/squid.conf
......
acl localhost src 192.168.44.100/32      #源地址为 192.168.80.10
acl MYLAN src 192.168.44.0/24 192.168.1.0/24  #客户机网段
acl destinationhost dst 12.0.0.12/32   #目标地址为 192.168.80.13
acl MC20 maxconn 20         #最大并发连接 20
acl PORT port 21         #目标端口 21
acl DMBLOCK dstdomain .qq.com      #目标域,匹配域内所有站点
acl BURL url_regex -i ^rtsp:// ^emule://   #以 rtsp://、emule:// 开头的目标 URL地址,-i表示忽略大小写
acl PURL urlpath_regex -i .mp3$ .mp4$ .rmvb$  #以 .mp3、.mp4、.rmvb 结尾的目标 URL 路径
acl WORKTIME time MTWHF 08:30-17:30     #时间为周一至周五 8:30~17:30,“MTWHF”为每个星期的英文首字母

启动对象列表管理

代码语言:javascript复制
mkdir /etc/squid
vim /etc/squid/dest.list
192.168.80.13
192.168.1.0/24

vim /etc/squid.conf
......
acl destinationhost dst "/etc/squid/dest.list"   #调用指定文件中的列表内容
......
http_access deny(或allow) destinationhost    #注意,如果是拒绝列表,需要放在http_access allow all前面

重启服务

代码语言:javascript复制
systemctl restart squid

浏览器访问Web服务器 http://192.168.80.13 ,显示被访问被拒绝。

Squid 日志分析

安装图像处理软件包

代码语言:javascript复制
yum install -y pcre-devel gd gd-devel

mkdir /usr/local/sarg
tar zxvf sarg-2.3.7.tar.gz -C /opt/

cd /opt/sarg-2.3.7
./configure --prefix=/usr/local/sarg 
--sysconfdir=/etc/sarg     #配置文件目录,默认是/usr/local/etc
--enable-extraprotection       #额外安全防护
代码语言:javascript复制
vim /etc/sarg/sarg.conf
--7行--取消注释
access_log /usr/local/squid/var/logs/access.log  #指定访问日志文件
--25行--取消注释
title "Squid User Access Reports"     #网页标题
--120行--取消注释,修改
output_dir /var/www/html/sarg      #报告输出目录
--178行--取消注释
user_ip no           #使用用户名显示
--184行--取消注释,修改
topuser_sort_field connect reverse     #top排序中,指定连接次数采用降序排列,升序是normal
--190行--取消注释,修改
user_sort_field connect reverse      #对于用户访问记录,连接次数按降序排序
--206行--取消注释,修改
exclude_hosts /usr/local/sarg/noreport    #指定不计入排序的站点列表的文件
--257行--取消注释
overwrite_report no         #同名同日期的日志是否覆盖
--289行--取消注释,修改
mail_utility mailq.postfix       #发送邮件报告命令
--434行--取消注释,修改
charset UTF-8          #指定字符集UTF-8
--518行--取消注释
weekdays 0-6          #top排行的星期周期
--525行--取消注释
hours 0-23           #top排行的时间周期
--633行--取消注释
www_document_root /var/www/html      #指定网页根目录
代码语言:javascript复制
#添加不计入站点文件,添加的域名将不被显示在排序中
touch /usr/local/sarg/noreport

ln -s /usr/local/sarg/bin/sarg /usr/local/bin/
sarg --help

#验证
yum install httpd -y
systemctl start httpd

#运行
sarg    #启动一次记录

浏览器访问 http://192.168.80.10/sarg ,查看sarg报告网页。

代码语言:javascript复制
#添加计划任务,执行每天生成报告
vim /usr/local/sarg/report.sh
#/bin/bash
#Get current date
TODAY=$(date  %d/%m/%Y)
#Get one week ago today
YESTERDAY=$(date -d "1 day ago"  %d/%m/%Y)
/usr/local/sarg/bin/sarg -l /usr/local/squid/var/logs/access.log -o /var/www/html/sarg -z -d $YESTERDAY-$TODAY &> /dev/null
find ./ -type d -a -name "$(env LANG=en_US.UTF-8 date -d "30 day ago"  %Y%b%d)-$(env LANG=en_US.UTF-8 date -d "29 day ago"  %Y%b%d)" | xargs rm -rf
exit 0

chmod  x /usr/local/sarg/report.sh

crontab -e
0 0 * * * /usr/local/sarg/report.sh

Squid反向代理

如果 Squid 反向代理服务器中缓存了该请求的资源,则将该请求的资源直接返回给客户端;否则反向代理服务器将向后台的 Web 服务器请求资源,然后将请求的应答返回给客户端,同时也将该应答缓存在本地,供下一个请求者使用。

工作机制
  • ●缓存网页对象,减少重复请求
  • ●将互联网请求轮训或按权重分配到内网Web服务器
  • ●代理用户请求,避免用户直接访问Web服务器,提高安全
代码语言:javascript复制
vim /etc/squid.conf
......
--60行--修改,插入
http_port 192.168.80.10:80 accel vhost vport
cache_peer 192.168.80.11 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web1
cache_peer 192.168.80.12 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web2
cache_peer_domain web1 web2 www.kgc.com
-------------------------------------------------------------------------------------------------------
#表示对www.kgc.com的请求,squid向192.168.80.11和192.168.80.12的80端口发出请求
http_port 80 accel vhost vport #squid从一个缓存变成了一个Web服务器反向代理加速模式,这个时候squid在80端口监听请求,同时和web server的请求端口(vhost vport)绑定,这个时候请求到了squid,squid是不用转发请求的,而是直接要么从缓存中拿数据要么向绑定的端口直接请求数据。
accel :反向代理加速模式
vhost :支持域名或主机名来表示代理节点
vport :支持IP和端口来表示代理节点

parent :代表为父节点,上下关系,非平级关系
80 :代理内部web服务器的80端口
0 :没有使用icp(电信运营商),表示就一台squid服务器
no-query :不做查询操作,直接获取数据
originserver :指定是源服务器
round-robin :指定 squid 通过轮询方式将请求分发到其中一台父节点
max_conn :指定最大连接数
weight : 指定权重
name :设置别名
---------------------------------------------------------------------------------------------------------
//清空之前透明模式配置的 iptables 规则
iptables -F
iptables -t nat -F

systemctl stop httpd       #防止 httpd 服务使用的 80 端口号和 squid 反向代理配置的监听端口冲突
systemctl restart squid

#后端节点服务器设置
yum install -y httpd
systemctl start httpd

#节点1:
echo "this is test01" >> /var/www/html/index.html
#节点2:
echo "this is test02" >> /var/www/html/index.html

#客户机的域名映射配置
修改 C:WindowsSystem32driversetchosts 文件
192.168.80.10 www.kgc.com

浏览器不开启代理访问 http://www.kgc.com

代码语言:javascript复制
#查看缓存命中情况 
tailf /usr/local/squid/var/logs/access.log
1631164427.547      0 192.168.80.200 TCP_MEM_HIT/200 381 GET http://www.kgc.com/ - HIER_NONE/- text/html

nginx缓存配置

代码语言:javascript复制
vim /etc/nginx/nginx.conf
http {
    proxy_cache_path /data/nginx/cache levels=1:2 keys_zone=my_cache:10m max_size=10g inactive=60m use_temp_path=off;
 
#####################################################
●path:强制参数,指定缓存文件的存放路径。
●levels:定义了缓存目录的层级。每层可以用1(最多16种选择,0-f)或2(最多256种选择,00-ff)表示,中间用 : 分隔。
proxy_cache_path /data/nginx/cache;  代表所有缓存只有一个目录,比如/data/nginx/cache/d7b6e5978e3f042f52e875005925e51b
proxy_cache_path /data/nginx/cache levels=1:2;  代表缓存是二层目录(有16*256=4096个目录),比如/data/nginx/cache/b/51/d7b6e5978e3f042f52e875005925e51b
●keys_zone:强制参数,定义共享内存区的名称和大小,该共享内存用于保存缓存项目的元数据(所有活动的key和缓存数据相关的信息),这样nginx可以快速判断一个request是否命中或者未命中缓存,1m可以存储8000个key,10m可以存储80000个key。
●inactive:删除指定时间内未被访问的缓存文件,默认10分钟。
●max_size:设置了缓存存储的上限,如果不指定,最大会用掉所有磁盘空间。
●use_temp_path:直接把临时文件放在缓存目录中。
#####################################################
代码语言:javascript复制
vim /etc/nginx/conf.d/default.conf

    upstream cache_server{
        server 192.168.80.20:80;
        server 192.168.80.30:80;
    }
    
    server {
        listen 80;
        server_name www.kgc.com;
        location / {
            proxy_cache my_cache;               #指定用于页面缓存的共享内存,zone名称由proxy_cache_path指令定义
            proxy_cache_valid 200 5m;           #为不同的响应状态码设置不同的缓存时间,此为缓存状态码为200的请求,缓存时长为5分钟
            proxy_cache_key $request_uri;       #指定缓存文件的key为请求的URI
            add_header Nginx-Cache-Status $upstream_cache_status      #把缓存状态设置为头部信息,响应给客户端
            proxy_pass http://cache_server;     #设置代理转发的后端服务器的协议和地址
        }
    }
}

#对于一些实时性要求非常高的页面或数据来说,就不应该去设置缓存,下面来看看如何配置不缓存的内容。
proxy_cache_path /data/nginx/cache levels=1:2 keys_zone=my_cache:10m max_size=10g inactive=60m use_temp_path=off;
server {
  listen 80;
  server_name cache.lion.club;
  #URI 中后缀为 .txt 或 .text 的设置变量值为 "no cache"
  if ($request_uri ~ .(txt|text)$) {
   set $cache_name "no cache"
  }
  
  location / {
    proxy_no_cache $cache_name;      #判断该变量是否有值,如果有值则不进行缓存,如果没有值则进行缓存
    proxy_cache my_cache;            #设置缓存内存
    proxy_cache_valid 200 5m;        #缓存状态为200的请求,缓存时长为5分钟
    proxy_cache_key $request_uri;    #缓存文件的key为请求的URI
    add_header Nginx-Cache-Status $upstream_cache_status    #把缓存状态设置为头部信息,响应给客户端
    proxy_pass http://cache_server;  #代理转发
  }
}

参考链接:https://blog.csdn.net/shenyuanhaojie /article/details/121123525 https://blog.csdn.net/ weixin_51728919/article/details/131514725

0 人点赞