文章目录
- 概述
- Nginx的特点
- 主要功能
- Nginx应用场景
- Nginx的架构
- 什么是域名
- 什么是反向代理
- 什么是负载均衡高可用
- Nginx 配置文件详解
- Nginx配置文件各个模块说明
- Nginx实现多端口服务
- Nginx实现多域名服务
- uptream负载均衡常用配置项说明
- proxy_pass中url末尾带/与不带/的区别
- nginx比apache的优点
- Nginx 反向代理为什么能够提升服务器性能
- Nginx 多进程模型是如何实现高并发的
概述
Nginx是一款高性能的http 服务器/反向代理服务器及电子邮件(IMAP/POP3)代理服务器。由俄罗斯的程序设计师Igor Sysoev所开发,官方测试nginx能够支支撑5万并发链接,并且cpu、内存等资源消耗却非常低,运行非常稳定。Nginx 是一款非常强大的 Web 服务器和反向代理服务器,其高效的事件驱动架构使其能够轻松处理高并发请求。通过灵活的配置文件,Nginx 可以满足多种需求,从简单的静态内容服务到复杂的负载均衡和反向代理。广泛用于静态内容服务、负载均衡、反向代理、缓存、以及作为 API 网关等。它以轻量级、高并发、高扩展性著称,能够处理大量的并发连接。
Nginx的特点
高性能:Nginx使用异步、非阻塞事件驱动模型,能够高效地处理大量并发连接,相对于传统的进程或线程模型,Nginx使用更少的内存和CPU资源。
高并发:Nginx的官方测试显示其能够支撑高达5万并发连接,这在同类型的网页服务器中表现突出。
低资源消耗:在3万并发连接下,Nginx开启的10个进程仅消耗约150M内存。
稳定性高:Nginx运行非常稳定,适用于大型高并发网站、在线视频、物联网、云计算等场景。
模块化设计:Nginx的功能通过模块实现,用户可以根据需求加载不同的模块,扩展性好。
丰富的功能:支持HTTP/2、反向代理、负载均衡、缓存、SSL/TLS、WebSocket等。
主要功能
静态内容服务:Nginx 可以非常高效地提供静态文件(如 HTML、CSS、JavaScript、图片等)。由于其事件驱动架构,Nginx 能够处理大量的并发请求,适合高流量的静态内容网站。
反向代理:Nginx 可以作为反向代理,将客户端请求转发到后端服务器(如 Apache、Tomcat、Node.js 等)。Nginx 作为反向代理时可以处理 SSL 终止、负载均衡、缓存等任务。
负载均衡:Nginx 支持多种负载均衡策略,如轮询、加权轮询、IP 哈希等,可以在多台后端服务器之间分发请求,从而提高应用的可用性和扩展性。
缓存:Nginx 支持对静态和动态内容进行缓存,减少后端服务器的压力,提高响应速度。
SSL/TLS 支持:Nginx 能够处理 SSL/TLS 加密连接,提供安全的 HTTPS 服务,并且支持 SNI(Server Name Indication)用于托管多个 SSL 站点。
URL 重写和重定向:Nginx 支持使用正则表达式进行 URL 重写和重定向,这是 SEO 优化和 URL 友好性的重要功能。
访问控制:Nginx 支持基于 IP 地址的访问控制列表(ACL),可以允许或拒绝对特定资源的访问。
Gzip 压缩:Nginx 支持对响应内容进行 Gzip 压缩,减少数据传输量,提高网页加载速度。
WebSocket支持:Nginx也支持WebSocket协议,可用于实时通信应用程序。
访问控制和安全:Nginx可以使用访问控制、基于IP地址的访问限制等来提高服务器的安全性,有效保护Web应用程序和服务器。
Nginx应用场景
http服务器。Nginx是一个http服务可以独立提供http服务。可以做网页静态服务器。
虚拟主机。可以实现在一台服务器虚拟出多个网站。例如个人网站使用的虚拟主机。
反向代理,负载均衡。当网站的访问量达到一定程度后,单台服务器不能满足用户的请求时,需要用多台服务器集群可以使用nginx做反向代理。并且多台服务器可以平均分担负载,不会因为某台服务器负载高宕机而某台服务器闲置的情况。
Nginx因其性能优异、高可靠性、丰富的模块化支持和简单易用等优势,被广泛应用于静态文件服务、反向代理和负载均衡、缓存服务器、SSL加速、WebSocket、访问控制和安全等多种场景。在中国大陆,许多知名网站如百度、京东、腾讯、淘宝等都使用了Nginx作为其Web服务器或反向代理服务器。
Nginx的架构
Nginx采用模块化设计,核心功能和扩展功能都通过模块实现。模块分为核心模块、标准HTTP模块和第三方模块。Nginx的核心架构设计是其高性能和高可用性的关键,主要包括以下部分:
事件驱动模型:基于epoll(Linux)、kqueue(FreeBSD)等高效的I/O多路复用机制,实现事件的高效分发和处理。
Master-Worker进程模型:
Master进程:负责管理Worker进程,处理信号和管理共享资源。
Worker进程:处理实际的请求,每个Worker进程独立处理不同的连接,互不干扰,提高了并发处理能力和稳定性。
Nginx如何处理HTTP请求。
Nginx使用反应器模式。主事件循环等待操作系统发出准备事件的信号,这样数据就可以从套接字读取,在该实例中读取到缓冲区并进行处理。单个线程可以提供数万个并发连接。
什么是域名
域名就是网站。www.baidu.com www.taobao.com www.jd.com
Dns服务器:把域名解析为ip地址。保存的就是域名和ip的映射关系。
一级域名:Baidu.com,Taobao.com,Jd.com
二级域名:www.baidu.com,Image.baidu.com,Item.baidu.com
三级域名:1.Image.baidu.com,Aaa.image.baidu.com
一个域名对应一个ip地址,一个ip地址可以被多个域名绑定。
什么是反向代理
反向代理(Reverse Proxy)方式是指以代理服务器来接受internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给internet上请求连接的客户端,此时代理服务器对外就表现为一个反向代理服务器。
反向代理服务器决定哪台服务器提供服务。
返回代理服务器不提供服务器
两个域名指向同一台nginx服务器,用户访问不同的域名显示不同的网页内容。
两个域名是www.sian.com.cn和www.sohu.com
nginx服务器使用虚拟机192.168.101.3
通过在upstream节点里面配置server(主机名+端口号确定唯一主机)实现反向代理;
什么是负载均衡高可用
nginx作为负载均衡器,所有请求都到了nginx,可见nginx处于非常重点的位置,如果nginx服务器宕机后端web服务将无法提供服务,影响严重。为了屏蔽负载均衡服务器的宕机,需要建立一个备份机。主服务器和备份机上都运行高可用(High Availability)监控程序,通过传送诸如“I am alive”这样的信息来监控对方的运行状况。当备份机不能在一定的时间内收到这样的信息时,它就接管主服务器的服务IP并继续提供负载均衡服务;当备份管理器又从主管理器收到“I am alive”这样的信息时,它就释放服务IP地址,这样的主服务器就开始再次提供负载均衡服务。
Nginx的负载均衡和高可用
通过keepalived+Nginx实现Nginx的高可用和负载均衡
Nginx 配置文件详解
Nginx 的配置文件通常位于 /etc/nginx/nginx.conf,它采用层次化结构,通过块(block)来组织配置项。以下是一个典型的 Nginx 配置文件示例,
Nginx的配置文件nginx.conf位于其安装目录的conf目录下。
nginx.conf由多个块组成,最外面的块是main,main包含Events和HTTP,HTTP包含upstream和多个Server,Server又包含多个location:具体结构如下所示
全局配置
user www-data; # Nginx 运行的用户
worker_processes auto; # Nginx 进程数,auto 表示自动选择,通常为 CPU 核心数
error_log /var/log/nginx/error.log warn; # 错误日志路径和级别
pid /var/run/nginx.pid; # PID 文件位置
#事件模块配置
events {worker_connections 1024; # 每个 worker 进程的最大连接数use epoll; # 使用 epoll 事件驱动模型(Linux 下高效模型)
}
#HTTP 模块配置
http {include /etc/nginx/mime.types; # 文件扩展名与 MIME 类型映射表default_type application/octet-stream; # 默认 MIME 类型log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_referer" ''"$http_user_agent" "$http_x_forwarded_for"';access_log /var/log/nginx/access.log main; # 访问日志sendfile on; # 开启高效文件传输模式keepalive_timeout 65; # 长连接超时时间gzip on; # 开启 Gzip 压缩gzip_disable "msie6"; # 禁用 IE6 的 gzip# 虚拟主机配置server {listen 80; # 监听端口server_name example.com www.example.com; # 服务器名称(域名)root /var/www/html; # 网站根目录index index.html index.htm; # 默认首页文件# 重写规则location / {try_files $uri $uri/ =404;}# 静态文件缓存设置location ~* \.(jpg|jpeg|png|gif|ico|css|js)$ {expires 30d;access_log off;}# 反向代理设置location /api/ {proxy_pass http://backend_server; # 后端服务器proxy_set_header Host $host;proxy_set_header X-Real-IP $remote_addr;proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;proxy_set_header X-Forwarded-Proto $scheme;}# 错误页面error_page 404 /404.html;location = /404.html {root /usr/share/nginx/html;internal;}# SSL 配置示例(仅供参考)listen 443 ssl;ssl_certificate /etc/ssl/certs/example.com.crt;ssl_certificate_key /etc/ssl/private/example.com.key;ssl_protocols TLSv1 TLSv1.1 TLSv1.2 TLSv1.3;ssl_ciphers HIGH:!aNULL:!MD5;}
}
########### 每个指令必须有分号结束。#################
#user administrator administrators; #配置用户或者组,默认为nobody nobody。
#worker_processes 2; #允许生成的进程数,默认为1
#pid /nginx/pid/nginx.pid; #指定nginx进程运行文件存放地址
error_log log/error.log debug; #制定日志路径,级别。这个设置可以放入全局块,http块,server块,级别以此为:debug|info|notice|warn|error|crit|alert|emerg
events {accept_mutex on; #设置网路连接序列化,防止惊群现象发生,默认为onmulti_accept on; #设置一个进程是否同时接受多个网络连接,默认为off#use epoll; #事件驱动模型,select|poll|kqueue|epoll|resig|/dev/poll|eventportworker_connections 1024; #最大连接数,默认为512
}
http {include mime.types; #文件扩展名与文件类型映射表default_type application/octet-stream; #默认文件类型,默认为text/plain#access_log off; #取消服务日志log_format myFormat '$remote_addr–$remote_user [$time_local] $request $status $body_bytes_sent $http_referer $http_user_agent $http_x_forwarded_for'; #自定义格式access_log log/access.log myFormat; #combined为日志格式的默认值sendfile on; #允许sendfile方式传输文件,默认为off,可以在http块,server块,location块。sendfile_max_chunk 100k; #每个进程每次调用传输数量不能大于设定的值,默认为0,即不设上限。keepalive_timeout 65; #连接超时时间,默认为75s,可以在http,server,location块。upstream mysvr {server 127.0.0.1:7878;server 192.168.10.121:3333 backup; #热备}error_page 404 https://www.baidu.com; #错误页server {keepalive_requests 120; #单连接请求上限次数。listen 4545; #监听端口server_name 127.0.0.1; #监听地址location ~*^.+$ { #请求的url过滤,正则匹配,~为区分大小写,~*为不区分大小写。#root path; #根目录#index vv.txt; #设置默认页proxy_pass http://mysvr; #请求转向mysvr 定义的服务器列表deny 127.0.0.1; #拒绝的ipallow 172.18.5.54; #允许的ip}}
}
Nginx配置文件各个模块说明
- 全局块:配置影响nginx全局的指令。一般有运行nginx服务器的用户组,nginx进程pid存放路径,日志存放路径,配置文件引入,允许生成worker process数等。
- events块:配置影响nginx服务器或与用户的网络连接。有每个进程的最大连接数,选取哪种事件驱动模型处理连接请求,是否允许同时接受多个网路连接,开启多个网络连接序列化等。
- http块:可以嵌套多个server,配置代理,缓存,日志定义等绝大多数功能和第三方模块的配置。如文件引入,mime-type定义,日志自定义,是否使用sendfile传输文件,连接超时时间,单连接请求数等。
- server块:配置虚拟主机的相关参数,一个http中可以有多个server。
- location块:配置请求的路由,以及各种页面的处理情况。
user www-data;:指定 Nginx 运行的用户。
worker_processes auto;:指定工作进程的数量。一般设为 CPU 的核心数或自动检测。
事件模块
worker_connections 1024;:指定每个工作进程可以同时处理的最大连接数。
use epoll;:指定使用 epoll 事件模型(适用于 Linux 系统)。
HTTP 模块
include /etc/nginx/mime.types;:包含 MIME 类型文件,用于文件类型识别。
log_format 和 access_log:配置访问日志的格式和位置。
sendfile on;:启用高效的文件传输机制。
keepalive_timeout 65;:保持连接的超时时间(秒)。
gzip on;:启用 Gzip 压缩。
虚拟主机(server block)
server:定义一个虚拟主机,Nginx 可以通过配置多个 server 块来管理多个站点。
listen 80;:监听端口号,80 为默认的 HTTP 端口。
server_name example.com www.example.com;:指定主机名称(域名),支持多个名称。
root /var/www/html;:指定网站的根目录。
index index.html index.htm;:定义默认的主页文件。
location 块
location /:配置处理根路径请求的规则,try_files $uri u r i / = 404 ; 表示尝试访问 U R I ,若文件不存在则返回 404 。 l o c a t i o n ∗ ( ˙ j p g ∣ j p e g ∣ p n g ∣ g i f ∣ i c o ∣ c s s ∣ j s ) uri/ =404; 表示尝试访问 URI,若文件不存在则返回 404。 location ~* \.(jpg|jpeg|png|gif|ico|css|js) uri/=404;表示尝试访问URI,若文件不存在则返回404。location ∗(˙jpg∣jpeg∣png∣gif∣ico∣css∣js):为特定文件类型(如图片、CSS、JS)设置缓存期限,并关闭访问日志。
location /api/:定义反向代理规则,将 /api/ 路径的请求转发到后端服务器。
错误页面
error_page 404 /404.html;:指定自定义的 404 错误页面。
SSL 配置
listen 443 ssl;:监听 443 端口并启用 SSL。
ssl_certificate 和 ssl_certificate_key:指定 SSL 证书和密钥文件。
ssl_protocols 和 ssl_ciphers:配置支持的 SSL/TLS 协议和加密算法。
常用命令
启动 Nginx:sudo systemctl start nginx
停止 Nginx:sudo systemctl stop nginx
重启 Nginx:sudo systemctl restart nginx
重新加载配置:sudo systemctl reload nginx
检查配置文件语法:sudo nginx -t
Nginx实现多端口服务
众所周知,一个Tomcat只能绑定一个端口,但是一个Nginx服务却可以通过配置不同端口,来支持不同的访问,具体步骤如下所示:
复制Nginx自带的html文件夹,并命名为html2,作为一个单独的访问路径,如下所示:
Nginx实现多域名服务
在网络世界中,域名方便用户记忆及传播,且拥有有特殊的含义,代表一个独一无二的服务。Nginx可以通过配置不同的域名来区分不同的服务,如下所示:
复制Nginx自带的html文件夹,并命名为html3,作为一个单独的访问路径,如下所示:
uptream负载均衡常用配置项说明
很多大型的网站中,ngixn常常作为反向代理sever负载上游web server结合高可用机制构建一个大型web集群,而要通过nginx构建这样的一个集群,必然少不来nginx一个很重要的模块:负载均衡模块(upstream),如下所示为nginx负载均衡配置项介绍。
upstream 块配置项说明
语法:upstream name {…} //指定负载均含name(名称)
配置块:http
upstream块定义了一个上游服务器的集群,便于反向代理中的proxy_pass使用。例如:
upstream backend {
server backend1.example.com;
server backend2.example.com;
server backend3.example.com;
}
server {
location / {
proxy_pass http://backend;
}
}
1.2 server 块配置项说明
语法:server name [parameters];
配置块:upstream
server配置项指定了一台上游服务器的名字,这个名字可以是域名、IP地址端口、UNIX句柄等,在其后还可以跟下列参数:
weight=number:设置向这台上游服务器转发的权重,默认为1。
max_fails=number:该选项与fail_timeout配合使用,指在fail_timeout时间段内,如果向当前的上游服务器转 发失败次数超过number,则认为在当前的fail_timeout时间段内这台上游服务器不可用。max_fails默认为1,如果设置为0,则表示 不检查失败次数。
fail_timeout=time:fail_timeout表示该时间段内转发失败多少次后就认为上游服务器暂时不可用,用于优化反向代理功能。它与向上游服务器建立连接的超时时间、读取上游服务器的响应超时时间等完全无关。fail_timeout默认为10秒。
down:表示所在的上游服务器永久下线,只在使用ip_hash配置项时才有用。
backup:在使用ip_hash配置项时它是无效的。它表示所在的上游服务器只是备份服务器,只有在所有的非备份上游服务器都失效后,才会向所在的上游服务器转发请求。
例如
upstream backend {
server backend1.example.com weight=5;
server 127.0.0.1:8080 max_fails=3 fail_timeout=30s;
server unix:/tmp/backend3;
}
proxy_pass中url末尾带/与不带/的区别
注意:当location为正则表达式匹配模式时,proxy_pass中的url末尾是不允许有"/"的,因此正则表达式匹配模式不在讨论范围内。
测试地址:http://192.168.171.129/test/tes.jsp
场景一:
location ^~ /test/ {proxy_pass http://192.168.171.129:8080/server/;
}
代理后实际访问地址:http://192.168.171.129:8080/server/tes.jsp场景二:
location ^~ /test {proxy_pass http://192.168.171.129:8080/server/;
}
代理后实际访问地址:http://192.168.171.129:8080/server//tes.jsp场景三:
location ^~ /test/ {proxy_pass http://192.168.171.129:8080/;
}
代理后实际访问地址:http://192.168.171.129:8080/tes.jsp场景四:
location ^~ /test {proxy_pass http://192.168.171.129:8080/;
}
代理后实际访问地址:http://192.168.171.129:8080//tes.jsp
proxy_pass配置中url末尾不带/时,如url中不包含path,则直接将原uri拼接在proxy_pass中url之后;如url中包含path,则将原uri去除location匹配表达式后的内容拼接在proxy_pass中的url之后
测试地址:http://192.168.171.129/test/tes.jsp
场景一:
location ^~ /test/{proxy_pass http://192.168.171.129:8080/server;}代理后实际访问地址:http://192.168.171.129:8080/servertes.jsp
场景二:
location ^~ /test {proxy_pass http://192.168.171.129:8080/server;
}
代理后实际访问地址:http://192.168.171.129:8080/server/tes.jsp场景三:
location ^~ /test/ {proxy_pass http://192.168.171.129:8080;
}
代理后实际访问地址:http://192.168.171.129:8080/test/tes.jsp场景四:
location ^~ /test {proxy_pass http://192.168.171.129:8080;
}
代理后实际访问地址:http://192.168.171.129:8080/test/tes.jsp
nginx比apache的优点
nginx 相对 apache 的优点:
1)轻量级,同样起 web 服务,比 apache 占用更少的内存及资源
2)抗并发,nginx 处理请求是异步非阻塞的,而 apache 则是阻塞型的,在高并发下 nginx 能保持
3)低资源低消耗高性能
4)高度模块化的设计,编写模块相对简单
5)社区活跃,各种高性能模块出品迅速啊
apache 相对 nginx 的优点:
1)rewrite,比 nginx 的 rewrite 强大
2)模块超多,基本想到的都可以找到
3)少 bug,nginx 的 bug 相对较多
4)超稳定,一般来说,需要性能的 web 服务,用 nginx 。 如果不需要性能只求稳定,那就 apache 吧。
Nginx 反向代理为什么能够提升服务器性能
对于后端是动态服务来说,比如 Java 和 PHP。这类服务器(如 JBoss 和 PHP-FPM)的 IO 处理能力往往不高。
Nginx 有个好处是它会把 Request 在读取完整之前 buffer 住,这样交给后端的就是一个完整的 HTTP 请求,从而提高后端的效率,而不是断断续续的传递(互联网上连接速度一般比较慢)。 同样,Nginx 也可以把response 给 buffer 住,同样也是减轻后端的压力。
Nginx 多进程模型是如何实现高并发的
进程数与并发数不存在很直接的关系。这取决取 server 采用的工作方式。如果一个 server 采用一个进程负责一
个 request 的方式,那么进程数就是并发数。那么显而易见的,就是会有很多进程在等待中。等什么?最多的应该是等待网络传输。
Nginx 的异步非阻塞工作方式正是利用了这点等待的时间。在需要等待的时候,这些进程就空闲出来待命了。因
此表现为少数几个进程就解决了大量的并发问题。
apache 是如何利用的呢,简单来说:同样的 4 个进程,如果采用一个进程负责一个 request 的方式,那么,同时进来 4 个 request 之后,每个进程就负责其中一个,直至会话关闭。期间,如果有第 5 个 request 进来了。就无法及时反应了,因为 4 个进程都没干完活呢,因此,一般有个调度进程,每当新进来了一个 request,就新开个进程来处理。
nginx 不这样,每进来一个 request,会有一个 worker 进程去处理。但不是全程的处理,处理到什么程度呢?处理到可能发生阻塞的地方,比如向上游(后端)服务器转发 request,并等待请求返回。那么,这个处理的 worker 不会这么傻等着,他会在发送完请求后,注册一个事件:“如果 upstream返回了,告诉我一声,我再接着干”。于是他就休息去了。此时,如果再有 request 进来,他就可以很快再按这种方式处理。而一旦上游服务器返回了,就会触发这个事件, worker 才会来接手,这个 request 才会接着往下走。由于 web server 的工作性质决定了每个 request 的大部份生命都是在网络传输中,实际上花费在 server 机器上的时间片不多。这是几个进程就解决高并发的秘密所在。webserver 刚好属于网络 io 密集型应用,不算是计算密集型。异步,非阻塞,使用 epoll,和大量细节处的优化。也正是 nginx 之所以然的技术基石。