精通
英语
和
开源
,
擅长
开发
与
培训
,
胸怀四海
第一信赖
手机:138-0381-0136
Q Q:396806883
微信:ryysoft
Nginx是一种开放源代码的Web服务器,自从最初作为Web服务器获得成功以来,现在还用作反向代理、HTTP缓存和负载平衡器。
使用Nginx的一些知名公司包括Autodesk、Atlassian、Intuit、T-Mobile、GitLab、DuckDuckGo、Microsoft、IBM、Google、Adobe、Salesforce、VMWare、LinkedIn、Cisco、Facebook、Twitter、Apple和英特尔等。
Nginx最初由Igor Sysoev创建,并于2004年10月首次公开发布。Igor最初将软件构想为C10k问题的答案,C10k问题是与处理10,000个并发连接有关的性能问题。
由于Nginx的根源在于大规模的性能优化,因此在基准测试中,Nginx的性能通常优于其他流行的Web服务器,尤其是在具有静态内容和或高并发请求的情况下,这就是Kinsta使用Nginx为其托管提供动力的原因。
Nginx旨在提供低内存使用率和高并发性。 Nginx不会为每个Web请求创建新的流程,而是使用异步的,事件驱动的方法,在单个线程中处理请求。
使用Nginx,一个主进程可以控制多个工作进程。主进程维护工作进程,而工作进程则进行实际的任务处理。由于Nginx是异步的,因此每个请求都可以由工作进程并发执行,而不会阻塞其他请求。Nginx的这个工作原理也被其它后端开发框架所抄袭,比如Node.js,这也是Nginx和Apache的主要区别。不过Nginx在产品化级别上和Apache比略有不如。
Nginx中常见的一些功能包括:
Apache是另一种流行的开源Web服务器。从原始数据来看,Apache是现有的最受欢迎的Web服务器,根据W3Techs的数据,拥有已知Web服务器的所有网站使用的比例为43.6%(低于2018年的47%)。 Nginx以41.8%紧随其后。
Netcraft对2.33亿个域进行了调查,发现Apache的使用率为31.54%,Nginx的使用率为26.20%。
虽然Apache是最流行的总体选择,但Nginx实际上是高流量网站中最流行的Web服务器。
当您按流量细分使用率时,Nginx将提供以下功能:
100,000个最受欢迎的网站中的60.9%(高于2018年的56.1%)
10,000个最受欢迎的网站中的67.1%(高于2018年的63.2%)
1,000个最受欢迎的网站中的62.1%(高于2018年的57%)
Netflix,NASA甚至WordPress.com等现有的一些资源最密集的网站都在使用Nginx。
另一方面,随着网站流量的增加,Apache的使用方向相反。它的功能:
100,000个最受欢迎的网站中的24.0%(低于2018年的27.1%)
10,000个最受欢迎的网站中的18.8%(低于2018年的21.5%)
1,000个最受欢迎的网站中的16.6%(高于2018年的16.2%)
看一下2004年以来的Google搜索字词,我们可以看到Apache一直在稳步下降,而NGINX却出现了小幅增长。
同样,当您认为NGINX在规模上表现更好时,高流量的网站选择使用Apache而不是NGINX也就不足为奇了。
这里推出锐英源的国外内容翻译文章、Nginx使用技巧和Nginx代码理解文档,欢迎同行交流。
nginx配置主要关注三个方向:反向代理、负载均衡和静态服务器。配置项很多初学者为了解决学习记忆问题,注意用#注释来做好备注。
nginx.conf配置文件中包含 main、 Events、http和upstrem,布局如下
main # 全局配置 events { # nginx工作模式配置 } http { # http设置 .... server { # 服务器主机配置
....
location { # 路由配置
....
} location path {
....
} location otherpath {
....
}
} server {
.... location {
....
}
} upstream name { # 负载均衡配置
....
}
}
如上述配置文件所示,主要由6个部分组成:
main:用于进行nginx全局信息的配置
events:用于nginx工作模式的配置
http:用于进行http协议信息的一些配置
server:用于进行服务器访问信息的配置
location:用于进行访问路由的配置
upstream:用于进行负载均衡的配置
观察下面的配置代码
# user nobody nobody;
worker_processes 2;
# error_log logs/error.log
# error_log logs/error.log notice
# error_log logs/error.log info
# pid logs/nginx.pid
worker_rlimit_nofile 1024;
上述配置都是存放在main全局配置模块中的配置项
user用来指定nginx worker进程运行用户以及用户组,默认nobody账号运行
worker_processes指定nginx要开启的子进程数量,运行过程中监控每个进程消耗内存(一般几M~几十M不等)根据实际情况进行调整,通常数量是CPU内核数量的整数倍
error_log定义错误日志文件的位置及输出级别【debug/info/notice/warn/error/crit】
pid用来指定进程id的存储文件的位置
worker_rlimit_nofile用于指定一个进程可以打开最多文件数量的描述
event {
worker_connections 1024;
multi_accept on;
use epoll;
}
上述配置是针对nginx服务器的工作模式的一些操作配置
worker_connections 指定最大可以同时接收的连接数量,这里一定要注意,最大连接数量是和worker processes共同决定的。
multi_accept 配置指定nginx在收到一个新连接通知后尽可能多的接受更多的连接
use epoll 配置指定了线程轮询的方法,如果是linux2.6+,使用epoll,如果是BSD如Mac请使用Kqueue
作为web服务器,http模块是nginx最核心的一个模块,配置项也是比较多的,项目中会设置到很多的实际业务场景,需要根据硬件信息进行适当的配置,常规情况下,使用默认配置即可!
http {
##
# 基础配置
##
sendfile on;
tcp_nopush on;
tcp_nodelay on;
keepalive_timeout 65;
types_hash_max_size 2048;
# server_tokens off;
# server_names_hash_bucket_size 64;
# server_name_in_redirect off;
include /etc/nginx/mime.types;
default_type application/octet-stream;
##
# SSL证书配置
##
ssl_protocols TLSv1 TLSv1.1 TLSv1.2; # Dropping SSLv3, ref: POODLE
ssl_prefer_server_ciphers on;
##
# 日志配置
##
access_log /var/log/nginx/access.log;
error_log /var/log/nginx/error.log;
##
# Gzip 压缩配置
##
gzip on;
gzip_disable "msie6";
# gzip_vary on;
# gzip_proxied any;
# gzip_comp_level 6;
# gzip_buffers 16 8k;
# gzip_http_version 1.1;
# gzip_types text/plain text/css application/json application/javascript
text/xml application/xml application/xml+rss text/javascript;
##
# 虚拟主机配置
##
include /etc/nginx/conf.d/*.conf;
include /etc/nginx/sites-enabled/*;
1) 基础配置
sendfile on:配置on让sendfile发挥作用,将文件的回写过程交给数据缓冲去去完成,而不是放在应用中完成,这样的话在性能提升有有好处
tc_nopush on:让nginx在一个数据包中发送所有的头文件,而不是一个一个单独发
tcp_nodelay on:让nginx不要缓存数据,而是一段一段发送,如果数据的传输有实时性的要求的话可以配置它,发送完一小段数据就立刻能得到返回值,但是不要滥用,这对流媒体环境有好处。
keepalive_timeout 10:给客户端分配连接超时时间,服务器会在这个时间过后关闭连接。一般设置时间较短,可以让nginx工作持续性更好
client_header_timeout 10:设置请求头的超时时间
client_body_timeout 10:设置请求体的超时时间
send_timeout 10:指定客户端响应超时时间,如果客户端两次操作间隔超过这个时间,服务器就会关闭这个链接
limit_conn_zone $binary_remote_addr zone=addr:5m :设置用于保存各种key的共享内存的参数,
limit_conn addr 100: 给定的key设置最大连接数
server_tokens:虽然不会让nginx执行速度更快,但是可以在错误页面关闭nginx版本提示,对于网站安全性的提升有好处哦
include /etc/nginx/mime.types:指定在当前文件中包含另一个文件的指令
default_type application/octet-stream:指定默认处理的文件类型可以是二进制
type_hash_max_size 2048:混淆数据,影响三列冲突率,值越大消耗内存越多,散列key冲突率会降低,检索速度更快;值越小key,占用内存较少,冲突率越高,检索速度变慢
2) 日志配置
access_log logs/access.log:设置存储访问记录的日志
error_log logs/error.log:设置存储记录错误发生的日志
3) SSL证书加密
ssl_protocols:指令用于启动特定的加密协议,nginx在1.1.13和1.0.12版本后默认是ssl_protocols SSLv3 TLSv1 TLSv1.1 TLSv1.2,TLSv1.1与TLSv1.2要确保OpenSSL >= 1.0.1 ,SSLv3 现在还有很多地方在用但有不少被攻击的漏洞。
ssl prefer server ciphers:设置协商加密算法时,优先使用我们服务端的加密套件,而不是客户端浏览器的加密套件
4) 压缩配置
gzip 是告诉nginx采用gzip压缩的形式发送数据。这将会减少我们发送的数据量。
gzip_disable 为指定的客户端禁用gzip功能。我们设置成IE6或者更低版本以使我们的方案能够广泛兼容。
gzip_static 告诉nginx在压缩资源之前,先查找是否有预先gzip处理过的资源。这要求你预先压缩你的文件(在这个例子中被注释掉了),从而允许你使用最高压缩比,这样nginx就不用再压缩这些文件了(想要更详尽的gzip_static的信息,请点击这里)。
gzip_proxied 允许或者禁止压缩基于请求和响应的响应流。我们设置为any,意味着将会压缩所有的请求。
gzip_min_length 设置对数据启用压缩的最少字节数。如果一个请求小于1000字节,我们最好不要压缩它,因为压缩这些小的数据会降低处理此请求的所有进程的速度。
gzip_comp_level 设置数据的压缩等级。这个等级可以是1-9之间的任意数值,9是最慢但是压缩比最大的。我们设置为4,这是一个比较折中的设置。
gzip_type 设置需要压缩的数据格式。上面例子中已经有一些了,你也可以再添加更多的格式。
5) 文件缓存配置
open_file_cache 打开缓存的同时也指定了缓存最大数目,以及缓存的时间。我们可以设置一个相对高的最大时间,这样我们可以在它们不活动超过20秒后清除掉。
open_file_cache_valid 在open_file_cache中指定检测正确信息的间隔时间。
open_file_cache_min_uses 定义了open_file_cache中指令参数不活动时间期间里最小的文件数。
open_file_cache_errors 指定了当搜索一个文件时是否缓存错误信息,也包括再次给配置中添加文件。我们也包括了服务器模块,这些是在不同文件中定义的。如果你的服务器模块不在这些位置,你就得修改这一行来指定正确的位置。
server模块
srever模块配置是http模块中的一个子模块,用来定义一个虚拟访问主机,也就是一个虚拟服务器的配置信息
server {
listen 80;
server_name localhost 192.168.1.100;
root /nginx/www;
index index.php index.html index.html;
charset utf-8;
access_log logs/access.log;
error_log logs/error.log;
......
}
核心配置信息如下:
server:一个虚拟主机的配置,一个http中可以配置多个server
server_name:用力啊指定ip地址或者域名,多个配置之间用空格分隔
root:表示整个server虚拟主机内的根目录,所有当前主机中web项目的根目录
index:用户访问web网站时的全局首页
charset:用于设置www/路径中配置的网页的默认编码格式
access_log:用于指定该虚拟主机服务器中的访问记录日志存放路径
error_log:用于指定该虚拟主机服务器中访问错误日志的存放路径
location模块
location模块是nginx配置中出现最多的一个配置,主要用于配置路由访问信息
在路由访问信息配置中关联到反向代理、负载均衡等等各项功能,所以location模块也是一个非常重要的配置模块
基本配置
location / {
root /nginx/www;
index index.php index.html index.htm;
}
location /:表示匹配访问根目录
root:用于指定访问根目录时,访问虚拟主机的web目录
index:在不指定访问具体资源时,默认展示的资源文件列表
反向代理配置方式
通过反向代理代理服务器访问模式,通过proxy_set配置让客户端访问透明化
location / {
proxy_pass http://localhost:8888;
proxy_set_header X-real-ip $remote_addr;
proxy_set_header Host $http_host;
}
uwsgi配置
wsgi模式下的服务器配置访问方式
location / {
include uwsgi_params;
uwsgi_pass localhost:8888
}
upstream模块
upstream模块主要负责负载均衡的配置,通过默认的轮询调度方式来分发请求到后端服务器
简单的配置方式如下
upstream name {
ip_hash;
server 192.168.1.100:8000;
server 192.168.1.100:8001 down;
server 192.168.1.100:8002 max_fails=3;
server 192.168.1.100:8003 fail_timeout=20s;
server 192.168.1.100:8004 max_fails=3 fail_timeout=20s;
}
核心配置信息如下
ip_hash:指定请求调度算法,默认是weight权重轮询调度,可以指定
server host:port:分发服务器的列表配置
-- down:表示该主机暂停服务
-- max_fails:表示失败最大次数,超过失败最大次数暂停服务
-- fail_timeout:表示如果请求受理失败,暂停指定的时间之后重新发起请求
在Windows平台下的IIS里,有系统日志和软件日志帮助维护,IIS日志可以用界面直观看到,并且还可以获取更多帮助文档,虽然Nginx这方面不如IIS,不过维护方式也是类似,主要要关注日志。
Nginx日志格式以及参数说明
log_format main '$remote_addr - $remote_user [$time_local] "$request" '
'$status $body_bytes_sent "$http_referer" '
'"$http_user_agent" "$http_x_forwarded_for"'
'"$request_time" "$upstream_response_time" "$upstream_addr" "$request_body"';
$相当于获取变量值的前缀。以上配置结果在日志中的显示内容如下:
111.26.32.80 - - [05/Jun/2017:03:07:19 +0800] "GET /css/indexPage.css?v=0.3469464244735898 HTTP/1.1" 200 3117 "http://live.100doc.cn/index?code=0312AIRe0Rf2xx1z22Te0K7CRe02AIRG&state=1" "Mozilla/5.0 (iPhone; CPU iPhone OS 10_2_1 like Mac OS X) AppleWebKit/602.4.6 (KHTML, like Gecko) Mobile/14D27 MicroMessenger/6.5.8 NetType/4G Language/zh_CN"
其中各字段的含义如下:
1、$remote_addr 与$http_x_forwarded_for 用以记录客户端的ip地址;
2、$remote_user :等同于用户名,由ngx_http_auth_basic_module认证;
3、$time_local : 用来记录访问时间与时区;
4、$request : 用来记录请求的url与http协议;
5、$status : 用来记录请求状态;成功是200,
6、$body_bytes_s ent :记录发送给客户端文件主体内容大小;
7、$http_referer :用来记录从那个页面链接访问过来的;
8、$http_user_agent :记录客户端浏览器的相关信息;
9、$request_time:以毫秒计的请求处理时间,从客户端第一个字节收到到记录日志前最后发出字节之间时间。
指的就是从接受用户请求的第一个字节到发送完响应数据的时间,即包括接收请求数据时间、程序响应时间、输出响应数据时间。
10、$upstream_response_time:是指从Nginx向后端(php-cgi)建立连接开始到接受完数据然后关闭连接为止的时间。
从上面的描述可以看出,$request_time肯定比$upstream_response_time值大,特别是使用POST方式传递参数时,因为Nginx会把requestbody缓存住,接受完毕后才会把数据一起发给后端。所以如果用户网络较差,或者传递数据较大时,$request_time会比$upstream_response_time大很多。
所以如果使用nginx的accesslog查看php程序中哪些接口比较慢的话,记得在log_format中加入$upstream_response_time。
11、$upstream_addr:后台upstream的地址,即真正提供服务的主机地址
12、当 nginx 尚未读取请求体的时候,或者请求体有一部分或者全部缓冲到临时文件的时候,$request_body 和 $echo_request_body 都将是空值。
Nginx 读取请求体是按需的,如果使用 ngx_proxy 模块的话,读取发生在 content 请求处理阶段。所以如果在早于 content 阶段之前的阶段(比如 rewrite 阶段)去读取 $request_body,则必是空值
处理办法在nginx.conf配置文件中添加了两个配置项:
fastcgi_buffers 32 8k;#指定本地需要用多少和多大的缓冲区来缓冲FastCGI的应答。
client_body_buffer_size 1024k; #缓冲区代理缓冲用户端请求的最大字节数
13、$ssl_protocol:SSL协议版本
14、$ssl_cipher:交换数据中的算法