一文带你详解Nginx/OpenResty,Nginx Lua编程基础,学不会别怪我
ztj100 2025-03-26 19:20 57 浏览 0 评论
Nginx Lua编程基础
OpenResty通过汇聚各种设计精良的Nginx模块(主要由OpenResty团队自主开发)将Nginx变成一个强大的通用Web应用平台。这样,Web开发人员和系统工程师可以使用Lua脚本语言调动Nginx支持的各种C以及Lua模块,快速构造出足以胜任10KB乃至1000KB以上单机并发连接的高性能Web应用系统。
OpenResty的目标是让Web服务直接跑在Nginx服务内部,充分利用Nginx的非阻塞I/O模型,不仅对HTTP客户端请求,甚至对远程后端(如MySQL、PostgreSQL、Memcached以及Redis等)都进行一致的高性能响应。
实战案例说明
本节用到的配置文件为源码工程中的nginx-lua-demo.conf文件。
运行本节的实例前需要修改openresty-start.bat(或openrestystart.sh)脚本中的PROJECT_CONF变量的值,将其改为nginx-luademo.conf,然后重启OpenRestry。
Nginx Lua的执行原理
在OpenResty中,每个Worker进程使用一个Lua VM(Lua虚拟机),当请求被分配到Worker时,将在这个Lua VM中创建一个协程,协程之间数据隔离,每个协程都具有独立的全局变量。
ngx_lua是将Lua嵌入Nginx,让Nginx执行Lua脚本,并且高并发、非阻塞地处理各种请求。Lua内置协程可以很好地将异步回调转换成顺序调用的形式。ngx_lua在Lua中进行的IO操作都会委托给Nginx的事件模型,从而实现非阻塞调用。开发者可以采用串行的方式编写程序,ngx_lua会在进行阻塞的IO操作时自动中断,保存上下文,然后将IO操作委托给Nginx事件处理机制,在IO操作完成后,ngx_lua会恢复上下文,程序继续执行,这些操作对用户程序都是透明的。
每个Nginx的Worker进程持有一个Lua解释器或LuaJIT实例,被这个Worker处理的所有请求共享这个实例。每个请求的context上下文会被Lua轻量级的协程分隔,从而保证各个请求是独立的,如图8-5所示。
(1)每个Worker(工作进程)创建一个LuaJIT VM,Worker内所有协程共享VM。
(2)将Nginx I/O原语封装后注入Lua VM,允许Lua代码直接访问。
(3)每个外部请求都由一个Lua协程处理,协程之间数据隔离。
(4)Lua代码调用I/O操作等异步接口时会挂起当前协程(并保护上下文数据),而不阻塞Worker进程。
(5)I/O等异步操作完成时还原协程相关的上下文数据,并继续运行。
每个Nginx Worker进程持有一个Lua解释器或者LuaJIT实例,被这个Worker处理的所有请求共享这个实例。每个请求的Context会被Lua轻量级的协程分割,从而保证各个请求是独立的。ngx_lua采用onecoroutine-per-request的处理模型,对于每个用户请求,ngx_lua会唤醒一个协程用于执行用户代码处理请求,当请求处理完成后,这个协程会被销毁。每个协程都有一个独立的全局环境(变量空间),继承于全局共享的、只读的公共数据。所以,被用户代码注入全局空间的任何变量都不会影响其他请求的处理,并且这些变量在请求处理完成后会被释放,这样就保证所有的用户代码都运行在一个sandbox(沙箱)中,这个沙箱与请求具有相同的生命周期。得益于Lua协程的支持,ngx_lua在处理10 000个并发请求时只需要很少的内存。根据测试,ngx_lua处理每个请求只需要2KB的内存,如果使用LuaJIT就会更少。所以ngx_lua非常适合用于实现可扩展的、高并发的服务。
Nginx Lua的配置指令
ngx_lua定义了一系列Nginx配置指令,用于配置何时运行用户Lua脚本以及如何返回Lua脚本的执行结果。
ngx_lua定义的Nginx配置指令大致如表8-2所示。
ngx_lua配置指令在Nginx的HTTP请求处理阶段所处的位置如图8-6所示。
下面介绍Nginx Lua的常用配置指令。
(1)lua_package_path指令,它的格式如下:
lua_package_path lua-style-path-str
lua_package_path指令用于设置“.lua”外部库的搜索路径,此指令的上下文为http配置块。它的默认值为LUA_PATH环境变量内容或者Lua编译的默认值。lua-style-path-str字符串是标准的lua path格式,“;;”常用于表示原始的搜索路径。下面是一个简单的例子:
#设置纯Lua扩展库的搜寻路径(';;' 是默认路径)
lua_package_path '/foo/bar/?.lua;/blah/?.lua;;';
OpenResty可以在搜索路径中使用插值变量。例如,可以使用插值变量$prefix或${prefix}获取虚拟服务器server的前缀路径,server的前缀路径通常在Nginx服务器启动时通过-p PATH命令行选项来指定。
(2)lua_package_cpath指令,它的格式如下:
lua_apckage_cpath lua-style-cpath-str
lua_package_cpath指令用于设置Lua的C语言模块外部库".so"(Linux)或".dll"(Windows)的搜索路径,此指令的上下文为http配置块。lua-style-cpath-str字符串是标准的lua cpath格式,“;;”常用于表示原始的cpath。下面是一个简单的例子:
#设置C编写的Lua扩展模块的搜寻路径(也可以用 ';;')
lua_package_cpath '/bar/baz/?.so;/blah/blah/?.so;;';
同样,OpenResty可以在搜索路径lua-style-cpath-str中使用插值变量,比如通过$prefix或${prefix}获取服务器前缀的路径。
(3)init_by_lua指令,它的格式如下:
init_by_lua lua-script-str
init_by_lua指令只能用于http上下文,运行在配置加载阶段。当Nginx的master进程在加载Nginx配置文件时,在全局Lua VM级别上运行由参数lua-script-str指定的Lua脚本块。当Nginx接收到HUP信号并开始重新加载配置文件时,Lua VM将会被重新创建,并且init_by_lua将在新的VM上再次运行。
如果Lua脚本的缓存是关闭的,那么每一次请求都运行一次init_by_lua处理程序。通过lua_code_cache指令可以关闭Lua脚本缓存,缓存默认是开启的。
注意:在生产场景下都会开启Lua脚本缓存,在init_by_lua调用require所加载的模块文件会缓存在全局的Lua注册表package.loaded中,所以在这里定义的全局变量和函数可能会污染命名空间,当然也会影响性能。
(4)lua_code_cache指令,它的格式如下:
lua_code_cache on | off
lua_code_cache用于启用或者禁用Lua脚本缓存,可以使用的上下文有http、server、location配置块。当缓存关闭时,通过ngx_lua提供的每个请求都将在一个单独的Lua VM实例中运行。在缓存关闭的场景下,在set_by_lua_file、content_by_lua_file、access_by_lua_file等指令中引用的Lua脚本都将不会被缓存,所有的Lua脚本都将从头开始加载。
通过该指令,开发人员可以进行编辑刷新模型的快速开发,改动代码后不需要重启Nginx。
在缓存关闭的情况下,编写在nginx.conf配置文件中的内联Lua脚本并不会重新加载。例如由set_by_lua、content_by_lua、access_by_lua和rewrite_by_lua指定的Lua脚本块将不会被反复更新,Lua代码改动后需要重启Nginx。
关闭缓存会对整体性能产生负面的影响。例如,在禁用Lua脚本缓存后,一个简单的"hello world"Lua示例的性能可能会下降一个数量级。
强烈禁止在生产环境中关闭Lua脚本缓存,仅仅可以在开发期间关闭Lua脚本缓存。
(5)set_by_lua指令,它的格式如下:set_by_lua $destVar lua-script-str paramsset_by_lua指令的功能类似于rewrite模块的set指令,具体来说,是将Lua脚本块的返回结果设置在Nginx的变量中。set_by_lua指令所处的上下文和执行阶段与Nginx的set指令基本相同。
下面是一个简单的例子,将Lua脚本的相加结果设置给Nginx的变量$sum,具体的代码如下:
location /set_by_lua_demo {
#set指令定义两个Nginx变量
set $foo 1;
set $bar 2;
#调用内联代码,将结果放入Nginx变量$sum
set_by_lua $sum 'return tonumber(ngx.arg[1]) + tonumber(ngx.arg[2])' $foo $bar;
echo $sum;
}
在上面的代码中,set_by_lua指令调用一段非常简单的Lua脚本,将两个输入参数$a、$b累积起来,然后将相加的结果设置到Nginx变量$sum中。
启动Nginx,访问
http://nginx.server/set_by_lua_demo?foo=bar地址,得到的结果如图8-7所示。
使用set_by_lua配置指令时,可以在Lua脚本的后面带上一个调用参数列表。在Lua脚本中可以通过Nginx Lua模块内部内置的ngx.arg表容器读取实际参数。
(6)access_by_lua指令,它的格式如下:access_by_lua $destVar
lua-script-straccess_by_lua执行在HTTP请求处理11个阶段的access阶段,使用Lua脚本进行访问控制。access_by_lua指令运行于access阶段的末尾,因此总是在allow和deny这样的指令之后运行,虽然它们同属access阶段。一般可以通过access_by_lua进行比较复杂的用户权限验证,因为能借助Lua脚本执行一系列复杂的验证操作,比如实时查询数据库或者其他后端服务。
我们来看一个简单的例子,利用access_by_lua实现ngx_access模块的IP地址过滤功能:
location /access_demo {
access_by_lua '
ngx.log(ngx.DEBUG, "remote_addr ="..ngx.var.remote_addr);
if ngx.var.remote_addr == "192.168.233.128" then
return;
end
ngx.exit(ngx.HTTP_UNAUTHORIZED);
';
echo "hello world";
}
以上代码中能放行的IP地址为192.168.233.128,此IP为笔者机器上的虚拟CentOS地址。重启Nginx,在CentOS上通过curl命令访问/access_demo,得到的结果如下:
[root@localhost ~]#curl http://192.168.233.1/access_demo
hello world
如果请求的来源IP不是192.168.233.128,就通过ngx_lua模块提供的Lua函数ngx.exit中断当前的整个请求处理流程,直接返回401(表示未授权错误)给客户端。如果access_by_lua指令没有将HTTP请求处理流程中断,处于access阶段后面的content阶段就会顺利执行,echo指令的结果就能输出给客户端。
(7)content_by_lua指令,它的格式如下:
content_by_lua lua-script-str
content_by_lua指令用于设置执行在content阶段的Lua代码块,执行结果将作为请求响应的内容。该指令可以用于location上下文,执行于content阶段。
需要注意的是,lua-script-str代码块用于在Nginx配置文件中编写字符串形式的Lua脚本,可能需要进行特殊字符转义,所以在OpenRestyv0.9.17发行版之后的版本不鼓励使用此指令,改为使用content_by_lua_block指令代替。content_by_lua_block指令Lua代码块使用花括号“{}”定义,不再使用字符串分隔符。
至此,主要的Nginx Lua配置指令介绍完了。但是,以上只是介绍了set_by_lua、access_by_lua、content_by_lua,没有介绍set_by_lua_file、access_by_lua_file、content_by_lua_file等指令,后面的系列指令和前面对应的指令功能是一样的,只是Lua脚本所在的位置不是内联在Nginx配置文件中,而是写在了单独的脚本文件中。
Nginx Lua的内置常量和变量
Nginx Lua常用的内置变量如表8-3所示。
Nginx Lua常用的内置常量大致如表8-4所示。
本文给大家讲解的内容是Nginx/OpenResty详解,Nginx Lua编程,Nginx Lua编程基础
- 下篇文章给大家讲解的是 Nginx/OpenResty详解,Nginx Lua编程,Nginx Lua编程实例;
- 觉得文章不错的朋友可以转发此文关注小编;
- 感谢大家的支持!
相关推荐
- 其实TensorFlow真的很水无非就这30篇熬夜练
-
好的!以下是TensorFlow需要掌握的核心内容,用列表形式呈现,简洁清晰(含表情符号,<300字):1.基础概念与环境TensorFlow架构(计算图、会话->EagerE...
- 交叉验证和超参数调整:如何优化你的机器学习模型
-
准确预测Fitbit的睡眠得分在本文的前两部分中,我获取了Fitbit的睡眠数据并对其进行预处理,将这些数据分为训练集、验证集和测试集,除此之外,我还训练了三种不同的机器学习模型并比较了它们的性能。在...
- 机器学习交叉验证全指南:原理、类型与实战技巧
-
机器学习模型常常需要大量数据,但它们如何与实时新数据协同工作也同样关键。交叉验证是一种通过将数据集分成若干部分、在部分数据上训练模型、在其余数据上测试模型的方法,用来检验模型的表现。这有助于发现过拟合...
- 深度学习中的类别激活热图可视化
-
作者:ValentinaAlto编译:ronghuaiyang导读使用Keras实现图像分类中的激活热图的可视化,帮助更有针对性...
- 超强,必会的机器学习评估指标
-
大侠幸会,在下全网同名[算法金]0基础转AI上岸,多个算法赛Top[日更万日,让更多人享受智能乐趣]构建机器学习模型的关键步骤是检查其性能,这是通过使用验证指标来完成的。选择正确的验证指...
- 机器学习入门教程-第六课:监督学习与非监督学习
-
1.回顾与引入上节课我们谈到了机器学习的一些实战技巧,比如如何处理数据、选择模型以及调整参数。今天,我们将更深入地探讨机器学习的两大类:监督学习和非监督学习。2.监督学习监督学习就像是有老师的教学...
- Python 模型部署不用愁!容器化实战,5 分钟搞定环境配置
-
你是不是也遇到过这种糟心事:花了好几天训练出的Python模型,在自己电脑上跑得顺顺当当,一放到服务器就各种报错。要么是Python版本不对,要么是依赖库冲突,折腾半天还是用不了。别再喊“我...
- 神经网络与传统统计方法的简单对比
-
传统的统计方法如...
- 自回归滞后模型进行多变量时间序列预测
-
下图显示了关于不同类型葡萄酒销量的月度多元时间序列。每种葡萄酒类型都是时间序列中的一个变量。假设要预测其中一个变量。比如,sparklingwine。如何建立一个模型来进行预测呢?一种常见的方...
- 苹果AI策略:慢哲学——科技行业的“长期主义”试金石
-
苹果AI策略的深度原创分析,结合技术伦理、商业逻辑与行业博弈,揭示其“慢哲学”背后的战略智慧:一、反常之举:AI狂潮中的“逆行者”当科技巨头深陷AI军备竞赛,苹果的克制显得格格不入:功能延期:App...
- 时间序列预测全攻略,6大模型代码实操
-
如果你对数据分析感兴趣,希望学习更多的方法论,希望听听经验分享,欢迎移步宝藏公众号...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- idea eval reset (50)
- vue dispatch (70)
- update canceled (42)
- order by asc (53)
- spring gateway (67)
- 简单代码编程 贪吃蛇 (40)
- transforms.resize (33)
- redisson trylock (35)
- 卸载node (35)
- np.reshape (33)
- torch.arange (34)
- npm 源 (35)
- vue3 deep (35)
- win10 ssh (35)
- vue foreach (34)
- idea设置编码为utf8 (35)
- vue 数组添加元素 (34)
- std find (34)
- tablefield注解用途 (35)
- python str转json (34)
- java websocket客户端 (34)
- tensor.view (34)
- java jackson (34)
- vmware17pro最新密钥 (34)
- mysql单表最大数据量 (35)