注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

good luck guys

welcome

 
 
 

日志

 
 

Nginx、PCRE和中文URL(UTF8编码)rewrite路径重写匹配问题 | 船长日志#more-793  

2012-01-05 16:46:54|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

Nginx、PCRE和中文URL(UTF8编码)rewrite路径重写匹配问题

发表于 十一月 1, 2011 船长

最近遇到了使用Nginx 重写中文UTF8编码路径的问题。 才发现默认情况下Nginx的rewrite是不支持UTF8匹配的。 比如:

rewrite ^/(..)$ /2个字符文章.html break; #用2个点
可以匹配到 /ab 或 /51, 但 /汉字 是匹配不到的。 我测试了一下, 要匹配两个字的 /汉字 路径, 得用

rewrite ^/(……)$ /2个汉字文章.html break; #要用六个点

如果要让 ^/(..)$ 匹配到2个汉字字符,得开启Nginx对UTF8字符的正则支持, 准确点说是开启Nginx使用的PCRE库的对UTF8字符的支持。因为Nginx的rewrite模块是调用PCRE来处理正则的。 如果PCRE没有问题,Nginx支持UTF8编码的重写样式是:

rewrite "(*UTF8)^/(..)$" /2个字符文章.html break;
#注意(*UTF8)前缀和引号的加入。

因为PCRE只有7.9以上的版本才支持这个(*UTF8)开头,所以系统上的PCRE一定要使用7.9以上的版本。 另外,编译PCRE时一定要开启UTF8的支持。 即使用(–enable-utf8)参数。 检查系统的PCRE版本和是否支持UTF8编码可以使用
pcretest -C
命令。执行后会显示如下的报告:

PCRE version 8.13 2011-08-16
Compiled with
UTF-8 support
Unicode properties support
Newline sequence is LF
R matches all Unicode newlines
Internal link size = 2
POSIX malloc threshold = 10
Default match limit = 10000000
Default recursion depth limit = 10000000
Match recursion uses stack

显示“UTF-8 support”就是支持UTF8编码了。

如果Nginx调用的PCRE为7.9以下的版本,使用 rewrite “(*UTF8)^/(..)$” /2个字符文章.html break; 这种形式的重写,在执行nginx -t检查时会出现如下的错误提示:

[emerg]: pcre_compile() failed: (*VERB) not recognized in “(*UTF8)^、……

如果Nginx调用的是7.9以上版本的PCRE,但是PCRE安装时没打开UTF8的支持开关,则会出现如下的错误提示:

nginx: [emerg] pcre_compile() failed: this version of PCRE is not compiled with PCRE_UTF8 support in “(*UTF8)^/…

解决办法是安装最新版本的的PCRE,并打开UTF8支持,方法如下(以当前8.13版的PCRE为例):
wget ftp://ftp.csx.cam.ac.uk/pub/software/programming/pcre/pcre-8.13.tar.gz
tar zxvf pcre-8.13.tar.gz
cd pcre-8.13
./configure --enable-utf8 --enable-unicode-properties
make
make install

然后重新编译安装Nginx。 Nginx默认会打开rewrite模块,并会自动查找系统上已经安装了的PCRE。 如果Nginx查找不到已经安装在系统上的PCRE, 或者系统上有多个PCRE, nginx调用了不支持UTF8的、或低版本的PCRE时(我遇到了后一种情况,并花费了很长的时间解决这个问题,这也是我为什么写这篇总结文章在这里给大家分享的原因。。。),可以在编译安装Nginx时指定PCRE源文件。例如:

wget ftp://ftp.csx.cam.ac.uk/pub/software/programming/pcre/pcre-8.13.tar.gz
tar zxvf pcre-8.13.tar.gz
wget http://nginx.org/download/nginx-1.0.8.tar.gz
tar zxvf nginx-1.0.8.tar.gz
cd nginx-1.0.8
./configure
--with-pcre=../pcre-8.13

注意,如果接着直接make && make install的话, PCRE因为没有启用UTF8, nginx将不能支持UTF8重写, 所以在这一种,我动了一点小手脚:打开./objs/Makefile 文件,找到以下段落:

../pcre-8.13/Makefile: objs/Makefile
cd ../pcre-8.13
&& if [ -f Makefile ]; then $(MAKE) distclean; fi
&& CC="$(CC)" CFLAGS="-O2 -fomit-frame-pointer -pipe "
./configure --disable-shared

在–disable-shared后加上 –enable-utf8和 –enable-unicode-properties参数, 即变成:
../pcre-8.13/Makefile: objs/Makefile
cd ../pcre-8.13
&& if [ -f Makefile ]; then $(MAKE) distclean; fi
&& CC="$(CC)" CFLAGS="-O2 -fomit-frame-pointer -pipe "
./configure --disable-shared --enable-utf8 --enable-unicode-properties

然后再make, make install。 最后关闭nginx并重启nginx(这里不能用nginx -s reload)。这样nginx就支持中文UTF8编码的url重写了。

转载请注明: 转自船长日志, 本文链接地址: http://www.cslog.cn/Content/nginx-pcre-utf8-rewrite/




引文来源  Nginx、PCRE和中文URL(UTF8编码)rewrite路径重写匹配问题 | 船长日志#more-793
  评论这张
 
阅读(1285)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017