当前位置 主页 > 服务器问题 > Linux/apache问题 >

    htaccess Rewrite中文编码问题解决方法

    栏目:Linux/apache问题 时间:2018-12-14 14:21

    Seo方面对于中文地址或则文件名,在Google好像比重要大一些,今天正好看到andy的文章.转下,以后也许会用. .htaccess文件
    RewriteRule ^(.*).html$ index.php?id=$1
    对于一个网址//www.iis7.com/我是谁.html 我们将会遇到以下4种情况
    //www.iis7.com/我是谁.html (这里的”我是谁”是GB2312编码)
    IE打开,接收到的id是utf8编码的”我是谁”
    FireFox打开,接收不到id值,并且Apache会出现403错误。
    这里需要着重说明一下,因为FireFox会将”我是谁”自动urlencode,如果你的页面链接中”我是谁”的编码是gb2312就会出错。
    //www.iis7.com/我是谁.html (这里的”我是谁”是UTF8编码)
    IE和FireFox打开,都可以接收到id值
    //www.iis7.com/%CE%D2%CA%C7%CB%AD.html (这里是urlencode后的”我是谁”GB2312编码)
    IE和FireFox打开,都接收不到id值,并且Apache会出现403错误。
    //www.iis7.com/%E6%88%91%E6%98%AF%E8%B0%81.html (这里是urlencode后的”我是谁”UTF8编码)
    IE和FireFox打开,都可以接收到id值
    说明:
    “我是谁”的UTF8编码urlencode后为 %E6%88%91%E6%98%AF%E8%B0%81
    “我是谁”的GB2312编码urlencode后为 %CE%D2%CA%C7%CB%AD
    结论:
    Rewrite只接收UTF8
    IE和FireFox对中文URL的编码不同,要注意.
    这也是为什么上面的例子接收不到id值,并且出403错误.
    为了避免这种情况出现,页面中的链接最好是UTF8编码的,如果是GB2312,一定会有问题.
    最好的习惯是UTF8编码并urlencode,也就是上文的例4.