作为模式匹配下文本替换、搜索、提取的强有力工具,正则表达式(RegularExpression)的应用已经从unix平台逐渐渗入到网络开发中了,今天要和大家分享的是正则“表达式中的特殊
字符解析说明”。
以下代码试用于GB2312编码。截取中文
字符串是PHP中一个头疼的问题。
解决方法是根据值是否大于等于128来判断是否是双字节
字符,以避免出现乱码的情况。
但中英文混合、特殊符号等问题总是存在,现在写一个比较全面的,仅供参考。
PHP处理
字符串的能力非常强大,方法也是多种多样,但有的时候你需要选择一种最简单且理想的解决方法。文章列举了10个PHP中常见的
字符串处理案例,并提供了相对应的最理想的处理方法。
匹配中文
字符的正则表达式:[u4e00-u9fa5]
评注:匹配中文还真是个头疼的事,有了这个表达式就好办了
匹配双字节
字符(包括汉字在内):[^x00-xff]
评注:可以用来计算
字符串的长度(一个双字节
字符长度计2,ascii
字符计1)
作为模式匹配下文本替换、搜索、提取的强有力工具,正则表达式(RegularExpression)的应用已经从unix平台逐渐渗入到网络开发中了,今天要和大家分享的是正则“表达式中的特殊
字符解析说明”。