|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
也或许是因为我还没有真正的学到深处吧,说实在的,PHP中的很多高级点的应用,如PHP类、PHP函数基本还是不懂吧!汉字|成绩|中文 作者: bluedoor
原帖地址:http://www.anbbs.com/anbbs/index.php?f_id=3&page=1
这两天正在做一个关头字加亮显示的法式,写好的法式在当地测试也跑得好好的,可是一上去页面就呈现一堆一堆的乱码,别说加亮了,几乎就是没的看!
我就找毛病,找来找去,发明英文没有成绩,碰到汉字轻易出成绩,有的时分碰到汉字必出成绩。
总结一下:
当利用形式婚配的时分,如:preg_match_all($pat,……)与preg_replace($pat,……)……
轻易出成绩的情形以下:
preg_match_all("/(汉字)+/ism","我是汉字,看你把我怎样着!",$m_a);
这个形式很复杂就是婚配出“汉字”。这类情形形式中包括汉字可以胜利婚配出来,然而也不要乐意得太早,了局不肯定,为何不肯定你渐渐往下看。
必呈现成绩情形以下:
preg_match_all("/[汉字]+/ism","我是汉字,看你把我怎样着!",$m_a);
本想婚配呈现“汉”、“字”或“汉字”。这个必呈现成绩,婚配的了局一大群乱码,没准还会出个逝世轮回呢。为何会呈现这类情形?是由于PHP外部利用不是UNICODE,不撑持多字节文字,所以一个"汉字"就被当做4bytes的ASCII去停止形式婚配,不失足才怪呢!
后来我又尝尝从头写一下形式婚配,发明一种仿佛(为何说仿佛?往后看)办法可以处理:
preg_match_all("/(汉|字)+/ism","我是汉字,看你把我怎样着!",$m_a);
如许写可以婚配出“汉”、“字”或“汉字”,$m_a中的了局
Array
(
[0] => Array
(
[0] => 汉字
)
[1] => Array
(
[0] => 字
)
)
怎样全婚配的字符串呈现了吧!可是乐意得太早了,后来在实践顶用仍是会常常出成绩!再去找成绩,终究找到成绩的根了!PHP不撑持多字节文字,所以在停止形式婚配与字符操作的时分都是内码转化落后行的(我不晓得如许说对不合错误),举个实例吧:
eregi_replace("性","没有" , "有义务感");这个操作就是要把字符串"有义务感"中"性"字交换成"没有",最初的了局是甚么?由于"有义务感"中没有"性"就个字,了局应当是没有履行交换操作前往"有义务感",可是了局居然是"用挥叙任感"!
没想到吧!为何?看一下ASCII码你就分明了,2个ASCII码代码一个汉字"有义务感"的ASCII编码顺次为:211,208(有),212,240(责),200,206(任),184,208(感)
而"性"的编码为:208,212(性),刚好与有的第2字节和责的第1字节组合是分歧的!所以PHP就熟悉找到不异的形式停止婚配,拆成一半的汉字再与交换后的字串停止组合,所以就失足了!
事先我想最经常使用的str_replace(),应当不会有成绩的,然而现实上str_replace()履行一样的操作也会失足!如今我想之前停止汉字交换其实是太侥幸了!多是谁人时分停止的汉字交换都是对照长的汉字串吧,不太轻易呈现以上的情形。即便没有出成绩,也要晓得那是不平安的!
成绩是有的,任务还要持续做,克制的坚苦也就::::如今的自我了。
好在想起一组PHP的扩大模块,Multibyte String Functions,添加很多撑持多字节文字的操作的函数,如:ereg_replace() 对应着mb_ereg_replace() 等等。详细的函数申明请查询相干的文章。
总结:关于中文汉字平安的操作最好是利用Multibyte String Functions。 php manual(PHP手册)肯定是要从网上下载一个的,它很权威,也很全面,我自己认为它是一本很好的参考书,但是不适合新手当教材使用。 |
|