PHP教程之GD输入汉字的函数的剖析(函数代码系转...
学会了PHP,那么学其他的语言,肯定速成,反过来也一样,如果你之前学过其他的语言,那么学PHP肯定快。函数|汉字 很早之前找到一个把GB码转化为UTF-8的函数,共同一个GB到UNICODE的对比表(gb2312.txt),用于在GD中输入汉字。后来发明在欲输入的内容中含有西文字符时,会呈现凌乱。后来找到了修正后的代码,处理了成绩。现将两个函数做一对照剖析以下。起首,这是一个UNICODE到UTF-8编码转换的函数,这一局部修正前后没有变更:
function u2utf8($c)
{
for($i=0;$i<count($c);$i++)
$str="";
if ($c < 0x80) {
$str.=$c;
}
else if ($c < 0x800) {
$str.=(0xC0 | $c>>6);
$str.=(0x80 | $c & 0x3F);
}
else if ($c < 0x10000) {
$str.=(0xE0 | $c>>12);
$str.=(0x80 | $c>>6 & 0x3F);
$str.=(0x80 | $c & 0x3F);
}
else if ($c < 0x200000) {
$str.=(0xF0 | $c>>18);
$str.=(0x80 | $c>>12 & 0x3F);
$str.=(0x80 | $c>>6 & 0x3F);
$str.=(0x80 | $c & 0x3F);
}
return $str;
}
这里完整是依照UTF-8编码的划定规矩,经由过程判别字符属于分歧的UNICODE编码段局限,停止分歧的移位和位与操作,以转化为UTF-8编码。关于该划定规矩可参考http://www.utf8.org/上的申明。
这是修正前的GB转化为UTF-8编码的函数,个中挪用了下面的u2utf8函数。
function gb2utf8($gb) /* Program writen by sadly www.phpx.com*/
{
if(!trim($gb))
return $gb;
$filename="gb2312.txt";
$tmp=file($filename);
$codetable=array();
while(list($key,$value)=each($tmp))
$codetable=substr($value,7,6);
$utf8="";
while($gb)
{
if (ord(substr($gb,0,1))>127)
{
$this=substr($gb,0,2);
$gb=substr($gb,2,strlen($gb));
$utf8.=u2utf8(hexdec($codetable));
}
else
{
$gb=substr($gb,1,strlen($gb));
$utf8.=u2utf8(substr($gb,0,1));
}
}
$ret="";
for($i=0;$i<strlen($utf8);$i+=3)
$ret.=chr(substr($utf8,$i,3));
return $ret;
}
函数中while轮回局部,把汉字逐一依照“对比表”转化为UNICODE,再经由过程u2utf8函数转化为UTF-8。但从中可以看出,while轮回停止后,又用一个for轮回,把每三个字节分解了一个UTF-8字符(见http://www.utf8.org/上的划定规矩申明,每一个汉字的UTF-8编码为三字节),没有思索到个中的西文字符(西文字符的UTF-8编码为一字节)。所以,假如欲输入的内容中不管是入手下手时呈现西文字符,或是汉字傍边交叉西文字符,转化为UTF-8后,城市被依照“每三个字节截取”的体例截开,招致乱码。
以下是修正后的函数:
function gb2utf8($gb) /* Program writen by sadly modified by agun */
{
if(!trim($gb))
return $gb;
$filename="gb2312.txt";
$tmp=file($filename);
$codetable=array();
while(list($key,$value)=each($tmp))
$codetable=substr($value,7,6);
$ret="";
$utf8="";
while($gb)
{
if (ord(substr($gb,0,1))>127)
{
$this=substr($gb,0,2);
$gb=substr($gb,2,strlen($gb));
$utf8=u2utf8(hexdec($codetable));
for($i=0;$i<strlen($utf8);$i+=3)
$ret.=chr(substr($utf8,$i,3));
}
else
{
$ret.=substr($gb,0,1);
$gb=substr($gb,1,strlen($gb));
}
}
return $ret;
}
修正后的函数将 GB转化为UNICODE、UNICODE转化为UTF-8、几个字节分解一个UTF-8字符,这三个步调在一个轮回里完成,特别是几个字节分解一个UTF-8字符这一步调,放在判别了字符属于西文仍是属于汉字的前提分支里,据此决意截取一个字节仍是三个字节。因而了局准确了!学校并没有那么多的时间可以让我们在实际开发上面。 Ps:以上纯属原创,如有雷同,纯属巧合 小鸟是第一次发帖(我习惯潜水的(*^__^*) 嘻嘻……),有错误之处还请大家批评指正,另外,前些日子听人说有高手能用php写驱动程序,真是学无止境,人外有人,天外有天。 再就是混迹于论坛啦,咱们的phpchina的论坛就很强大,提出的问题一般都是有达人去解答的,以前的帖子也要多看看也能学到不少前辈们的经验。别的不错的论坛例如php100,javaeye也是很不错的。 ,熟悉html,能用div+css,还有javascript,优先考虑linux。我在开始学习的时候,就想把这些知识一起学习,我天真的认为同时学习能够互相呼应,因为知识是相通的。 本人接触php时间不长,算是phper中的小菜鸟一只吧。由于刚开始学的时候没有名师指,碰过不少疙瘩,呗很多小问题卡过很久,白白浪费不少宝贵的时间,在次分享一些子的学习的心得。 php里的数组为空的时候是不能拿来遍历的;(这个有点低级啊,不过我刚被这个边界问题墨迹了好长一会) 建议加几个专业的phper的群,当然啦需要说话的人多,一处一点问题能有人回答你的,当然啦要让人回答你的问题,平时就得躲在里面聊天,大家混熟啦,愿意回答你问题的人自然就多啦。 Apache不是非得用80或者8080端口的,我刚开始安得时候就是80端口老占用,就用了个 81端口,结果照常,就是输localhost的时候,应该输入为 localhost:81 对于懒惰的朋友,我推荐php的集成环境xampp或者是wamp。这两个软件安装方便,使用简单。但是我还是强烈建议自己动手搭建开发环境。 首先我是坚决反对新手上来就用框架的,因为对底层的东西一点都不了解,造成知识上的真空,会对以后的发展不利。我的观点上手了解下框架就好,代码还是手写。当然啦如果是位别的编程语言的高手的话,这个就另当别论啦。 有时候汉字的空格也能导致页面出错,所以在写代码的时候,要输入空格最好用引文模式。 使用zendstdio 写代码的的时候,把tab 的缩进设置成4个空格是很有必要的 兴趣是最好的老师,百度是最好的词典。 写js我最烦的就是 ie 和 firefox下同样的代码 结果显示的结果千差万别,还是就是最好不要用遨游去调试,因为有时候遨游是禁用js的,有可能代码是争取结果被遨游折腾的认为是代码写错。 其实没啥难的,多练习,练习写程序,真正的实践比看100遍都有用。不过要熟悉引擎 如果你可以写完像留言板这样的程序,那么你可以去一些别人的代码了, 当然这种网站的会员费就几十块钱。 在学习的过程中不能怕麻烦,不能有懒惰的思想。学习php首先应该搭建一个lamp环境或者是wamp环境。这是学习php开发的根本。虽然网络上有很多集成的环境,安装很方便,使用起来也很稳定、
页:
[1]