仓酷云

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 664|回复: 18
打印 上一主题 下一主题

[学习教程] PHP教程之GD输入汉字的函数的剖析(函数代码系转...

[复制链接]
飘灵儿 该用户已被删除
跳转到指定楼层
楼主
发表于 2015-2-4 00:23:54 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
学会了PHP,那么学其他的语言,肯定速成,反过来也一样,如果你之前学过其他的语言,那么学PHP肯定快。函数|汉字       很早之前找到一个把GB码转化为UTF-8的函数,共同一个GB到UNICODE的对比表(gb2312.txt),用于在GD中输入汉字。后来发明在欲输入的内容中含有西文字符时,会呈现凌乱。后来找到了修正后的代码,处理了成绩。现将两个函数做一对照剖析以下。

起首,这是一个UNICODE到UTF-8编码转换的函数,这一局部修正前后没有变更:
function u2utf8($c)
{
for($i=0;$i<count($c);$i++)
$str="";
if ($c < 0x80) {
$str.=$c;
}
else if ($c < 0x800) {
$str.=(0xC0 | $c>>6);
$str.=(0x80 | $c & 0x3F);
}
else if ($c < 0x10000) {
$str.=(0xE0 | $c>>12);
$str.=(0x80 | $c>>6 & 0x3F);
$str.=(0x80 | $c & 0x3F);
}
else if ($c < 0x200000) {
$str.=(0xF0 | $c>>18);
$str.=(0x80 | $c>>12 & 0x3F);
$str.=(0x80 | $c>>6 & 0x3F);
$str.=(0x80 | $c & 0x3F);
}
return $str;
}

这里完整是依照UTF-8编码的划定规矩,经由过程判别字符属于分歧的UNICODE编码段局限,停止分歧的移位和位与操作,以转化为UTF-8编码。关于该划定规矩可参考http://www.utf8.org/上的申明。

这是修正前的GB转化为UTF-8编码的函数,个中挪用了下面的u2utf8函数。
function gb2utf8($gb)     /* Program writen by sadly www.phpx.com  */
{
if(!trim($gb))
return $gb;
$filename="gb2312.txt";
$tmp=file($filename);
$codetable=array();
while(list($key,$value)=each($tmp))
$codetable[hexdec(substr($value,0,6))]=substr($value,7,6);
$utf8="";
while($gb)
{
if (ord(substr($gb,0,1))>127)
{
$this=substr($gb,0,2);
$gb=substr($gb,2,strlen($gb));
$utf8.=u2utf8(hexdec($codetable[hexdec(bin2hex($this))-0x8080]));
}
else
{
$gb=substr($gb,1,strlen($gb));
$utf8.=u2utf8(substr($gb,0,1));
}
}

$ret="";
for($i=0;$i<strlen($utf8);$i+=3)
$ret.=chr(substr($utf8,$i,3));

return $ret;
}
函数中while轮回局部,把汉字逐一依照“对比表”转化为UNICODE,再经由过程u2utf8函数转化为UTF-8。但从中可以看出,while轮回停止后,又用一个for轮回,把每三个字节分解了一个UTF-8字符(见http://www.utf8.org/上的划定规矩申明,每一个汉字的UTF-8编码为三字节),没有思索到个中的西文字符(西文字符的UTF-8编码为一字节)。所以,假如欲输入的内容中不管是入手下手时呈现西文字符,或是汉字傍边交叉西文字符,转化为UTF-8后,城市被依照“每三个字节截取”的体例截开,招致乱码。


以下是修正后的函数:
function gb2utf8($gb)    /* Program writen by sadly   modified by agun */
{
if(!trim($gb))
return $gb;
$filename="gb2312.txt";
$tmp=file($filename);
$codetable=array();
while(list($key,$value)=each($tmp))
$codetable[hexdec(substr($value,0,6))]=substr($value,7,6);

$ret="";
$utf8="";
while($gb)
{
if (ord(substr($gb,0,1))>127)
{
$this=substr($gb,0,2);
$gb=substr($gb,2,strlen($gb));
$utf8=u2utf8(hexdec($codetable[hexdec(bin2hex($this))-0x8080]));
for($i=0;$i<strlen($utf8);$i+=3)
$ret.=chr(substr($utf8,$i,3));
}
else
{
$ret.=substr($gb,0,1);
$gb=substr($gb,1,strlen($gb));
}
}
return $ret;
}

修正后的函数将 GB转化为UNICODE、UNICODE转化为UTF-8、几个字节分解一个UTF-8字符,这三个步调在一个轮回里完成,特别是几个字节分解一个UTF-8字符这一步调,放在判别了字符属于西文仍是属于汉字的前提分支里,据此决意截取一个字节仍是三个字节。因而了局准确了!  学校并没有那么多的时间可以让我们在实际开发上面。
再见西城 该用户已被删除
沙发
发表于 2015-2-4 20:08:47 | 只看该作者
Ps:以上纯属原创,如有雷同,纯属巧合
admin 该用户已被删除
板凳
发表于 2015-2-10 05:56:38 | 只看该作者
小鸟是第一次发帖(我习惯潜水的(*^__^*) 嘻嘻……),有错误之处还请大家批评指正,另外,前些日子听人说有高手能用php写驱动程序,真是学无止境,人外有人,天外有天。
因胸联盟 该用户已被删除
地板
发表于 2015-2-17 17:17:35 | 只看该作者
再就是混迹于论坛啦,咱们的phpchina的论坛就很强大,提出的问题一般都是有达人去解答的,以前的帖子也要多看看也能学到不少前辈们的经验。别的不错的论坛例如php100,javaeye也是很不错的。
5#
发表于 2015-2-27 05:36:30 | 只看该作者
,熟悉html,能用div+css,还有javascript,优先考虑linux。我在开始学习的时候,就想把这些知识一起学习,我天真的认为同时学习能够互相呼应,因为知识是相通的。
不帅 该用户已被删除
6#
发表于 2015-2-28 20:49:46 | 只看该作者
本人接触php时间不长,算是phper中的小菜鸟一只吧。由于刚开始学的时候没有名师指,碰过不少疙瘩,呗很多小问题卡过很久,白白浪费不少宝贵的时间,在次分享一些子的学习的心得。
若天明 该用户已被删除
7#
发表于 2015-3-3 18:31:56 | 只看该作者
php里的数组为空的时候是不能拿来遍历的;(这个有点低级啊,不过我刚被这个边界问题墨迹了好长一会)
透明 该用户已被删除
8#
发表于 2015-3-6 01:33:37 | 只看该作者
建议加几个专业的phper的群,当然啦需要说话的人多,一处一点问题能有人回答你的,当然啦要让人回答你的问题,平时就得躲在里面聊天,大家混熟啦,愿意回答你问题的人自然就多啦。
精灵巫婆 该用户已被删除
9#
发表于 2015-3-11 03:15:07 | 只看该作者
Apache不是非得用80或者8080端口的,我刚开始安得时候就是80端口老占用,就用了个 81端口,结果照常,就是输localhost的时候,应该输入为 localhost:81
分手快乐 该用户已被删除
10#
发表于 2015-3-17 04:12:13 | 只看该作者
对于懒惰的朋友,我推荐php的集成环境xampp或者是wamp。这两个软件安装方便,使用简单。但是我还是强烈建议自己动手搭建开发环境。
愤怒的大鸟 该用户已被删除
11#
发表于 2015-3-17 18:09:34 | 只看该作者
首先我是坚决反对新手上来就用框架的,因为对底层的东西一点都不了解,造成知识上的真空,会对以后的发展不利。我的观点上手了解下框架就好,代码还是手写。当然啦如果是位别的编程语言的高手的话,这个就另当别论啦。
深爱那片海 该用户已被删除
12#
发表于 2015-3-24 17:19:39 | 只看该作者
有时候汉字的空格也能导致页面出错,所以在写代码的时候,要输入空格最好用引文模式。
再现理想 该用户已被删除
13#
发表于 2015-3-26 00:11:10 | 只看该作者
使用zendstdio 写代码的的时候,把tab 的缩进设置成4个空格是很有必要的
冷月葬花魂 该用户已被删除
14#
发表于 2015-3-26 18:29:20 | 只看该作者
兴趣是最好的老师,百度是最好的词典。
简单生活 该用户已被删除
15#
发表于 2015-3-28 01:46:47 | 只看该作者
写js我最烦的就是 ie 和 firefox下同样的代码 结果显示的结果千差万别,还是就是最好不要用遨游去调试,因为有时候遨游是禁用js的,有可能代码是争取结果被遨游折腾的认为是代码写错。
第二个灵魂 该用户已被删除
16#
发表于 2015-3-31 05:22:51 | 只看该作者
其实没啥难的,多练习,练习写程序,真正的实践比看100遍都有用。不过要熟悉引擎
海妖 该用户已被删除
17#
发表于 2015-5-1 20:11:21 | 只看该作者
如果你可以写完像留言板这样的程序,那么你可以去一些别人的代码了,
乐观 该用户已被删除
18#
发表于 2015-5-12 02:51:44 | 只看该作者
当然这种网站的会员费就几十块钱。
小女巫 该用户已被删除
19#
发表于 2015-6-6 03:06:10 | 只看该作者
在学习的过程中不能怕麻烦,不能有懒惰的思想。学习php首先应该搭建一个lamp环境或者是wamp环境。这是学习php开发的根本。虽然网络上有很多集成的环境,安装很方便,使用起来也很稳定、
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|仓酷云 鄂ICP备14007578号-2

GMT+8, 2024-12-22 21:31

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表