仓酷云

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 714|回复: 8
打印 上一主题 下一主题

[学习教程] PHP网站制作之一个用PHP写的中文分词函数

[复制链接]
小妖女 该用户已被删除
跳转到指定楼层
楼主
发表于 2015-1-16 22:15:43 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
PHP的理解是新手最难迈过的一道门槛,不过你应该感到幸运的是PHP已经最大极限的为了新手而努力了,如果你学过其他的语言,也许会觉得PHP的确相当的简单,但是如果你之前什么都没学过,那么阿弥陀佛,硬着头皮琢磨吧。
<?phpclassSegmentation{
var$options=array(lowercase=>TRUE,
segment_english=>FALSE);
var$dict_name=Unknown;
var$dict_words=array();
functionsetLowercase($value){
if($value){
$this->options[lowercase]=TRUE;
}else{
$this->options[lowercase]=FALSE;
}
returnTRUE;
}
functionsetSegmentEnglish($value){
if($value){
$this->options[segment_english]=TRUE;
}else{
$this->options[segment_english]=FALSE;
}
returnTRUE;
}
functionload($dict_file){
if(!file_exists($dict_file)){
returnFALSE;
}
$fp=fopen($dict_file,r);
$temp=fgets($fp,1024);
if($temp===FALSE){
returnFALSE;
}else{
if(strpos($temp,"t")!==FALSE){
list($dict_type,$dict_name)=explode("t",trim($temp));
}else{
$dict_type=trim($temp);
$dict_name=Unknown;
}
$this->dict_name=$dict_name;
if($dict_type!==DICT_WORD_W){
returnFALSE;
}
}
while(!feof($fp)){
$this->dict_words[rtrim(fgets($fp,32))]=1;
}
fclose($fp);
returnTRUE;
}
functiongetDictName(){
return$this->dict_name;
}
functionsegmentString($str){
if(count($this->dict_words)===0){
returnFALSE;
}
$lines=explode("n",$str);
return$this->_segmentLines($lines);
}
functionsegmentFile($filename){
if(count($this->dict_words)===0){
returnFALSE;
}
$lines=file($filename);
return$this->_segmentLines($lines);
}
function_segmentLines($lines){
$contents_segmented=;
foreach($linesas$line){
$contents_segmented.=$this->_segmentLine(rtrim($line))."n";
}
do{
$contents_segmented=str_replace(,,$contents_segmented);
}while(strpos($contents_segmented,)!==FALSE);
return$contents_segmented;?>
HTML中的任何元素都要亲自实践,只有明白了什么元素会起到什么效果之后,你才会记忆深刻,而一味的啃书,绝对是不行的,我想大部分新手之所以觉得概念难学,大部分是一个字“懒”,懒是阻止进步的最大敌人,所以克服掉懒的习惯,才能更快的学好一样工具。
简单生活 该用户已被删除
沙发
发表于 2015-1-19 06:19:09 | 只看该作者
这些都是最基本最常用功能,我们这些菜鸟在系统学习后,可以先对这些功能深入研究。
admin 该用户已被删除
板凳
发表于 2015-1-27 20:54:05 | 只看该作者
如果你已经到这种程度了,那么你已经可以做我的老师了。其实php也分很多的区域,
活着的死人 该用户已被删除
地板
发表于 2015-2-5 14:05:31 | 只看该作者
有时候汉字的空格也能导致页面出错,所以在写代码的时候,要输入空格最好用引文模式。
不帅 该用户已被删除
5#
发表于 2015-2-12 02:41:16 | 只看该作者
说点我烦的低级错误吧,曾经有次插入mysql的时间 弄了300年结果老报错,其实mysql的时间是有限制的,大概是到203X年  具体的记不清啦,囧。
谁可相欹 该用户已被删除
6#
发表于 2015-3-2 21:20:41 | 只看该作者
最后介绍一个代码出错,但是老找不到错误方法,就是 go to wc (囧),出去换换气没准回来就找到错误啦。
冷月葬花魂 该用户已被删除
7#
发表于 2015-3-11 06:30:40 | 只看该作者
作为一个合格的coder 编码的规范是必须,命名方面我推崇“驼峰法”,另外就是自己写的代码最好要带注释,不然时间长了,就算是自己的代码估计看起来都费事,更不用说别人拉。
海妖 该用户已被删除
8#
发表于 2015-3-17 22:48:37 | 只看该作者
本文当是我的笔记啦,遇到的问题随时填充
变相怪杰 该用户已被删除
9#
发表于 2015-3-25 05:05:59 | 只看该作者
Apache不是非得用80或者8080端口的,我刚开始安得时候就是80端口老占用,就用了个 81端口,结果照常,就是输localhost的时候,应该输入为 localhost:81
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|仓酷云 鄂ICP备14007578号-2

GMT+8, 2025-1-3 12:36

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表