本文实例讲述了php实现scws中文分词搜索的方法。分享给大家供大家参考,具体如下:
1、4个文件(本站下载地址。)解压后,放到一个地方 eg:E:/wamp/scws
2、php.ini 中配置
extension = php_scws.dll scws.default.charset = utf8 //配置默认的编码方式 scws.default.fpath = "E:/wamp/scws" //加压后文件的路径
3、使用
$so = scws_new(); $so->set_charset('utf8'); //编码 // 这里没有调用 set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词典和规则文件 $so->add_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb'); //$so->add_dict('./dd.txt',SCWS_XDICT_TXT); $so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); $so->set_duality(0); //散字二元 $so->set_ignore(0); //忽略标点符号 $so->set_multi(0); $wd='要搜索的内容'; $so->send_text($wd); while($tmp = $so->get_result()) //遍历后即得到字符串分割后的内容, //根据得到的内容分别到数据库中查找(like匹配) { }
亲自试验了一下如下:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <title>test</title> </head> <body> <"/^[^\x80-\xff]+$/", $keywords)){//判断keywords是否全为英文,全为英文的话按照字符串切割处理 $str1=explode(' ',$keywords); //先按照空格切割 foreach($str1 as $key=>$value) { $str2=explode(',',$value); //,切割 foreach($str2 as $k=>$v) { $str3=explode('.',$v); //。切割 foreach($str3 as $kk=>$vv) { array_push($arr,$vv);//处理完后,返回一个数组 } } } }else{//对中文的分词处理 $so = scws_new(); $so->set_charset('utf8'); // 这里没有调用 set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词典和规则文件 $so->add_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb'); $so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); $so->set_duality(0); //散字二元 $so->set_ignore(0); //忽略标点符号 $so->set_multi(0); $so->send_text($keywords); while ($tmp = $so->get_result())//得到一个数组,里面包含词组和标点符号 { foreach($tmp as $key=>$value) { $value=$value["word"]; if(preg_match("/^[一-龥]{6,21}$/", $value))//去除标点符号 { array_push($arr,$value); } } } } foreach($arr as $key=>$value)//便利得到的数组,到数据库中匹配 { if($key2!='') { $sql="select * from `$table` where `$key1` like '%$value%' or `$key2` like '%$value%'"; }else{ $sql="select * from `$table` where `$key1` like '%$value%'"; } $query=mysql_query($sql); array_push($str,$query); } return $str; } include('conn.php'); $keywords="哈哈lsd djk,hdjs dd"; $table='two_key'; $key1='address'; $key2=''; $query=search($keywords,$table,$key1,$key2); foreach($query as $key=>$value) { while($row=mysql_fetch_array($value)) { echo $row[id].'----'.$row[name].'-----'.$row[address].'<br>'; } } ?> </body> </html>
希望本文所述对大家PHP程序设计有所帮助。
华山资源网 Design By www.eoogi.com
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
华山资源网 Design By www.eoogi.com
暂无评论...
RTX 5090要首发 性能要翻倍!三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。
首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。
据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。
更新日志
2024年09月21日
2024年09月21日
- 王菲.1996-《乐乐精逊SACD日本限量版[WAV+CUE]
- 不止黑神话!杭州给原创企业真金白银扶持 打造“杭州游戏”品牌
- 很有多样性:《战锤》首次引入非二元性别角色
- 《少女前线2:追放》项目组将裁员 官方:进一步优化组织结构
- 陈慧琳.2002-闪亮每一天新歌+精选2CD【正东】【WAV+CUE】
- 袁培华.1992-有缘【歌林】【WAV+CUE】
- 王瑞霞.1996-是我太软心【名冠】【WAV+CUE】
- 《谭维维 30首经典流行歌曲精选辑 2CD》[WAV/分轨][1.1GB]
- 《赵传 出道三十年全新大碟 你过得还好吗》[WAV/分轨][460MB]
- 《发烧四大天王 磁性男声HiFi发烧碟 2CD》[WAV/分轨][1GB]
- 黑神话悟空上品鼠司空精魄获取方法一览|上品鼠司空精魄收集攻略
- 《真三国无双:起源》新情报将于9月26日公开,实机演示亮相!
- 黑神话悟空上品鼠禁卫精魄获取方法一览|上品鼠禁卫精魄收集攻略
- 优美的旋律至真的情怀《品茶轻音乐·极品典藏Vol.1CD1》[WAV+CUE]
- 曾嵘《峥嵘岁月DSD(试音碟)》WAV+CUE