分享web开发知识

注册/登录|最近发布|今日推荐

主页 IT知识网页技术软件开发前端开发代码编程运营维护技术分享教程案例
当前位置:首页 > 运营维护

php 去除常見中文停用詞(過濾敏感詞)

发布时间:2023-09-06 02:25责任编辑:蔡小小关键词:暂无标签

在用sphinx通過文章標題匹配相關文章時,去除停用詞後調出的文章相關性更好。

<?phpheader("Content-type:text/html;charset=utf-8"); $str = file_get_contents(‘stop.txt‘);//將常見中文停用詞表內容讀入到一個字串中$badword = explode("\r\n", $str);//轉換成陣列//print_r($arr);$badword1 =array_combine($badword,array_fill(0,count($badword),‘*‘)); //過濾敏感詞時替換成*$bb = ‘確定安裝的PowerShell版本https://www.itread01.com/‘;$str = strtr($bb,$badword1);echo $str;?>

来源:https://www.itread01.com/content/1543829108.html

php 去除常見中文停用詞(過濾敏感詞)

原文地址:https://www.cnblogs.com/codenong/p/10059738.html

知识推荐

我的编程学习网——分享web前端后端开发技术知识。 垃圾信息处理邮箱 tousu563@163.com 网站地图
icp备案号 闽ICP备2023006418号-8 不良信息举报平台 互联网安全管理备案 Copyright 2023 www.wodecom.cn All Rights Reserved