文本滤镜是一款专业的敏感词过滤系统,能够有效检测和屏蔽不良内容,保障网络环境健康安全。
敏感词过滤系统更多详见Ubuntu Linux下的环境构建:使用以下命令安装所需库:
```
sudo apt-get install python-pip
pip install nltk
pip install jieba
pip install pymongo
```
配置文件位于Config目录下,名为config的文件中可以进行服务器设置。您可以选择语言(中文或英文),并设定要过滤的文章数量。时间替换从最近往前推移。
添加邮件通知系统:将SendMailFlag设为“是”以启用该功能,“否”则禁用。
结果判断:
- filter_status 1 表示通过过滤
- filter_status 0 表示不通过
黑名单设置:
- stopwords_chs 和 stopwords_eng 文件中可以随时添加需要过滤的词汇,一行一个。
如果要加入的过滤词无法被jieba分词正确处理,则可以通过以下方式将其和相关频次加入到主字典dict文件或用户自定义字典user_dict中:每行写一个条目。