
敏感词过滤系统已被开发出来。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
敏感词过滤系统关于更详细的信息,请参考 Ubuntu Linux 下的环境构建:使用 `sudo apt-get install python-pip pip install nltk pip install jieba pip install pymongo` 命令安装相关包。Config 目录下的 `config` 文件允许进行服务器配置,具体针对数据库中预定的集合的不同段落列,可以灵活选择使用中文或英文进行过滤,同时也可以设置需要过滤的文章的数量。此外,邮件通知系统也进行了配置,当 `SendMailFlag` 设置为“是”时,将自动发送邮件通知。结果分析:`filter_status` 的细分结果为 1 表示文章通过了过滤过程,而 0 则表示未通过。黑名单中包含的 `stopwords_chs` 和 `stopwords_eng` 词汇可以随时更新和添加,每行添加一个过滤词。如果添加的过滤词无法被 `jieba` 分词器正确处理,则建议将该词及其出现频率一同加入到主字典 `dict` 文件或者用户自定义字典 `user_dict` 中,每行记录一条信息。
全部评论 (0)
还没有任何评论哟~


