
基于Python的中文文本摘要程序实现.pdf
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本论文详细介绍了使用Python语言开发的一款中文文本自动摘取软件的具体实现过程与技术细节,旨在提升中文文档处理效率。
```python
#!/user/bin/python
# coding:utf-8
__author__ = yan.shi
import nltk
import numpy
import jieba
import codecs
N = 100 # 单词数量
CLUSTER_THRESHOLD = 5 # 单词间的距离
TOP_SENTENCES = 5 # 返回的top n句子
# 分句函数定义
def sent_tokenizer(texts):
start = 0
i = 0 # 每个字符的位置
sentences = []
punt_list = .!?。!?.decode(utf8) # 标点符号列表
for text in texts:
```
全部评论 (0)
还没有任何评论哟~


