
使用Python对文章进行单词频率统计。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
Python进行单词计数,以进行单词词频统计,字典无疑是最佳的数据结构。将单词作为字典的键,而单词出现的次数则作为字典的值,这使得我们能够便捷地记录每个单词的频率。 这种方法与使用电话本类似,其中每个名字都关联着一个特定的电话号码。以下是具体的实现代码,它从名为“importthis.txt”的文件中读取单词,并统计出现次数最多的五个单词。
```python
# -*- coding:utf-8 -*-
import io
import re
class Counter:
def __init__(self, path):
:param path: 文件路径
self.map = {}
def add(self, word):
self.map[word] = self.map.get(word, 0) + 1
def most_common(self, n):
return sorted(self.map.items(), key=lambda item: item[1], reverse=True)[:n]
if __name__ == __main__:
c = Counter(importthis.txt)
print(c.most_common(5))
```
全部评论 (0)
还没有任何评论哟~


