
Python删除文件内重复行示例
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本教程提供了一个使用Python编程语言删除文本文件中重复行的具体实例。通过此示例,学习者可以掌握如何读取、处理及写回清洗后的数据,同时理解基本的数据去重技术在实际应用中的操作方法。
Python可以用来去除文件中的重复行。我们可以通过创建一个空列表`res_list`来存储不重复的行,并检查每一行是否已经存在于这个列表中。如果某一行已经在`res_list`里,我们就将其添加到另一个记录重复句子的列表中。
以下是相关代码示例:
```python
# -*- coding: UTF-8 -*-
# 程序功能是为了完成判断文件中是否有重复句子
# 并将重复句子打印出来
res_list = [] # 创建一个空列表用于存储不重复的行
with open(raw_plain.txt, r) as f:
duplicate_lines = []
for line in f:
if line not in res_list:
res_list.append(line)
else:
duplicate_lines.append(line)
# 打印所有重复的句子
for dup_line in duplicate_lines:
print(dup_line, end=)
```
这段代码首先打开一个文件,逐行读取。对于每一行,如果该行不在`res_list`中,则将其添加到列表中;否则将此行作为重复项存储在另一个名为`duplicate_lines`的列表里。最后程序会输出所有被标记为重复的句子。
请注意要确保路径正确并根据实际需要调整文件名和目录位置。
全部评论 (0)


