
【Python】去除Excel表格中的重复行,进行数据预处理
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本教程介绍如何使用Python编程语言和Pandas库来识别并删除Excel文件中多余的重复行,以优化数据分析前的数据清理过程。
使用Python删除Excel表格中的重复行:
导入pandas包并命名为pd:
```python
import pandas as pd
```
读取Excel文件Sheet1的数据,并将其存储为DataFrame对象data:
```python
data = pd.DataFrame(pd.read_excel(test.xls, sheet_name=Sheet1))
```
打印数据内容,查看原始数据情况:
```python
print(data)
```
检查是否有重复行并输出结果:
```python
re_row = data.duplicated()
print(re_row)
```
去除所有列的重复行,并将处理后的DataFrame对象存储为no_re_row:
```python
no_re_row = data.drop_duplicates()
print(no_re_row)
```
基于“物品”这一列来删除重复行,输出最终结果。
全部评论 (0)
还没有任何评论哟~


