本示例介绍如何使用Python编程语言高效地从CSV文件中提取特定行或列的数据,涵盖常用库pandas的基本用法。
站长用Python编写了一个可以提取CSV任一列的代码,欢迎使用。
假设有一个如下的表格数据:
| No. | Name | Age | Score |
|-----|-------|-----|-------|
| 1 | Apple | 12 | 98 |
| 2 | Ben | 13 | 97 |
| 3 | Celia | 14 | 96 |
| 4 | Dave | 15 | 95 |
可以将其存储为CSV文件,内容如下:
```
No.,Name,Age,Score
1,Apple,12,98
2,Ben,13,97
3,Celia,14,96
4,Dave,15,95
```
假设上述CSV文件保存为A.csv,如何用Python像操作Excel一样提取其中的一列(即一个字段)呢?利用Python自带的csv模块,有两种方法可以实现:
第一种方法是使用reader函数。该函数接收一个可迭代的对象(例如从CSV文件读取的内容),并将其转换成易于处理的数据形式。
下面是一个简单的例子来展示如何使用`csv.reader()`提取特定列:
```python
import csv
with open(A.csv, mode=r) as file:
reader = csv.reader(file)
headers = next(reader) # 获取CSV文件的标题行(第一行)
index_of_column_to_extract = headers.index(Name) # 找到需要提取列的位置
column_data = []
for row in reader: # 遍历每一行,获取指定位置的值
if len(row) > index_of_column_to_extract:
column_data.append(row[index_of_column_to_extract])
print(column_data)
```
这样就可以轻松地从CSV文件中提取出需要的数据列。