
使用 pandas DataFrame 按多列值进行判断并创建新列的示例
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本教程展示了如何利用Pandas库中的DataFrame对象,基于多个列的条件来计算和添加新的数据列,包含详细代码实例。
环境:Python3.6.4 + pandas 0.22 主要使用DataFrame的apply函数。当设置axis参数为1时,每次会取出DataFrame的一行进行处理;如果axis设为0,则每次取一列。
以下是代码示例:
```python
import numpy as np
import pandas as pd
data = {city: [Beijing, Shanghai, Guangzhou, Shenzhen, Hangzhou, Chongqing],
year: [20, 16, 19, 23, 45, 87]}
df = pd.DataFrame(data)
def process(row):
if (ing in row[city]) and (row[year] == 2016):
return 1
else:
return 0
df[test] = df.apply(process, axis=1)
```
这段代码的作用是:如果城市名中包含“ing”字段且年份为2016,则新列`test`的值赋为1,否则为0。
全部评论 (0)
还没有任何评论哟~


