
使用PySpark从CSV文件创建DataFrame的两种方式
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文介绍了如何利用PySpark从CSV文件中创建DataFrame的两种方法,帮助读者掌握数据处理的基础技能。
方法一:使用pandas辅助
```python
from pyspark import SparkContext
from pyspark.sql import SQLContext
import pandas as pd
sc = SparkContext()
sql_context = SQLContext(sc)
df = pd.read_csv(rgame-clicks.csv)
spark_df = sql_context.createDataFrame(df)
```
方法二:纯Spark代码
```python
from pyspark import SparkContext
from pyspark.sql import SQLContext
sc = SparkContext()
sql_context = SQLContext(sc)
```
全部评论 (0)
还没有任何评论哟~


