
FlinkParquet:通过Apache Flink,以Parquet文件格式(并采用Avro技术)处理数据。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
此仓库提供了用于配置 Apache Flink 数据流以处理 Apache Parquet 文件的示例代码。 提供的资源目录下的 CSV 数据集,来源于下载的 Restaurant Score 数据集。 欲了解更多相关信息,请参考相关文档。 此外,如果对资源目录下的 Avro 模式文件(*.avsc)进行了修改,则需要重新生成模型类。 可以通过运行 `./compile_schemas.sh` 命令来完成这一步骤。 接下来,我们将 CSV 数据文件转换成 parquet 格式,并将结果写入 /tmp/business、/tmp/violations 和 /tmp/inspections 这些目录。 具体操作可以通过以下 Maven 命令执行:`mvn clean package exec:java -Dexec.mainClass=yigitbasi.nezih.ConvertTo`
全部评论 (0)
还没有任何评论哟~


