
Windows平台上Hadoop HDFS文件中文分词示例代码
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本示例代码针对Windows平台环境,实现对Hadoop HDFS文件进行高效准确的中文分词处理,便于数据分析与挖掘。
在Windows平台上使用Eclipse的Hadoop插件开发一个基于HDFS文件的中文分词统计和排序功能,并以《唐诗三百首》为例,找出其中出现频率最高的词语。
全部评论 (0)
还没有任何评论哟~


简介:
本示例代码针对Windows平台环境,实现对Hadoop HDFS文件进行高效准确的中文分词处理,便于数据分析与挖掘。
在Windows平台上使用Eclipse的Hadoop插件开发一个基于HDFS文件的中文分词统计和排序功能,并以《唐诗三百首》为例,找出其中出现频率最高的词语。


