
Java大数据作业涉及MapReduce技术和数据挖掘。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
课后作业1. 请提取日志记录中的访问者 IP 地址、访问时间、来源地点以及访问日志的具体内容。具体日志信息如下:192.168.170.111—[20/Jan/2014:16:35:27 +0800]“GET /examples/servlets/images/code.gif HTTP/1.1” 200 292 “http://192.168.170.152/examples/servlets/” “Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36” “-” 2. 请用代码描述迭代式和组合式 Job 执行的两种主要方法。 3. 请阐述 HBASE 中的 Map 和 Reduce 类以及序列化类所扮演的角色。 4. 请概述容量调度配置的步骤和注意事项。 5. 请简要说明 MapReduce 的流程机制。 6. 请对二次排序算法进行概述,并提供一个示例输入数据:1 22 32 14 63 13 83 2,以及期望的处理结果:1 22 12 33 13 23 84 6,并详细描述处理过程。
全部评论 (0)
还没有任何评论哟~


