Count(Distinct) 怎样去重统计
1、1. 创建一张大表

2、2.加载数据

3、3.设置5个reduce个数

4、4.执行去重id查询

5、5.采用GROUP by去重id

6、虽然会多用一个Job来完成,但在数据量大的情况下,这个绝对是值得的。
阅读量:111
阅读量:143
阅读量:59
阅读量:105
阅读量:55
1、1. 创建一张大表

2、2.加载数据

3、3.设置5个reduce个数

4、4.执行去重id查询

5、5.采用GROUP by去重id

6、虽然会多用一个Job来完成,但在数据量大的情况下,这个绝对是值得的。