由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Database版 - MapReduce 请教:key 能用pair value吗?比如 (转载)
相关主题
want to import CSV file to mysql, so I have to create a table first?How to handle inserting value to Identity column in sql server 2005
如何only update the first occurrence in a table%如何把一个table所有的column都选出来%
Table Merge (SQL Server)SQL aggregate multiple columns in ACCESS
其实有个问题好久没有明白!用SSIS EXPORT 到 EXCEL 2010 有2000个COLUMN,可能吗
a simple question about insertmacro 请教,谢谢
Oracle Group and Index question这个sql语句怎么写
better way to compare nullable columns?SQL combine two columns from two different tables no shared (转载)
问个external table field definition的问题sql里怎么做循环?
相关话题的讨论汇总
话题: key话题: mapreduce话题: pair话题: value话题: 比如
进入Database版参与讨论
1 (共1页)
W***o
发帖数: 6519
1
【 以下文字转载自 JobHunting 讨论区 】
发信人: Wardo (Wardo), 信区: JobHunting
标 题: MapReduce 请教:key 能用pair value吗?比如
发信站: BBS 未名空间站 (Fri Oct 18 01:17:05 2013, 美东)
我在分析一个犯罪数据,从2001年到2013年的,有大概6GB, CSV格式。里面大概有20
个columns,但是我只对其中几栏需要分析。比如我想分析每种犯罪在每年的数量,所以
我想能否用这样一个key: , 也就是犯罪类型和年份这个pair作为key,
然后这个key所对应的value就是sum of the occurrences of theft in 2005.
请教一下大侠这种是否可行?有没有更好的方法?谢谢,10个包子感谢
s**********o
发帖数: 14359
2
可以,但你的犯罪类型可以有SUB类型吧,比如,偷盗,可以分为小偷小摸,入室抢劫
,SHOPLIFTING,抢银行等等,如果将来一变,你的KEY也要变的,而且你这个明显是
GROUP BY出来的SUMMARY TABLE, 为什么不一个RECORD加一个KEY呢,这样更好存储
1 (共1页)
进入Database版参与讨论
相关主题
sql里怎么做循环?a simple question about insert
How to dump tables from Oracle to Access?Oracle Group and Index question
关于数据库格式互换,求教!better way to compare nullable columns?
How to use an *.csv file in SAS?问个external table field definition的问题
want to import CSV file to mysql, so I have to create a table first?How to handle inserting value to Identity column in sql server 2005
如何only update the first occurrence in a table%如何把一个table所有的column都选出来%
Table Merge (SQL Server)SQL aggregate multiple columns in ACCESS
其实有个问题好久没有明白!用SSIS EXPORT 到 EXCEL 2010 有2000个COLUMN,可能吗
相关话题的讨论汇总
话题: key话题: mapreduce话题: pair话题: value话题: 比如