由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 各位用parquet+HDFS的多吗?
相关主题
分布式文件存储系统,以及此基础上的分布式计算,大家有何推荐的?AWS cloud 内部做log,大家怎么设计
Spark + C*有没有什么轮子可以管理大堆的binary文件啊?
今天碰见一个高手c++程序员不要把头埋在沙子里了
关于big data原来这个版是转行 CS 的
怎么自学cloud/big data programming举几个java换成C++的例子
[bssd]周末乱侃机械硬盘的物理极限
FORTRAN数组越界问题那个 distributed file sysyem 适合我的需求
NOSQL排名请教windows update/linux update的算法问题
相关话题的讨论汇总
话题: parquet话题: hdfs话题: 各位
进入Programming版参与讨论
1 (共1页)
J****R
发帖数: 373
1
最近琢磨用hdfs存储 hourly aggregation 数据,想用parquet作为存储格式(号称可
以优化存储和查询)。不知道版上有没有做过这方面的?
g*******o
发帖数: 156
2
很方便~ spark的接口也不错。

【在 J****R 的大作中提到】
: 最近琢磨用hdfs存储 hourly aggregation 数据,想用parquet作为存储格式(号称可
: 以优化存储和查询)。不知道版上有没有做过这方面的?

J****R
发帖数: 373
3
有什么上手的文档么?parquet网站上没什么东西,我只在github上面找到几个零碎的
例子。

【在 g*******o 的大作中提到】
: 很方便~ spark的接口也不错。
g*******o
发帖数: 156
4
找一下spark parquet?

【在 J****R 的大作中提到】
: 有什么上手的文档么?parquet网站上没什么东西,我只在github上面找到几个零碎的
: 例子。

1 (共1页)
进入Programming版参与讨论
相关主题
请教windows update/linux update的算法问题怎么自学cloud/big data programming
Graph database 业界用的多吗? (转载)[bssd]周末乱侃
请问java /c++ 双修的大牛,java和c++最主要的区别是什么?c++程序员转java您认为最需要补充的知识是什么FORTRAN数组越界问题
学scala和spark需要什么pre req?NOSQL排名
分布式文件存储系统,以及此基础上的分布式计算,大家有何推荐的?AWS cloud 内部做log,大家怎么设计
Spark + C*有没有什么轮子可以管理大堆的binary文件啊?
今天碰见一个高手c++程序员不要把头埋在沙子里了
关于big data原来这个版是转行 CS 的
相关话题的讨论汇总
话题: parquet话题: hdfs话题: 各位