由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 求推荐:time series DB
相关主题
老姜,我给你个summary鄙视芒果的被打脸了
mongoDB跟传统关系数据库比有什么优势?Why You Should Never Use MongoDB
求推荐database的软件 (转载)感觉nosql那个什么三驾马车完全是以讹传讹
我的一个客户案例(high traffic),请大家批判分析指点问一个关于C×和HBASE的性能比较问题
Re: 问Zhaoce个问题 (转载)有没有open source DB像greenplum那样同时支持RDBMS 和hadoop呢 (转载)
你们有没有一种感觉,其实big dataHadoop运行时是不是用命令行执行的?Hadoop和Java有什么联系?
NOSQL排名scala开发效率确实奇高
Nosql is not for everyone.为什么facebook不用Cassandra
相关话题的讨论汇总
话题: influxdb话题: 备份话题: db话题: 数据库话题: 开源
进入Programming版参与讨论
1 (共1页)
s******e
发帖数: 3
1
免费,开源,简单,不需要大块头,可以移植到嵌入平台(这个不是必须),同时有比
较完善的生态。
用过的请简单评价一下。
谢谢先!
s******e
发帖数: 3
2
用过,各种原因,不是很满意。其他还有吗。
h****e
发帖数: 2125
3
估计你的data偏传统型,估计只有based upon PostgreSQL的TimescaleDB了吧。

【在 s******e 的大作中提到】
: 用过,各种原因,不是很满意。其他还有吗。
s******e
发帖数: 3
4
大量的各种各样的传感器数据,希望可以部署到嵌入平台和云端

【在 h****e 的大作中提到】
: 估计你的data偏传统型,估计只有based upon PostgreSQL的TimescaleDB了吧。
g****t
发帖数: 31659
5
这个我有项目。300多个传感器。response时间1秒。
开源免费的real time DB我也没有用,那些项目看着太乱了.
另外real time DB这提法本身有很多问题。
问题转化成:
满足给定时间约束的,可以处理time series的application layer。case by case写代
码处理有时间约束的那些模块。
架构不便透露。不过如果知道时间约束是作用于什么地方
,应该是比较显然的。只要把那些地方处理好,就是real time系统了。


: 大量的各种各样的传感器数据,希望可以部署到嵌入平台和云端



【在 s******e 的大作中提到】
: 大量的各种各样的传感器数据,希望可以部署到嵌入平台和云端
T********i
发帖数: 2416
6
都没用过。除了influxdb,去年还有一个开源的tdengine。挺火的。不过明显github买
粉了。
我的Iot hub主要是本地存储。api都是我自己写的。设计和别人都不一样。我是强制
schema。动态压缩。
T********i
发帖数: 2416
7
顺便介绍一下我设计的IoT Data Architecture.
1. Time series data
2. Complex structured data with AVRO
https://librehome.com/doc/developers_doc/data_api/
这玩意儿,自制一个snowlake那样的data lake也不困难。
s******e
发帖数: 3
8
赞!

【在 T********i 的大作中提到】
: 顺便介绍一下我设计的IoT Data Architecture.
: 1. Time series data
: 2. Complex structured data with AVRO
: https://librehome.com/doc/developers_doc/data_api/
: 这玩意儿,自制一个snowlake那样的data lake也不困难。

T********i
发帖数: 2416
9
我个人认为。dB不重要。你看那些所谓的DB,都是在效率和灵活性之间纠结,而且永远
都没结果。
我的DB非常简单。就是一流水帐。timestamp必须有,剩下的就是anything。这个
anything在我的系统就是binary blob。然后我选择这个binary blob是avro encoded
json。这个压缩比已经接近最大了。
其实我不认为你数据能有很多。现在cpu和memory都不值钱。你自制一个query engine
也就是几千行的事情。我理想的query engine应该是基于json path,而且 support
aggregation。这就是一万能iot数据库了。


: 赞!



【在 s******e 的大作中提到】
: 赞!
s******e
发帖数: 3
10
难度对团队有点大,我个人精力也不允许。还是选个比较靠谱的,目前还是决定回到
influxdb

engine

【在 T********i 的大作中提到】
: 我个人认为。dB不重要。你看那些所谓的DB,都是在效率和灵活性之间纠结,而且永远
: 都没结果。
: 我的DB非常简单。就是一流水帐。timestamp必须有,剩下的就是anything。这个
: anything在我的系统就是binary blob。然后我选择这个binary blob是avro encoded
: json。这个压缩比已经接近最大了。
: 其实我不认为你数据能有很多。现在cpu和memory都不值钱。你自制一个query engine
: 也就是几千行的事情。我理想的query engine应该是基于json path,而且 support
: aggregation。这就是一万能iot数据库了。
:
:
: 赞!

相关主题
NOSQL排名Why You Should Never Use MongoDB
Nosql is not for everyone.感觉nosql那个什么三驾马车完全是以讹传讹
鄙视芒果的被打脸了问一个关于C×和HBASE的性能比较问题
进入Programming版参与讨论
T********i
发帖数: 2416
11
不错的选择。你又不做平台不做生态。咋省事选哪个就好。
老中的TDEngine也要反省一下为啥很多人不敢用它的?

【在 s******e 的大作中提到】
: 难度对团队有点大,我个人精力也不允许。还是选个比较靠谱的,目前还是决定回到
: influxdb
:
: engine

n******t
发帖数: 4406
12
influxdb肯定不好用,it的support fee擺在那裏的,free的能讓你用爽了,他也不用
賺錢了。
問題是,這世界上會寫這種東西的人就那麼多,either你自己寫一個,要不被人宰,有
什麼特別的辦法麼?

【在 s******e 的大作中提到】
: 难度对团队有点大,我个人精力也不允许。还是选个比较靠谱的,目前还是决定回到
: influxdb
:
: engine

s******e
发帖数: 3
13
我是支持收费的,自己是搞软件的,有同理心。
我们目前的项目都按这个开源模式走:,先开发,运维,都规模上去,收入允许,就开
始付费,收入不行了,再退回来。
当然碰到像oracle,ibm这种模式,只能敬而远之
T********i
发帖数: 2416
14
每个开源项目都有坑。但是靠谱的项目,都是几十行就能解决的。也就是99%人家都给
帮你做好了。给别人找麻烦也是给自己找麻烦。反正,迄今为止,我用过的开源项目,
没有100行以内解决不了的。
那些开源的,不管多少万行,在我这里都是透明的。我看到的是一个由架构和函数组成
的源代码portfolio。

【在 s******e 的大作中提到】
: 我是支持收费的,自己是搞软件的,有同理心。
: 我们目前的项目都按这个开源模式走:,先开发,运维,都规模上去,收入允许,就开
: 始付费,收入不行了,再退回来。
: 当然碰到像oracle,ibm这种模式,只能敬而远之

l*******m
发帖数: 1096
15
我好奇看了一眼tdegine, 有两个人说并发插入数据,表里数据count还会减少。估计追
求性能,一些基本的数据可靠性可能都有问题。快慢总可以解决,数据出错就是重大事故

:不错的选择。你又不做平台不做生态。咋省事选哪个就好。
n******t
发帖数: 4406
16
我沒覺得oracle,ibm的收費和influxdb這種有什麼本質區別。至少不用你當免費測試
員。價格,都是一個字貴。
問題是你如果是搞軟件的,你意思是你會寫production level的代碼?那自己寫一個好
了,否則至少要知道怎麼改。99%的像influxdb這種僞開源的情況,比哭着求別人
support解決問題靠譜。
IBM的問題是,你不是大客戶都不會理你。所以你也不操心他靠不靠譜。

【在 s******e 的大作中提到】
: 我是支持收费的,自己是搞软件的,有同理心。
: 我们目前的项目都按这个开源模式走:,先开发,运维,都规模上去,收入允许,就开
: 始付费,收入不行了,再退回来。
: 当然碰到像oracle,ibm这种模式,只能敬而远之

n******t
发帖数: 4406
17
一個開源的東西如果全是benchmark說自己多塊,一定要小心。
尤其這種成品,如果成熟穩定,還快,同時還有各種功能了,爲什麼要開源?很大可能
就是特殊情況下的一些benchmark讓你上鉤,當免費測試員的。

事故

【在 l*******m 的大作中提到】
: 我好奇看了一眼tdegine, 有两个人说并发插入数据,表里数据count还会减少。估计追
: 求性能,一些基本的数据可靠性可能都有问题。快慢总可以解决,数据出错就是重大事故
:
: :不错的选择。你又不做平台不做生态。咋省事选哪个就好。
: :

s******e
发帖数: 3
18
15年前,所在公司用AIX系统,半夜一个问题,一条命令可以自己解决,但ibm合同规定
,必须通过他们,方式如下:打电话,印度大妈用咖喱味英语问情况,然后让我干等,
她在另外的线上找我们当地的engineer,搞不定,让他直接找我,问明情况,用我提供
的命令解决。每小时收费1500刀。
另有一个case,某电信公司,几年前的oracle weblogic 授权费用超过100M,support
基本为零,他们的jdbc bug,我们自己发现,自己绕过,补丁等好几个月。
influxdb oss under MIT,企业版和云平台收费。

【在 n******t 的大作中提到】
: 我沒覺得oracle,ibm的收費和influxdb這種有什麼本質區別。至少不用你當免費測試
: 員。價格,都是一個字貴。
: 問題是你如果是搞軟件的,你意思是你會寫production level的代碼?那自己寫一個好
: 了,否則至少要知道怎麼改。99%的像influxdb這種僞開源的情況,比哭着求別人
: support解決問題靠譜。
: IBM的問題是,你不是大客戶都不會理你。所以你也不操心他靠不靠譜。

s******e
发帖数: 3
19
我早想说了,某些开源,图个名气,文档、测试、更新、支持完全不在线,有选择还是
别选它

【在 T********i 的大作中提到】
: 不错的选择。你又不做平台不做生态。咋省事选哪个就好。
: 老中的TDEngine也要反省一下为啥很多人不敢用它的?

T********i
发帖数: 2416
20
开源做好了,是一个巨大的社会工程。
这方面,秦人差的还远。
我又仔细看了一下。InfluxDB的设计还是靠谱的。文档还是能够表现出诚意的。

【在 s******e 的大作中提到】
: 我早想说了,某些开源,图个名气,文档、测试、更新、支持完全不在线,有选择还是
: 别选它

相关主题
有没有open source DB像greenplum那样同时支持RDBMS 和hadoop呢 (转载)为什么facebook不用Cassandra
Hadoop运行时是不是用命令行执行的?Hadoop和Java有什么联系?go适合做web么?
scala开发效率确实奇高请教真正了解nosql的大牛个问题
进入Programming版参与讨论
n******t
发帖数: 4406
21
你說的這些我當然知道。有一件事你可能沒想明白,你說的情況不是oracle和ibm,而
是你的“所在公司“想要達成的效果。
這件事在美國公司的情況基本無解,influxdb也是一樣的。這麼說把,假如你在這種大
公司裏面是負責time series db的,你自己沒有開發修改源代碼的能力,你經過評選選
定了influxdb,現在有個小弟能夠把這個東西的bug給解決了,你讓他搞,幾天解決問
題,還是一年給800K給influxdb,讓他們不快不慢地搞,問題可能只解決一點點,明年
再給800K?
你應該很清楚你會怎麼做,那麼你也就應該知道並不是哪個vendor的事情,自由市場裏
面vendor的表現很大程度上是被client決定的。

support

【在 s******e 的大作中提到】
: 15年前,所在公司用AIX系统,半夜一个问题,一条命令可以自己解决,但ibm合同规定
: ,必须通过他们,方式如下:打电话,印度大妈用咖喱味英语问情况,然后让我干等,
: 她在另外的线上找我们当地的engineer,搞不定,让他直接找我,问明情况,用我提供
: 的命令解决。每小时收费1500刀。
: 另有一个case,某电信公司,几年前的oracle weblogic 授权费用超过100M,support
: 基本为零,他们的jdbc bug,我们自己发现,自己绕过,补丁等好几个月。
: influxdb oss under MIT,企业版和云平台收费。

s******e
发帖数: 3
22
同意你的观点。
但influxdb和elk的模式我觉得还行,社区支持还挺及时,主要用得人多。另外在上规
模之前免费,上规模后看情况,真搞大了,也有钱请的大拿自己弄。我记得很多大厂都
是这个路数起来的。

【在 n******t 的大作中提到】
: 你說的這些我當然知道。有一件事你可能沒想明白,你說的情況不是oracle和ibm,而
: 是你的“所在公司“想要達成的效果。
: 這件事在美國公司的情況基本無解,influxdb也是一樣的。這麼說把,假如你在這種大
: 公司裏面是負責time series db的,你自己沒有開發修改源代碼的能力,你經過評選選
: 定了influxdb,現在有個小弟能夠把這個東西的bug給解決了,你讓他搞,幾天解決問
: 題,還是一年給800K給influxdb,讓他們不快不慢地搞,問題可能只解決一點點,明年
: 再給800K?
: 你應該很清楚你會怎麼做,那麼你也就應該知道並不是哪個vendor的事情,自由市場裏
: 面vendor的表現很大程度上是被client決定的。
:

d*******r
发帖数: 3299
23
ELK以前用过, 真是难用...
所以对influxDB这种,也应该持谨慎态度, 虽然我还没用过它.
其实这些开源项目折腾多了,最后会感慨,确实是自己实现最好.
不过给人打工的话,就不太敢自己去实现.
打工的时候,其实选个"当前著名开源项目",
有点政治正确的意思在里面,而且马上能弄点东西出来交差,
但是这样搞的 tech debt 其实很大...
一言难尽
T********i
发帖数: 2416
24
大家应该多从楼主的角度看问题。
我认为目前楼主的目标就是把数据存好,管起来。
而且数据量根本不大。
给你一天时间,让你拿出一个方案出来。答案不是明摆着么?
所以楼主选择是最优的。这世界谁也不傻。
至于过来发帖求推荐,属于骑驴找马而已。
我认为,influxdb,对于楼主的要求,属于overkill,只要能稳定运行就好。这个要求
其实不高。我想楼主已经达到了。
一旦稳定运行,最大的风险,反倒是版本升级。同时也是成本。但那是另外的问题。


: ELK以前用过, 真是难用...

: 所以对influxDB这种,也应该持谨慎态度, 虽然我还没用过它.

: 其实这些开源项目折腾多了,最后会感慨,确实是自己实现最好.

: 不过给人打工的话,就不太敢自己去实现.

: 打工的时候,其实选个"当前著名开源项目",

: 有点政治正确的意思在里面,而且马上能弄点东西出来交差,

: 但是这样搞的 tech debt 其实很大...

: 一言难尽



【在 d*******r 的大作中提到】
: ELK以前用过, 真是难用...
: 所以对influxDB这种,也应该持谨慎态度, 虽然我还没用过它.
: 其实这些开源项目折腾多了,最后会感慨,确实是自己实现最好.
: 不过给人打工的话,就不太敢自己去实现.
: 打工的时候,其实选个"当前著名开源项目",
: 有点政治正确的意思在里面,而且马上能弄点东西出来交差,
: 但是这样搞的 tech debt 其实很大...
: 一言难尽

s******e
发帖数: 3
25
基本就是这样。另外如果自己写,这种类型的工作,基本就是我一个干,还要持续维护
,本人能力精力有限。

【在 T********i 的大作中提到】
: 大家应该多从楼主的角度看问题。
: 我认为目前楼主的目标就是把数据存好,管起来。
: 而且数据量根本不大。
: 给你一天时间,让你拿出一个方案出来。答案不是明摆着么?
: 所以楼主选择是最优的。这世界谁也不傻。
: 至于过来发帖求推荐,属于骑驴找马而已。
: 我认为,influxdb,对于楼主的要求,属于overkill,只要能稳定运行就好。这个要求
: 其实不高。我想楼主已经达到了。
: 一旦稳定运行,最大的风险,反倒是版本升级。同时也是成本。但那是另外的问题。
:

n******t
发帖数: 4406
26
influxDB的最大問題是查詢不是standard的sql,如果dev用了這個接口一旦上了規模想
換就要和一堆人打架。
至於上了規模這東西試試就知道了,肯定是不好用的。問題是規模小的時候,裝個
whatever database都行了.

【在 d*******r 的大作中提到】
: ELK以前用过, 真是难用...
: 所以对influxDB这种,也应该持谨慎态度, 虽然我还没用过它.
: 其实这些开源项目折腾多了,最后会感慨,确实是自己实现最好.
: 不过给人打工的话,就不太敢自己去实现.
: 打工的时候,其实选个"当前著名开源项目",
: 有点政治正确的意思在里面,而且马上能弄点东西出来交差,
: 但是这样搞的 tech debt 其实很大...
: 一言难尽

T********i
发帖数: 2416
27
就像我说的,DB根本不重要。这个数据库你想migrate到其它任何数据库上,就是一个
select all和bulk insert的问题。能有100行代码么?
等数据库重要的时候,你的business都不知道值多少钱了?到那时候,就更加不是事儿
了。即使烦恼也是幸福的烦恼。
这帮说这不好那不好的,敢说influxdb不能稳定运行么?能稳定运行设置后不用管,就
够了。
再说我的那个MySQL,费老大劲设置了一个双机backup。还要操心如果双机都死咋办?
MySQL remote backup简直不是人干的。貌似要搞好还要花钱。即使花钱,也是太麻烦。
花了3个钟头做了个flat file backup,就高枕无忧了。直接rsync都能backup。仰天大
笑。。。

【在 s******e 的大作中提到】
: 基本就是这样。另外如果自己写,这种类型的工作,基本就是我一个干,还要持续维护
: ,本人能力精力有限。

g****t
发帖数: 31659
28
如果是时间序列数据,做个monitoring dashborad画图什么的。inlufxDB社区活跃,找
个tutorial什么的容易。配套的Grafans什么的有现成的。细节不用自己处理。

【在 n******t 的大作中提到】
: influxDB的最大問題是查詢不是standard的sql,如果dev用了這個接口一旦上了規模想
: 換就要和一堆人打架。
: 至於上了規模這東西試試就知道了,肯定是不好用的。問題是規模小的時候,裝個
: whatever database都行了.

s******e
发帖数: 3
29
的确是这么考虑的。

【在 g****t 的大作中提到】
: 如果是时间序列数据,做个monitoring dashborad画图什么的。inlufxDB社区活跃,找
: 个tutorial什么的容易。配套的Grafans什么的有现成的。细节不用自己处理。

g****t
发帖数: 31659
30
如果时间不是很紧迫。我会考虑弄个简单的wrapper,和specific DB绑定稍微松一些,
也防止未来它和java的接口改了。开源项目有碰到过半年不到改版本,改接口的。

【在 s******e 的大作中提到】
: 的确是这么考虑的。
相关主题
为什么大牛说hbase是strong consistency的?mongoDB跟传统关系数据库比有什么优势?
Hadoop/HBase/HDFS三驾马车过时了吗?求推荐database的软件 (转载)
老姜,我给你个summary我的一个客户案例(high traffic),请大家批判分析指点
进入Programming版参与讨论
n******t
发帖数: 4406
31
對的,exactly influxdb的優勢在安裝畫圖這些事情上面。
但是如果是長期穩定的服務,這些工作量其實都是k/n+k的部分。(k是常數).如果是
一竿子買賣我覺得還是用個mysql,postgres這種穩妥的。
至於社區活躍度其實沒用,influxdb的社區的人有個特點就是沒有開發能力,也對
influxdb代碼沒有影響力。所以你有什麼事情,除非是安裝配置之類的,都是一羣人在
哪裏求幫助,一個具體問題一堆人在哪裏哭喊了半天,沒人理一陣子就涼了。其實有時
候就是一行代碼的問題。

【在 g****t 的大作中提到】
: 如果是时间序列数据,做个monitoring dashborad画图什么的。inlufxDB社区活跃,找
: 个tutorial什么的容易。配套的Grafans什么的有现成的。细节不用自己处理。

n******t
发帖数: 4406
32
這個是應該搞的,如果一定要用influxdb這種東西。
但是我的個人經驗,這種本來用它就是爲了快糙猛的, 也不會花時間去幹這件事。

【在 g****t 的大作中提到】
: 如果时间不是很紧迫。我会考虑弄个简单的wrapper,和specific DB绑定稍微松一些,
: 也防止未来它和java的接口改了。开源项目有碰到过半年不到改版本,改接口的。

w********m
发帖数: 1137
33
influxdb应该不错的
就是那个query dsl太难看了
老陶的TDengine就比较聪明,直接用sql
不过现在用C写后台的年代已经过去了
现在做开源的话
time series DB是个好方向
市场很大
w********m
发帖数: 1137
34
云上的话,可以用elasticsearch
这是最成熟的方案,十几年了
楼上说难用
哪里难用
d*******r
发帖数: 3299
35
好用,难维护,没事儿就崩

【在 w********m 的大作中提到】
: 云上的话,可以用elasticsearch
: 这是最成熟的方案,十几年了
: 楼上说难用
: 哪里难用

w********m
发帖数: 1137
36
java程序都吃内存
你把内存管足
就没事了

【在 d*******r 的大作中提到】
: 好用,难维护,没事儿就崩
s******e
发帖数: 3
37
常规使用,几乎就是一个helm chart的部署,没啥工作,但要注意留出足够磁盘,否则
就会有点麻烦,另外做日志处理,需要定期清理。
高端使用,作为NoSql数据库和全文索引使用,里面道道还是很多的,用好了,性能和
内存、存储差别还是很大的。

【在 w********m 的大作中提到】
: java程序都吃内存
: 你把内存管足
: 就没事了

s*********y
发帖数: 6151
38
时序数据库InfluxDB或Prometheus (Numeric data only )
谁推荐Elastic的歇歇吧 不是时序数据库 是search engine (full text search) 应
用场景不一样 当然不会好用了
w********m
发帖数: 1137
39
tsdb跟一般数据库的区别就是
能不能设置retention policy
能不能做downsampling
c*******v
发帖数: 2599
40
My two cents:
time series是EE的內容。所謂的tsdb概念上不成熟。應用有便利可以用。
其他情況,跳坑要慎重。

【在 w********m 的大作中提到】
: tsdb跟一般数据库的区别就是
: 能不能设置retention policy
: 能不能做downsampling

相关主题
Re: 问Zhaoce个问题 (转载)Nosql is not for everyone.
你们有没有一种感觉,其实big data鄙视芒果的被打脸了
NOSQL排名Why You Should Never Use MongoDB
进入Programming版参与讨论
w******w
发帖数: 126
41
请教一下魏老师,对于数据库的备份。可否用现成的那种市场上 backup restore 文件
的产品。
直接去备份数据库相应的文件呢?
那样是不是更安全?
当然那个是需要花银子的 , 但是不知道是否比数据库本身的backup 更便宜些。
记着这样的产品是按照备份的文件大小来收费的。

烦。

【在 T********i 的大作中提到】
: 就像我说的,DB根本不重要。这个数据库你想migrate到其它任何数据库上,就是一个
: select all和bulk insert的问题。能有100行代码么?
: 等数据库重要的时候,你的business都不知道值多少钱了?到那时候,就更加不是事儿
: 了。即使烦恼也是幸福的烦恼。
: 这帮说这不好那不好的,敢说influxdb不能稳定运行么?能稳定运行设置后不用管,就
: 够了。
: 再说我的那个MySQL,费老大劲设置了一个双机backup。还要操心如果双机都死咋办?
: MySQL remote backup简直不是人干的。貌似要搞好还要花钱。即使花钱,也是太麻烦。
: 花了3个钟头做了个flat file backup,就高枕无忧了。直接rsync都能backup。仰天大
: 笑。。。

T********i
发帖数: 2416
42
有现成的commercial tool,肯定要无脑用啊。尤其是公司。
问题是TSDB本来就是小众产品。哪里有migration tool?所以我说自己写一个,也不过
百八十行。
当然,migration是要有plan的,关键就是minimize servie disruption。那是细节问
题了。具体问题要具体分析。

【在 w******w 的大作中提到】
: 请教一下魏老师,对于数据库的备份。可否用现成的那种市场上 backup restore 文件
: 的产品。
: 直接去备份数据库相应的文件呢?
: 那样是不是更安全?
: 当然那个是需要花银子的 , 但是不知道是否比数据库本身的backup 更便宜些。
: 记着这样的产品是按照备份的文件大小来收费的。
:
: 烦。

w******w
发帖数: 126
43
明白了,谢谢解答!

【在 T********i 的大作中提到】
: 有现成的commercial tool,肯定要无脑用啊。尤其是公司。
: 问题是TSDB本来就是小众产品。哪里有migration tool?所以我说自己写一个,也不过
: 百八十行。
: 当然,migration是要有plan的,关键就是minimize servie disruption。那是细节问
: 题了。具体问题要具体分析。

n******t
发帖数: 4406
44
我就問一下,你用過influxdb沒?

烦。

【在 T********i 的大作中提到】
: 就像我说的,DB根本不重要。这个数据库你想migrate到其它任何数据库上,就是一个
: select all和bulk insert的问题。能有100行代码么?
: 等数据库重要的时候,你的business都不知道值多少钱了?到那时候,就更加不是事儿
: 了。即使烦恼也是幸福的烦恼。
: 这帮说这不好那不好的,敢说influxdb不能稳定运行么?能稳定运行设置后不用管,就
: 够了。
: 再说我的那个MySQL,费老大劲设置了一个双机backup。还要操心如果双机都死咋办?
: MySQL remote backup简直不是人干的。貌似要搞好还要花钱。即使花钱,也是太麻烦。
: 花了3个钟头做了个flat file backup,就高枕无忧了。直接rsync都能backup。仰天大
: 笑。。。

n******t
发帖数: 4406
45
你知道別人在問什麼嗎?
還“具體問題具體分析“,你可以去當個售前,可以的。

文件

【在 T********i 的大作中提到】
: 有现成的commercial tool,肯定要无脑用啊。尤其是公司。
: 问题是TSDB本来就是小众产品。哪里有migration tool?所以我说自己写一个,也不过
: 百八十行。
: 当然,migration是要有plan的,关键就是minimize servie disruption。那是细节问
: 题了。具体问题要具体分析。

T********i
发帖数: 2416
46
你已经变成一个烂人了。pick up这种无趣的fight。
这样下去,你看看还有几个人搭理你?

【在 n******t 的大作中提到】
: 你知道別人在問什麼嗎?
: 還“具體問題具體分析“,你可以去當個售前,可以的。
:
: 文件

n******t
发帖数: 4406
47
對於大部分數據庫most likely直接備份數據庫文件是不work的,你基本上肯定會遇到
data corrpution。即使要用那種備份文件的tool,也最好先用數據庫自帶的export
data的tool先導出文件再用那些tool來備份。

不过
节问

【在 w******w 的大作中提到】
: 明白了,谢谢解答!
n******t
发帖数: 4406
48
別激動,就是看你瞎忽悠看不下去了而已。

【在 T********i 的大作中提到】
: 你已经变成一个烂人了。pick up这种无趣的fight。
: 这样下去,你看看还有几个人搭理你?

s******e
发帖数: 3
49
我来分享一点自己过往的经验,补全一点RDBMS数据库备份的各种情况:
1)数据库可以直接使用设备做存储的,完全不依赖文件系统,现在这种情况比较少了
,这个时候,备份其实就是备份那个设备里的全部数据。
2)备份有“物理/Raw”、“逻辑”备份的区别。物理备份就是你说的把数据库文件直
接备份,逻辑备份一般是人或程序可读的方式,比如Mysql的逻辑备份就是大量的SQL语
句。逻辑备份一般需要数据库运行,但也有停机后备份的例子。
3)备份有热备份,冷备份的区别,冷备份就是停机备份,不影响业务运行的备份就是
热备份。过去,当我们讲冷、热备份时,一般指物理备份。
无论使用设备文件还是普通OS文件做数据库存储,一般都是停机做冷备份,运行时做逻
辑备份。但是,企业级的数据库都支持联机热备份,并且能够保证数据库的完整性和一
致性。我知道MySQL、Oracle、PostgreSQL都可以,其他的了解不多,但凡是被大规模
应用的,都应该具备这个企业级功能。另外如果使用了SAN存储,很多数据库软件和SAN
有联动,可以在存储层使用snapshot等技术实现热备份。存储层的snapshot在冷备份里
也可以使用,可以极大缩短数据库停机时间。
数据备份不是只有上面讲的形式,还有其他方式,尤其在NoSQL领域,一些超大规模的
NoSQL数据,几百TB或上PB的数据,做常规备份是不现实的,就是是用最好的磁带机或
SSD也不可能在合理的时间内完成备份任务。所以就有一些备份的“替代方案”
1)主从复制 - 跨数据中心的主从复制,设置一个备份集群,把生产集群上的数据,尽
快复制到备份集群。比如Hbase的文档,就是建议建立备份集群做替代。
2)跨数据中心的分片复制集群(replica),还是以hbase为例,hbase可以指定
replica factor 为3,5,7...,并且利用rack awareness 技术,指定每个碎片必须分
布在不同的rack/host/data center。
但这些做法有一个问题,就是需要解决程序逻辑造成的数据恢复问题:有时需要回滚一
个表到过去某个时刻的状态。这个技术在NoSQL平台上是有实现的,一般通过table
snapshot实现。像snowflake等公司的平台,甚至可以保留历史数据,在select时,使
用时间戳就可以查询到那个时间的数据。这种情况下,再加上集群分片复制,有没有备
份其实意义不大了。

【在 w******w 的大作中提到】
: 明白了,谢谢解答!
s******e
发帖数: 3
50
再补充一点,利用存储层的snapshot在做人备份,一般适用于单价,或多机但单一存储
的情况。在集群分片数据库模式下,我个人没有使用过,不确定。
另外,像hbase,为追求性能,文档建议不要用LVM,那么存储层的snapshot就不可用。
1 (共1页)
进入Programming版参与讨论
相关主题
go适合做web么?Re: 问Zhaoce个问题 (转载)
请教真正了解nosql的大牛个问题你们有没有一种感觉,其实big data
为什么大牛说hbase是strong consistency的?NOSQL排名
Hadoop/HBase/HDFS三驾马车过时了吗?Nosql is not for everyone.
老姜,我给你个summary鄙视芒果的被打脸了
mongoDB跟传统关系数据库比有什么优势?Why You Should Never Use MongoDB
求推荐database的软件 (转载)感觉nosql那个什么三驾马车完全是以讹传讹
我的一个客户案例(high traffic),请大家批判分析指点问一个关于C×和HBASE的性能比较问题
相关话题的讨论汇总
话题: influxdb话题: 备份话题: db话题: 数据库话题: 开源