由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - Workflow design请教
相关主题
Vert.x 上边有没有像node上的expressC++ optimization question
到底动态语言的好处是啥?用C++的写的numerical or optimization solver library
弱类型 server side[求助] 哪位有Excel Macro VBA 教程一类的电子书啊
有没有好的workflow system推荐请教一个跟search中用到的auto suggestion问题
a=b=0比a=0,b=0快FORTRAN数组越界问题
问个数组地址的问题一个问题,关于数据存储的选择
Do the two statements cost the same amount of time?有没有什么轮子可以管理大堆的binary文件啊?
tail call strange behavior on cl.exe大数据在工业界流行的黑暗真相
相关话题的讨论汇总
话题: workflow话题: business话题: amazon话题: simple话题: design
进入Programming版参与讨论
1 (共1页)
b********r
发帖数: 620
1
我现在的小公司正在一个痛苦的从.net到open source的转换过程。作为一个
prototyping的小项目,我们想把一个.net的console app改成一个workflow based的
web service。比如,把所有的business processing logic放在一个专门处理business
的web service里面,然后再新建一个flow control workflow来专门负责如何控制在不
同的business processing logic steps(就像一个finite state machine)执行。就像
一个很简化的Amazon Simple Workflow那样。
大家有没有什么好的建议如何实现这样一个很简化的Amazon Simple Workflow的东西?
或者有没有什么open source的projects我们可以借鉴?
z*******3
发帖数: 13709
2
先说说你们选了什么open source的工具吧
这样别人没法说,因为python,ruby, groovy, java都能做
都有workflow engine,你先说说你们打算用什么来替换.net吧
这样再从相关语言使用者中找建议
比如python 你可以问问公孙大神
我们用java的,我用过red hat的jbpm
很难用,ibm的work flow好用是好用
要钱,work flow engine还有web service很难说有什么统一的标准
所以这种碎片化的平台导致每一次整合都是非常痛苦的
b********r
发帖数: 620
3
主要原因是我软的东西花钱,比如什么sql server之类的,死贵死贵。而且现在发现不
仅贵,而且peformance wise好像有点跟不上了。打个比方,有的case最大可能处理快
30 million的用户的数据(还在研发阶段,没上prod)。就是每个用户只有10种情况要
处理,那也是300 million的级别。按照现在的处理速度,一天都不够。
我们打算走java/hadoop/storm路线。jbpm我看了下,是怎么个难用?有没有人用过
oozie,号称专门为hadoop打造,但是也可以implement其他的action node,比如call
out to other web service on http.

【在 z*******3 的大作中提到】
: 先说说你们选了什么open source的工具吧
: 这样别人没法说,因为python,ruby, groovy, java都能做
: 都有workflow engine,你先说说你们打算用什么来替换.net吧
: 这样再从相关语言使用者中找建议
: 比如python 你可以问问公孙大神
: 我们用java的,我用过red hat的jbpm
: 很难用,ibm的work flow好用是好用
: 要钱,work flow engine还有web service很难说有什么统一的标准
: 所以这种碎片化的平台导致每一次整合都是非常痛苦的

p**r
发帖数: 5853
4
3千万用户数据,3个亿状态不算多。
MS SQL可以应付得了,主要是看怎么处理的。
k**********g
发帖数: 989
5

business
你这是 distributed processing, workflow 通常指 business process management。
You will need to focus on profiling, benchmarking and optimizing the code,
whether or not you intend to scale horizontally (on multiple machines). It
is a necessary step, because when you scale horizontally you will need to
know how to partition the data, the computation, and the IO. You would have
to do this regardless of your choice of language.

【在 b********r 的大作中提到】
: 我现在的小公司正在一个痛苦的从.net到open source的转换过程。作为一个
: prototyping的小项目,我们想把一个.net的console app改成一个workflow based的
: web service。比如,把所有的business processing logic放在一个专门处理business
: 的web service里面,然后再新建一个flow control workflow来专门负责如何控制在不
: 同的business processing logic steps(就像一个finite state machine)执行。就像
: 一个很简化的Amazon Simple Workflow那样。
: 大家有没有什么好的建议如何实现这样一个很简化的Amazon Simple Workflow的东西?
: 或者有没有什么open source的projects我们可以借鉴?

k**********g
发帖数: 989
6

你看一下 Amazon Simple Workflow Service 的 Limits ,就知道不是你想像的那种用
途。
http://docs.aws.amazon.com/amazonswf/latest/developerguide/swf-

【在 b********r 的大作中提到】
: 主要原因是我软的东西花钱,比如什么sql server之类的,死贵死贵。而且现在发现不
: 仅贵,而且peformance wise好像有点跟不上了。打个比方,有的case最大可能处理快
: 30 million的用户的数据(还在研发阶段,没上prod)。就是每个用户只有10种情况要
: 处理,那也是300 million的级别。按照现在的处理速度,一天都不够。
: 我们打算走java/hadoop/storm路线。jbpm我看了下,是怎么个难用?有没有人用过
: oozie,号称专门为hadoop打造,但是也可以implement其他的action node,比如call
: out to other web service on http.

b********r
发帖数: 620
7
谢谢大牛们的指教!
更多的背景:我们知道workflow和处理大量数据是相关但是不一样的东西。我们现在有
2个console app,小app的数据量不大,大app的数据量可以超过300m。我们想从小app
入手,先改成workflow based的。如果效果不错,再处理大量数据的。在这其中,因为
大app的数据量大,我们想尽量找到一个比较支持处理大数据量的workflow产品。
比如说,如果一个workflow支持并行的create和run至少几十万甚至上百万的workflow
item/instance,我们就会比较倾向这样的workflow。如果只能并行的支持一千个左右
的item/instance我们就会另外考虑。
目前还没有horizontal partition,数据库也没有sharded。

【在 k**********g 的大作中提到】
:
: 你看一下 Amazon Simple Workflow Service 的 Limits ,就知道不是你想像的那种用
: 途。
: http://docs.aws.amazon.com/amazonswf/latest/developerguide/swf-

1 (共1页)
进入Programming版参与讨论
相关主题
大数据在工业界流行的黑暗真相a=b=0比a=0,b=0快
请教一个实际工作中performance和scalability的问题问个数组地址的问题
大牛们,请教大数据系统如何架构Do the two statements cost the same amount of time?
一个关于big data 系统架构的设计问题tail call strange behavior on cl.exe
Vert.x 上边有没有像node上的expressC++ optimization question
到底动态语言的好处是啥?用C++的写的numerical or optimization solver library
弱类型 server side[求助] 哪位有Excel Macro VBA 教程一类的电子书啊
有没有好的workflow system推荐请教一个跟search中用到的auto suggestion问题
相关话题的讨论汇总
话题: workflow话题: business话题: amazon话题: simple话题: design