由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 每秒500万的关键
相关主题
每秒500万, 结论出来看了来,老姜你告诉我,这个计数器有啥用?
魏老师颠覆了我的世界观搞半天魏老师这个就是纯的in memory的系统?
每秒500万简单介绍一下老魏的结构
computer的历史就是不断地做出trade off. 每秒500万也一样。请老魏给出一个简单的文字解释
今天真开眼了TeacherWei 的订票机的问题
老魏的全国一盘棋小公司的网站也要用memcached之类的cache吗?
老魏,来,我给你一个极端的例子我的一个客户案例(high traffic),请大家批判分析指点
大规模多核并发的系统PK大规模多机并发的系统git的官方文档真叫一个烂
相关话题的讨论汇总
话题: 老魏话题: 线路话题: 每秒话题: 重叠话题: 上海
进入Programming版参与讨论
1 (共1页)
n**x
发帖数: 606
1
没人理,我继续分析:
- 北京到上海分20段
- 每段都有可能与别的线路重叠: 比如"北京->济南"这段就有可能与"沈阳->南京“的
线路重叠。
- 假设每段都与5条别的线路重叠,那么北京到上海的线路就有5的20次方的可能线路。
- 老魏的算法是遍历所有这些可能找到匹配。 (老魏我说错了请纠正)
- 5的20次方的可能性就不在是linear递增了,对吧。
老魏,我看你输了啊。
n**x
发帖数: 606
2
哪怕每段只跟别的两条线路重叠,可能线路也会有2的20次方的可能,也就是1M。 我没
算错吧?
T********i
发帖数: 2416
3
找匹配是前端机器在做。甚至可以让顾客自己选择。选择以后再送给抢票机。
总之,抢票机不管。
这样也是有数据依赖性,比如某个路段卖光,全程票也不能卖了。
所以,线路内的路段依赖性最强。
并不是说,联程内没依赖性,如果联程任何路段卖光,已经锁定的票要还回去。
n**x
发帖数: 606
4
好了,这下不就清楚了吗。
老魏的前提是:
- 我要买北京-〉上海, 直达还是联程票用户自己选。如果选直达没票,用户就自己选
择是否可以买到”北京->济南“ ”济南-〉上海“的连票。
所以系统不负责动态计算。
古德霸的前提是:
- 用户要买“北京-〉上海” ,系统动态计算。
所以这两个需求没有可比性。不要吵了。

【在 T********i 的大作中提到】
: 找匹配是前端机器在做。甚至可以让顾客自己选择。选择以后再送给抢票机。
: 总之,抢票机不管。
: 这样也是有数据依赖性,比如某个路段卖光,全程票也不能卖了。
: 所以,线路内的路段依赖性最强。
: 并不是说,联程内没依赖性,如果联程任何路段卖光,已经锁定的票要还回去。

T********i
发帖数: 2416
5
动态计算也是我的中间cache机计算,这个可以无限scalable。
cache机确认有票也是也个大概,中途有latency就是不确定性。最后还要抢一把见真章。
各位有空看看相对论,光锥,因果律什么的,学学薛定谔猫之类也好,会有些帮助。

【在 n**x 的大作中提到】
: 好了,这下不就清楚了吗。
: 老魏的前提是:
: - 我要买北京-〉上海, 直达还是联程票用户自己选。如果选直达没票,用户就自己选
: 择是否可以买到”北京->济南“ ”济南-〉上海“的连票。
: 所以系统不负责动态计算。
: 古德霸的前提是:
: - 用户要买“北京-〉上海” ,系统动态计算。
: 所以这两个需求没有可比性。不要吵了。

z****e
发帖数: 54598
6
所以我昨天就说,老魏有一个小trick
就是把复杂得需求推给其他人去做
现在是定义scope就开始争了
那这么没法搞
所以看清楚就没啥了
无非那么一回事
12306不是一个人能搞定的

【在 n**x 的大作中提到】
: 好了,这下不就清楚了吗。
: 老魏的前提是:
: - 我要买北京-〉上海, 直达还是联程票用户自己选。如果选直达没票,用户就自己选
: 择是否可以买到”北京->济南“ ”济南-〉上海“的连票。
: 所以系统不负责动态计算。
: 古德霸的前提是:
: - 用户要买“北京-〉上海” ,系统动态计算。
: 所以这两个需求没有可比性。不要吵了。

z****e
发帖数: 54598
7
cache机到你本机上还有一段距离
所以老魏就只算本机的时间,而不计算cache机需要的时间
500w/s就只能是本机的效率
分配到cache机上恐怕就是50w/s了
然后汇总到主机上,是500w/s
老魏你这样下去,要多少台机器才能搞定?
给个数吧

章。

【在 T********i 的大作中提到】
: 动态计算也是我的中间cache机计算,这个可以无限scalable。
: cache机确认有票也是也个大概,中途有latency就是不确定性。最后还要抢一把见真章。
: 各位有空看看相对论,光锥,因果律什么的,学学薛定谔猫之类也好,会有些帮助。

n*****t
发帖数: 22014
8
路径选择现在也是客户自己的事吧,同条线路有绿皮有头等舱,有早上 3 点有下午 5
点,系统没必要也不需要干这活

【在 z****e 的大作中提到】
: 所以我昨天就说,老魏有一个小trick
: 就是把复杂得需求推给其他人去做
: 现在是定义scope就开始争了
: 那这么没法搞
: 所以看清楚就没啥了
: 无非那么一回事
: 12306不是一个人能搞定的

n*****t
发帖数: 22014
9
都是叉八六,来 50 台也不贵

【在 z****e 的大作中提到】
: cache机到你本机上还有一段距离
: 所以老魏就只算本机的时间,而不计算cache机需要的时间
: 500w/s就只能是本机的效率
: 分配到cache机上恐怕就是50w/s了
: 然后汇总到主机上,是500w/s
: 老魏你这样下去,要多少台机器才能搞定?
: 给个数吧
:
: 章。

T********i
发帖数: 2416
10
你要啥都能干,我就给一个啥都能干的方案出来。
但是核心是单机数据库。我这人思路一向一致。从没变过。
就算CACHE机50万好了,能无限扩展。你要500万,还要能动态规划,那就11台好了。
你要每秒5000万,能动态规划,那就是101台。
增加到1001台,是5亿每秒。够不够银河系用的?
相关主题
老魏的全国一盘棋来,老姜你告诉我,这个计数器有啥用?
老魏,来,我给你一个极端的例子搞半天魏老师这个就是纯的in memory的系统?
大规模多核并发的系统PK大规模多机并发的系统简单介绍一下老魏的结构
进入Programming版参与讨论
z****e
发帖数: 54598
11
这不就结了么?
你上来就说你要11台机器的话
我估计大多数人都不会认为你说的有什么不对的
现在12306用了大概20个instances
所以我看差距在一个数量级内

【在 T********i 的大作中提到】
: 你要啥都能干,我就给一个啥都能干的方案出来。
: 但是核心是单机数据库。我这人思路一向一致。从没变过。
: 就算CACHE机50万好了,能无限扩展。你要500万,还要能动态规划,那就11台好了。
: 你要每秒5000万,能动态规划,那就是101台。
: 增加到1001台,是5亿每秒。够不够银河系用的?

n**x
发帖数: 606
12
路径选择如果是用户选,那这个题目基本中联程票就变成了多个直达票,很简单实现,
连锁都不要.。这就是老魏的trick.
所以我说没必要吵了。

5

【在 n*****t 的大作中提到】
: 路径选择现在也是客户自己的事吧,同条线路有绿皮有头等舱,有早上 3 点有下午 5
: 点,系统没必要也不需要干这活

z****e
发帖数: 54598
13
一般的叉八六能实现500w/s的req处理么?
我看有难度,而且不能随便并行
单机很多东西不用考虑,一旦并行后
很多东西都要考虑

【在 n*****t 的大作中提到】
: 都是叉八六,来 50 台也不贵
z****e
发帖数: 54598
14
我这是让老魏爽
你要让客户选择
这里有一个反馈的问题
你反馈一串字符串
那500w/s非常吃力啊

5

【在 n*****t 的大作中提到】
: 路径选择现在也是客户自己的事吧,同条线路有绿皮有头等舱,有早上 3 点有下午 5
: 点,系统没必要也不需要干这活

g*****g
发帖数: 34805
15
当然不是,北京到上海只有3000张票,后面上海出去100个不同车次,都在竞争这3000
张票。
100*3000 = 30万车票,都要先锁到北京到上海这20段。你不能买到下面,不买上面。
这就是全国一盘棋。
联程困难本来就困难在这里。

【在 n**x 的大作中提到】
: 路径选择如果是用户选,那这个题目基本中联程票就变成了多个直达票,很简单实现,
: 连锁都不要.。这就是老魏的trick.
: 所以我说没必要吵了。
:
: 5

n*****t
发帖数: 22014
16
反馈的是 true or false,具体查询哪趟车是前端计算的,我只告诉你 T20 硬板有票
没票

【在 z****e 的大作中提到】
: 我这是让老魏爽
: 你要让客户选择
: 这里有一个反馈的问题
: 你反馈一串字符串
: 那500w/s非常吃力啊
:
: 5

n*****t
发帖数: 22014
17
1M request,其中大部分是 read,我看问题不大,5M 不好说

【在 z****e 的大作中提到】
: 一般的叉八六能实现500w/s的req处理么?
: 我看有难度,而且不能随便并行
: 单机很多东西不用考虑,一旦并行后
: 很多东西都要考虑

q*c
发帖数: 9453
18
...你真的读过你建议那些东西? 协定而猫啊, 量子杨谬等等, 我可是都读过得。
你知道银河系多大? 多少星球? ...分配下来你这处理 5亿每秒, 每个可居住星球连
0.1 tps 都没有, 哈哈。

【在 T********i 的大作中提到】
: 你要啥都能干,我就给一个啥都能干的方案出来。
: 但是核心是单机数据库。我这人思路一向一致。从没变过。
: 就算CACHE机50万好了,能无限扩展。你要500万,还要能动态规划,那就11台好了。
: 你要每秒5000万,能动态规划,那就是101台。
: 增加到1001台,是5亿每秒。够不够银河系用的?

n*****t
发帖数: 22014
19
别扯远了,现在就事论事讨论技术细节,要不又没完没了的

【在 q*c 的大作中提到】
: ...你真的读过你建议那些东西? 协定而猫啊, 量子杨谬等等, 我可是都读过得。
: 你知道银河系多大? 多少星球? ...分配下来你这处理 5亿每秒, 每个可居住星球连
: 0.1 tps 都没有, 哈哈。

T********i
发帖数: 2416
20
读过呀。反正对我有帮助。
地球上这么多弱智,你凭啥认为全银河系所有居民都要来抢票?

【在 q*c 的大作中提到】
: ...你真的读过你建议那些东西? 协定而猫啊, 量子杨谬等等, 我可是都读过得。
: 你知道银河系多大? 多少星球? ...分配下来你这处理 5亿每秒, 每个可居住星球连
: 0.1 tps 都没有, 哈哈。

a***e
发帖数: 27968
21
last sentence is B/S. you are getting closer to Master Li in it.

章。

【在 T********i 的大作中提到】
: 动态计算也是我的中间cache机计算,这个可以无限scalable。
: cache机确认有票也是也个大概,中途有latency就是不确定性。最后还要抢一把见真章。
: 各位有空看看相对论,光锥,因果律什么的,学学薛定谔猫之类也好,会有些帮助。

1 (共1页)
进入Programming版参与讨论
相关主题
git的官方文档真叫一个烂今天真开眼了
Android memory leak老魏的全国一盘棋
linux下面的程序间通信怎么样最快?老魏,来,我给你一个极端的例子
visual c++ project property设置问题大规模多核并发的系统PK大规模多机并发的系统
每秒500万, 结论出来看了来,老姜你告诉我,这个计数器有啥用?
魏老师颠覆了我的世界观搞半天魏老师这个就是纯的in memory的系统?
每秒500万简单介绍一下老魏的结构
computer的历史就是不断地做出trade off. 每秒500万也一样。请老魏给出一个简单的文字解释
相关话题的讨论汇总
话题: 老魏话题: 线路话题: 每秒话题: 重叠话题: 上海