y**b 发帖数: 10166 | 1 装工作站上,问几个常识啊
1. 前者能sli,后者价格还贵一点,哪个性能更强呢?
2. linux支持sli吗?
3. 现在工作站有两张quadro 4000(不能sli),做visualization,
内存消耗到100GB左右时总是突然熄火死机,把电源、主板、硬盘
都换了,还是照死。显卡换成5000或6000会改善吗?
4. k5000有什么区别啊? |
C********n 发帖数: 6682 | 2
怎么感觉是功耗问题啊
【在 y**b 的大作中提到】 : 装工作站上,问几个常识啊 : 1. 前者能sli,后者价格还贵一点,哪个性能更强呢? : 2. linux支持sli吗? : 3. 现在工作站有两张quadro 4000(不能sli),做visualization, : 内存消耗到100GB左右时总是突然熄火死机,把电源、主板、硬盘 : 都换了,还是照死。显卡换成5000或6000会改善吗? : 4. k5000有什么区别啊?
|
y**b 发帖数: 10166 | 3 dell T7600主机电源是1300w(还特意更换了一个),无论接在ups还是墙上,
照死,实在想不出是什么原因了。系统日志也看不出来。
特意装了win7 x64进行测试,结果远无法运行到linux下那一步,就提示
The Nvidia OpenGL driver lost connection with the display driver
and is unable to continue. 链接给了两个选项,一是减小workload,
二是延长time-out参数。我想换个更强大的显卡先试试。
【在 C********n 的大作中提到】 : : 怎么感觉是功耗问题啊
|
l*******1 发帖数: 866 | 4 单卡有问题么?我碰到突然黑屏重启的情况最终证明是卡的问题。不确定你这个是不是
。不过driver那个warning挺像的。
k5000是更新5000的,k6000还没出来。k5000性能比5000强多了,功耗温度也低很多。
不过k5000ECC只管memory, 5000应该对cache 也有ECC(忘了到哪一个level了)
【在 y**b 的大作中提到】 : 装工作站上,问几个常识啊 : 1. 前者能sli,后者价格还贵一点,哪个性能更强呢? : 2. linux支持sli吗? : 3. 现在工作站有两张quadro 4000(不能sli),做visualization, : 内存消耗到100GB左右时总是突然熄火死机,把电源、主板、硬盘 : 都换了,还是照死。显卡换成5000或6000会改善吗? : 4. k5000有什么区别啊?
|
y**b 发帖数: 10166 | 5 我没试过单卡,回头试试。你遇到的卡的问题,换卡就好了吗?
网上一堆抱怨4000过热或driver的问题。我用两个小台扇狂吹两张4000,结果显卡一直
温温的,
还是照死。
【在 l*******1 的大作中提到】 : 单卡有问题么?我碰到突然黑屏重启的情况最终证明是卡的问题。不确定你这个是不是 : 。不过driver那个warning挺像的。 : k5000是更新5000的,k6000还没出来。k5000性能比5000强多了,功耗温度也低很多。 : 不过k5000ECC只管memory, 5000应该对cache 也有ECC(忘了到哪一个level了)
|
l*******1 发帖数: 866 | 6 我那张卡平时没事,就是偶尔犯病。温度也不高。换其他卡就没事。
那张有问题的卡后来发现用软件加了电压就没事,估计是chip体质差点,要加压才行。
【在 y**b 的大作中提到】 : 我没试过单卡,回头试试。你遇到的卡的问题,换卡就好了吗? : 网上一堆抱怨4000过热或driver的问题。我用两个小台扇狂吹两张4000,结果显卡一直 : 温温的, : 还是照死。
|
y**b 发帖数: 10166 | 7 只好让dell再寄两张quadro 4000来试试,折腾死了。
【在 l*******1 的大作中提到】 : 我那张卡平时没事,就是偶尔犯病。温度也不高。换其他卡就没事。 : 那张有问题的卡后来发现用软件加了电压就没事,估计是chip体质差点,要加压才行。
|
y**b 发帖数: 10166 | 8 两张卡都换了,照死。
现在主板、电源、硬盘、显卡全都换了个遍,驱动也都试了个遍,问题都不能解决。
怎么办?
【在 y**b 的大作中提到】 : 只好让dell再寄两张quadro 4000来试试,折腾死了。
|
a********2 发帖数: 2561 | 9 会不会是显存?我以前电脑里的4000只有1G显存,处理可视化数据的时候就越来越慢,
最后假死机,但是也是基本不响应的那种。后来换了1.5G显存的卡,就好了。 |
l*******1 发帖数: 866 | 10 ft.... 这难说了。 你出问题的症状可重复性有多大?比如你说的那个用到100GB内存
就死的症状是总那样还是有时死有时不死?
硬件没问题那只好是软件问题。用到100G内存才出问题没准是driver bug....
单卡死么?
【在 y**b 的大作中提到】 : 两张卡都换了,照死。 : 现在主板、电源、硬盘、显卡全都换了个遍,驱动也都试了个遍,问题都不能解决。 : 怎么办?
|
|
|
C********n 发帖数: 6682 | 11 不只是电源功率阿
主板的pci-e 也是有功率限制的
【在 y**b 的大作中提到】 : dell T7600主机电源是1300w(还特意更换了一个),无论接在ups还是墙上, : 照死,实在想不出是什么原因了。系统日志也看不出来。 : 特意装了win7 x64进行测试,结果远无法运行到linux下那一步,就提示 : The Nvidia OpenGL driver lost connection with the display driver : and is unable to continue. 链接给了两个选项,一是减小workload, : 二是延长time-out参数。我想换个更强大的显卡先试试。
|
l*******1 发帖数: 866 | 12 quadro 4000是单6-pin,chip频率也低,功耗其实要求很低(比同chip的游戏卡都低)
,我觉得功率出问题可能性不大。
【在 C********n 的大作中提到】 : 不只是电源功率阿 : 主板的pci-e 也是有功率限制的
|
y**b 发帖数: 10166 | 13 双卡单卡都死,都可重复。而且不仅做visualization死,大量传输数据也死。
今天早上dell主动联系给换台新机,他们也被折腾够了。
dell的prosupport速度还不错,一联系马上就来换。
【在 l*******1 的大作中提到】 : ft.... 这难说了。 你出问题的症状可重复性有多大?比如你说的那个用到100GB内存 : 就死的症状是总那样还是有时死有时不死? : 硬件没问题那只好是软件问题。用到100G内存才出问题没准是driver bug.... : 单卡死么?
|
y**b 发帖数: 10166 | 14 嗯,处理15张图像成视频,必死;试了3张图像成视频还行,但4张就死了。
回头准备搞个6G显存的。
【在 a********2 的大作中提到】 : 会不会是显存?我以前电脑里的4000只有1G显存,处理可视化数据的时候就越来越慢, : 最后假死机,但是也是基本不响应的那种。后来换了1.5G显存的卡,就好了。
|
y**b 发帖数: 10166 | 15 dell换了台新机,把原来raid1硬盘挂上去,运行了几天,一切正常了。
真tm奇怪,硬盘,内存、主板、电源都换了都没用,换台机器就好了,
硬盘里的os都不用动。现在想唯一的可能就是raid controller有问题,
害死人。
【在 y**b 的大作中提到】 : 嗯,处理15张图像成视频,必死;试了3张图像成视频还行,但4张就死了。 : 回头准备搞个6G显存的。
|