关于gpu的讨论汇总 - 话题女王

b***d
发帖数: 288

有少数同学还不太清楚，这里抛块砖头
一、副作用
辉瑞公司(Pfizer)曾经试验一种心脏病新药，用来治疗心绞痛。不幸的是，临床试
用时发现这药对心绞痛没有明显疗效。然而让医生们困惑的是，参与临床实验的男患者
们却拒绝交还剩余药片，甚至还有患者向医生索要更多的药片。后来发现，该药具有一
种神奇的“副作用”：能使阴茎迅速勃起。后来这种经过改良的具有壮阳作用的新药被
取名“伟哥”。
二、副作用
杨振宁和米尔斯1954年发表了杨－密尔斯方程。虽然这篇文章的出发点是不对的
，不能用在同位旋上，但20年后，略加推广，用在夸克间的力学作用上是却是完全准确
的。这方程到底有多厉害呢？这方程应该是能和爱因斯坦的相对论以及量子力学理论并
列的。“号称包治脚气的良药结果被人发现不能治脚气，却歪打正着成了治疗心脏病的
良药”（李政道语）。
三、图像处理
一张图片由很多像素组成。手机说1M的前置相机，大概是说照片有1000x1000像素
，如果每行1000个像素，一共1000行。CPU处理一张图片时，是先处理完一个像素，再
处理另外一个，直到把所有像素都处理了，这张图片就处... 阅读全帖

S******n
发帖数: 5022

来自主题: Hardware版 - GPU computing比CPU快几倍？

NVIDIA正式宣布CUDA 6：支持统一寻址！
NVIDIA今天(2013-11-15)正式宣布了最新版并行计算开发工具CUDA 6，相比此前的CUDA
5.5有着革命性的巨大进步。
NVIDIA表示，CUDA 6可以让并行编程前所未有的轻松，能够显著节省开发人员的时间和
精力，而通过GPU加速可带来最多8倍于CPU模式的性能提升。
CUDA 6的关键新特性包括：
1、统一寻址(Unified Memory)：
可直接访问CPU内存、GPU显存，无需在彼此之间手动拷贝数据，可在大量编程语言中更
简单地添加GPU加速支持。
其实CUDA 4就开始支持统一虚拟寻址，x86 CPU、GPU内存池可在同一空间内进行寻址，
但那仅仅是简单的内存管理，摆脱不了手动数据转移。
CUDA 6则在现有的内存池结构上增加了一个统一内存系统，程序员可以直接访问任何内
存/显存资源，或者在合法的内存空间内寻址，而不用管涉及到的到底是内存还是显存。
不过注意，CUDA 6并不是完全不需要数据拷贝，只不过将这个工作从程序员那里接过来
自动执行而已，它仍然受制于PCI-E的带宽和延迟，因此和AMD hUMA异构统... 阅读全帖

M********t
发帖数: 5032

来自主题: Joke版 - Google人工智能攻破了围棋，然后呢？雷锋网 study875 39分钟41秒前 Google日前宣布其程序AlphaGo击败了欧洲围棋职业选手，这意味着人工智能技术又或得了极大的突破。计算机目前已经在许多智力游戏比赛上战胜了人类顶级选手，包括国际象棋、五子棋、黑白棋、拼字游戏等等。而对于有着2500年历史的东方游戏围棋——比国际象棋要复杂得多——人类始终能够保持在和计算机对决中的胜利。不过，Google人工智能专家表示，这个壁垒或许很快将要被打破。随着AlphaGo在没有任何让子的情况下以5：0完胜法国围棋职业二段棋手樊麾，AlphaGo将在三月份对战韩国九段棋手李世乭。今天早上，《自然》杂志发表了一篇Google DeepMind团队——程序AlphaGo的创造者撰写的关于深度学习系统的论文。根据论文描述，在AlphaGo中，DeepMind研究员在程序中录入了大量职业棋手的棋谱——加起来多达3000万步——他们用增强学习的方法训练AI，让它自己下棋，研习棋谱。不过这只是第一步。理论上，这样的训练只能让这个人工智能系统无法突破人类的计算。为了获得更好的成绩，研究员随后让系统进行自我博弈，计算出比基础棋谱更多新的打点。也就是说，战胜人类就要靠这些新的东西。 “这其中最重要的是，AlphaGo不仅记录着大量的棋谱，还有一系列规则来指导‘思考’，”DeepMind CEO Demis Hassabis说道，“事实上，该程序能够通过机器学习的方式掌握比赛技巧。” DeepMind的技术核心结合了“强化学习”及其他人工智能手段，这种技术能够用于解决现实机器人执行物理任务和对环境作出回应的技术问题。就是说，要让机器人变得更“自然”。视觉判断 2014年初， Coulom的围棋程序“疯石（Crazystone）”在一次比赛中战胜九段棋手依田纪基。但是当时是在人类棋手让出4子的情况下赢得比赛，而这次AlphaGo并没有被让子，可以说比赛很公平。人工智能战胜人类围棋到底有多难？即使是最强大的计算机系统也无法在合理的时间内分析出下一步最优的走法。1997年IBM超级计算机“深蓝”则利用了蒙特卡洛搜索树的方式做到了这一点。“深蓝”能够预测出对手下一步会怎么走，而且计算力远高于人类。但是，围棋要复杂得多。国际象棋每一步平均只有35种可能性的走法，但是围棋呢——在19*19的棋盘内，共有361个点，就机器学习的角度而言，围棋的计算最大有3361种局面，大致的体量是10170，而已经观测到的宇宙中，原子的数量才1080。国际象棋最大只有2155种局面，称为香农数，大致是1047。使用蒙特卡洛树搜索技术，Crazystone等系统能够进行更长远的计算。而结合其他技术的话，它们能够对可能性走法进行刷选，然后选择出最优的策略。在大多数情况下，它们能够战胜人类选手，但不是最厉害的那一个。顶级大师中，走法很多时候依靠直觉——做棋除了需要计算，还有棋感——棋手能够根据棋形分析攻防线路。“好的棋形看起来顺手多了，”Hassabis本身也是一名围棋手，“这其中不只有计算角力，还有审美。这也是围棋几千年来都让人着迷的原因。” 因此，从2014年至2015年间，包括Facebook、爱丁堡大学、DeepMind等人工智能研究团队都将围棋人工智能系统的突破方向瞄准为——使得程序能够模仿人类的直觉式思维。自我强化深度学习要依靠神经网络技术，它是可以模拟人脑中神经元网络的软硬件网络。神经网络不会依靠蛮力或预先输入的规则，而是会分析大量数据，“学习”特定的任务。给神经网络提供足够的喵星人照片，它就能学习识别喵星人；提供足够的语音，它也会学习理解人类的语言；提供足够的围棋走法，它也会学会围棋。在DeepMind，爱丁堡和Facebook，研究人员希望神经网络能像人类选手一样，通过观看棋盘学习围棋。Facebook在最新的研究中表明，这种方法确实可行。结合深度学习与蒙特卡洛树搜索方法，Facebook打败了一些人类选手，虽然并非是Crazystone和其他顶尖选手。但DeepMind走得更远。在经过3000万步人类走法的训练后，它的神经网络能以57%的准确度（此前记录是44%）预测人类的下一步。然后Hassabis和团队通过强化学习技术，让这一神经网络与它自己的另一个稍有区别的版本对战。两者互搏中，系统会评估哪一步效果最好，即占领更多棋盘区域。最终，神经网络在判断哪一步更好时会越来越优秀。 DeepMind的研究者David Silver表示，“在与其它神经网络和它自己对战数百万局后，AlphaGo学会了自己发现新策略，并逐渐提高了水平。” 正是这种方法帮AlphaGo超越了其它围棋AI系统，包括Crazystone。但事情还没完，研究人员随后将结果再反馈给第二个神经网络。了解前任的走法了，第二个神经网络会使用许多相同的技术来判断每一步的后果。这一过程与深蓝等旧系统在国际象棋上的做法类似，只是它会在下棋过程中学习，分析更多数据，而非暴力破解所有可能的步骤。这样，AlphaGo不仅能战胜AI，还能战胜顶尖人类选手了。计算机网络 http://static.cnbetacdn.com/article/2016/0128/7bfcf7e43c9064b.jpg 李世乭与其它神经网络一样，DeepMind的系统运行在配备了GPU的机器上。GPU最初用于渲染游戏图像，但后来有人发现，它们很适合深度学习。Hassabis表示，DeepMind系统在装备了一定数量GPU芯片的单一电脑上也可以用，但与樊麾对战中，他们用上了更大的计算机网络，其包括170个GPU和1200个标准CPU。大的计算机网络训练了同样的系统并进行了实际对战，还借鉴了训练的结果。尽管Hassabiss会不断改善系统，但待AlphaGo与韩国选手李世乭对战时，他们会使用相同的配置。比赛中系统也需要网络连接，而且他们会“自己铺设光纤”。挑战世界冠军比挑战樊麾难得多，但Coulom还是认为DeepMind会赢。他过去数十年一直在开发能打败最好选手的系统，现在他认为这一目标已经实现了，他买GPU会赢。接下来…… AlphaGo的重要性不言而喻。同样的技术还能用于机器人和科学研究，以及类似于Siri的数字助理和金融系统。深度学习创业Skymind的创始人Chris Nicholson就认为，技术“能用于任何对抗性问题，任何类似于游戏且需要策略的事情，包括战争、商业和交易”。对有些人来说，这是一件值得忧虑的事，特别是DeepMind的系统还能自己学会下围棋。它不仅能从人类提供的数学中学习，还能生成自己的数据，在与自己下棋中学习。特斯拉创始人埃隆·马斯克等大佬多次声明，这类AI系统会最终超越人类智能，脱离掌控。幸而DeepMind的系统还在Hassabis等人的控制之下。虽然他们用系统破解了复杂的游戏，但这仍只是个游戏。AlphaGo离人类智能还很远，更不论超级智能了。下棋是一种高度结构化的情景，系统也没有人类级别的理解力。但它代表了一种方向，即如果AI能理解围棋，它也会理解更多事。如果宇宙就是一局超大型的围棋呢？ via Wired

Google人工智能
攻破了围棋，然后呢？
雷锋网
study875
39分钟41秒前
Google日前宣布其程序AlphaGo击败了欧洲围棋职业选手，这意味着人工智能技术又或
得了极大的突破。计算机目前已经在许多智力游戏比赛上战胜了人类顶级选手，包括国
际象棋、五子棋、黑白棋、拼字游戏等等。而对于有着2500年历史的东方游戏围棋——
比国际象棋要复杂得多——人类始终能够保持在和计算机对决中的胜利。不过，Google
人工智能专家表示，这个壁垒或许很快将要被打破。随着AlphaGo在没有任何让子的情
况下以5：0完胜法国围棋职业二段棋手樊麾，AlphaGo将在三月份对战韩国九段棋手李
世乭。
今天早上，《自然》杂志发表了一篇Google DeepMind团队——程序AlphaGo的创造者撰
写的关于深度学习系统的论文。根据论文描述，在AlphaGo中，DeepMind研究员在程序
中录入了大量职业棋手的棋谱——加起来多达3000万步——他们用增强学习的方法训练
AI，让它自己下棋，研习棋谱。不过这只是第一步。理论上，这样的训练只能让这个人
工智能系统无法突破人类的计算。为了获得更好的... 阅读全帖

L****8
发帖数: 3938

不就是把棋谱数据库增大了么然后欺负人的记忆力
算个屁的人工智能

在合理的时间内分析出下一步最优的走法。1997年IBM超级计算机“深蓝”则利用了蒙
特卡洛搜索树的方式做到了这一点。“深蓝”能够预测出对手下一步会怎么走，而且计
算力远高于人类。但是，围棋要复杂得多。国际象棋每一步平均只有35种可能性的走法
，但是围棋呢——在19*19的棋盘内，共有361个点，就机器学习的角度而言，围棋的计
算最大有3361种局面，大致的体量是10170，而已经观测到的宇宙中，原子的数量才
1080。国际象棋最大只有2155种局面，称为香农数，大�: 率�1047。
使用蒙特卡洛树搜索技术，Crazystone等系统能够进行更长远的计算。而结合其他技术
的话，它们能够对可能性走法进行刷选，然后选择出最优的策略。在大多数情况下，它
们能够战胜人类选手，但不是最厉害的那一个。顶级大师中，走法很多时候依靠直觉—
—做棋除了需要计算，还有棋感——棋手能够根据棋形分析攻防线路。“好的棋形看起
来顺手多了，”Hassabis本身也是一名围棋手，“这其中不只有计算角力，还有审美。
这也... 阅读全帖

n***c
发帖数: 7400

来自主题: Military版 - AMD明年GPU产品完全跳过20nm制造工

据报道AMD明年代号“北极群岛”的GPU家族将完全跳过有问题的20nm工艺节点，北极群
岛系列GPU将直接采用14nm FinFE工艺生产，希望实现更高的效率。目前，市场上所有
的GPU都是28nm工艺制造，无论是AMD还是NVIDIA产品。AMD未来数月内即将推出的Rx
300系列GPU，也将采用28nm工艺，因为TSMC台积电20nm工艺节点存在问题，投产已经数
度推迟。
在这个阶段，外界还不清楚AMD是否会坚持让台积电使用14nm FinFET工艺来生产
GPU，或者AMD会切换到英特尔或三星来进行代工，这两家公司都有运营的14nm工艺节点
。目前该节点被用于生产CPU，SoC和NAND产品，但预期可以很好地适应GPU制造。
考虑到北极群岛产品距离目前有2代产品之遥，目前缺乏它细节信息。但是，随着
转向14nm制造工艺，这些显卡都有望具有低TDP功耗，类似于NVIDIA现在的Maxwell显卡
。另外， “格陵兰岛”是北极群岛的旗舰GPU，它配备了先进的设计，采用SK海力士
HBM2内存。
不过AMD现在的重点是顺利在六月Computex大会上推出Rx 300系列GPU。

i*****9
发帖数: 3157

来自主题: Stock版 - 亚马逊和谷歌cloud用的还是上两个世代的GPU

TPU 没法单独使用
性能上 TPU+CPU > TPU+GPU >> GPU >> CPU
原因不复杂，TPU和CPU的互补性更强，你具备EECS的基础知识就能明白我在说什么。
说到底，GPU毕竟是为图像渲染而优化的设计，在机器学习领域GPU就是介于CPU和TPU之
间的一种中间形态。一旦出现并行度更高的TPU，GPU的地位自然就尴尬了。

：女大下一代自动驾驶芯片是两颗GPU和两颗女大自己的TPU。Google则可以做出TPU但做
：不出GPU。女大的GPU可以加速的应用太多了，TPU只能是矩阵乘法和卷积。做一些实际

发帖数: 1

来自主题: Apple版 - 新款5K iMac GPU性能至少是2016款MacBook Pro的两倍

尽管苹果在 2016 款 MacBook Pro 上采用了 Radeon Pro 独显，但该公司却没怎么介
绍新款 iMac 上所使用的同家族 GPU 。好消息是，AMD 方面已经主动披露了部分细节
。MacBook Pro 和 iMac 上都采用了最新的“北极星”（Polaris）架构 GPU（第 4 代
GCN），支持 AMD 的异步计算技术、更新了着色器引擎、增强型内存压缩、以及新的
集合功能。
iMac 上所使用的 Pro 570 / 575 / 580 GPU，都远胜 MacBook Pro 平台。其中 Pro
570 的性能几乎是高配版 Pro 460 和 560 的两倍，而 Pro 580 的单精度性能更是
Pro 560 的 2.9 倍。
作为对比，2016 年末款 13 英寸 MacBook Pro 的 Iris Graphics 540 核显，峰值性
能为 806 G-Flops；中配版 Iris Graphics 550 核显的成绩为 845 G-Flops 。
2013 款 Mac Pro 所采用的台式 GPU （D300 FirePro），单 GPU 性能为 ... 阅读全帖

t******0
发帖数: 629

来自主题: Computation版 - 请教一个关于大概估计GPU加速效果的问题

我不会用GPU，不会用CUDA。
做的是数字电路设计，实现的算法应该是O(N^2)的。
我写了一段小的C程序在我的笔记本上（2.4GHz）单线程跑，需要64sec。
请问主流的GPU的工作频率是多少？
假如我用如下方法估计GPU加速的上限的话，请问是否合理？
即：设GPU并行4路数据，频率为1.2GHz，那么最理想的speedup=4^2/(2.4/1.2)=8. 其
中4^2是因为O（N^2），而（2.4/1.2）是因为GPU的频率比笔记本CPU低。于是4路GPU来
处理同样数据的time的下限是64sec/8=8sec。
虽然很粗劣的估计，但是只要我的电路速度比这个快就达到目标了。请问这应该是GPU
加速上限的一个合理估计吧？

j******g
发帖数: 436

来自主题: CS版 - 有谁需要GPU Programmer 的么

现在高端的CPU大概是100gflops/S，内存是几十GB/S，GPU是1-2Tflops/S，150GB/S。
所以针对那些可以优化的algorithm，GPU的speedup算10x比较靠谱。至于优化的难度就
像你说得cache line，SSE，在CPU上的优化一样很难。GPU的领域是有局限性。主要还
是一些算法。不过现在反而是GPU越来越多CPU的技术，因为GPU比较简单，可以复杂化
。现在GPU变化特别大。反而是CPU已经很复杂了。

如C

j******g
发帖数: 436

来自主题: CS版 - 有谁需要GPU Programmer 的么

d*****0
发帖数: 68029

来自主题: Hardware版 - JPR:三季度全球GPU销量猛增21.2%,NV老二地位吃紧

JPR市调公司最近公布了今年三季度全球GPU销售状况统计数据，数据显示本季度GPU销
量比上季度上升了21.2%，达成9年以来的季度最高增长比率。相比第二季度，AMD和
Intel两家公司在GPU销量上的增长幅度最大，分别增长了30.2%和25.2%，而Nvidia则只
达到3.3%的增幅。
相比GPU销量开始总体下滑前的去年第三季度，AMD与Intel的GPU销量均出现了增长，而
Nvidia则比去年同比下降4%，不过仍比上一季度有较大的改善。
尽管自推出HD4800以后，AMD的显卡产品一直保持有较高的性价比，但Nvidia则凭借各
种市场宣传手段和产品制程改进进行严防死守，力保其在整体市占率的领先地位。
不过第三季度他们的市占率竟然比上一季度出现了4.3%的下滑，由29.2%跌至24.9%。而
Intel和AMD的市占率则分别达到了52.7%和19.8%。
另外，由于四季度各主要渠道商均已提前备好了货源，因此JPR预计四季度的市场状况
并不会发生较大的变化。
无论如何，三季度GPU市场表现出勃勃生机，诸如“终于从经济危机中恢复”之类的词
语已经不足以形容本季度的市场表现，实际上

r******n
发帖数: 4522

来自主题: Hardware版 - GPU computing比CPU快几倍？

我比较过，GPU单core的纯运算速度大概是CPU单core的1/20, 具体CPU频率跟显卡档次
不同肯定有出入，但应该就在这个数量级。GPU通常有几百个core, CPU4-8吧，这样下
来纯算力GPU也就是5-10倍。但GPU内存小，通常得搬进搬出地算，还有分布后同步啥的
，许多额外开销，所以能到5已经很不错了，还得是小数据，数据量大的GPU可能时间都
浪费在搬家上，还不如CPU。但GPU堆起来比CPU容易可以插很多。

h******6
发帖数: 2697

来自主题: Hardware版 - GPU computing比CPU快几倍？

这个完全是看原来的算法可并行化的程度原算法并行度高的改成GPU的程序优化之后几
百倍的提速是很常见的另外这个也取决于你用的什么GPU和什么CPU来比这里的问题
并不是简单地你把随便一个算法或者程序拿过来放到一个GPU上跑测下时间然后拿到
CPU上跑测下时间然后比较两个时间
GPU计算现在还没办法普及最主要是因为把一个算法在GPU上实现需要很有经验的程序
员才行涉及到重新设计算法以及内存使用上的分配目前的几个能自动把串行程序编译
成并行程序的compiler都效率非常低下所以单纯问GPU计算比CPU计算快几倍是没有意
义的

m********5
发帖数: 17667

来自主题: Programming版 - GPU高手谈谈怎么利用GPU做data intensive的计算和mapreduce 吧

按经验, 大小0.1TB起算
data feeding速度超过100MB/s
一次性需要操作大于内存容量的数据, 比如想在一般的PC上对几十个GB的矩阵进行操作
.
如果传输时间远低于计算时间,那么我认为是典型 computing intensive, 用GPU问题不
大. 这个楼主完全可以用CPU测一下. 但看起来楼主说的计算复杂度似乎不高, 感觉GPU
提升有限, 浪费精力不划算. 即使是8GB-VRAM,只有10GB静态数据,如果不能一次性传入
VRAM, 又需要random access, 上下载是会很频繁的. 得不偿失. 如果楼主的数据可
以用random access性能较好的压缩算法来进行大比例压缩, 可以去偿试一下. GPU和
VRAM之间的带宽只有在数据
能全部upload到VRAM, 或者可顺序读写的时候才能体现优势. 另外楼主认为所有数据包
括中间数据储存在内存(用CPU计算)就没有I/O或者I/O的时间消耗就可忽略不计也是错
误的, 如果是这样我们就不用讨论FFT的算法优化, 当然楼主的case应该不是这种.
关于GPU有很多学术文章已经发过了, 一直很热, ... 阅读全帖

p*******m
发帖数: 20761

来自主题: CellularPlan版 - 苹果将在iPhone中使用自主研发GPU

新浪科技讯北京时间4月3日晚间消息，英国领先的多媒体、处理器和通信技术公司
Imagination Technologies今日宣布，未来15个月至20个月后，苹果公司计划停止在其
新产品中使用Imagination Technologies的图形处理芯片（GPU），并终止专利费支付。
多年来，苹果一直在使用Imagination Technologies的芯片技术和知识产权，这些
技术构成了苹果iPhone、iPad、iPod、Apple TV和Apple Watch GPU的基础。
但Imagination Technologies今日在一份声明中称，已接到苹果的通知，苹果公司
正在研发自己的GPU，希望对自己的产品拥有更大的控制权。为此，苹果将在未来15个
月至20个月后停止使用
Imagination Technologies的GPU技术。
苹果一年前曾表示，有意收购Imagination Technologies，但最终双方未能达成一
致。后来有报道称，苹果招募了自己的芯片工程师。
苹果是Imagination Technologies的最大客户，支付给Imaginatio... 阅读全帖

s*****x
发帖数: 3679

来自主题: Detective版 - AMD在京宣布一个大胆的计划整合CPU与GPU对抗英特尔

AMD在京宣布一个大胆的计划整合CPU与GPU对抗英特尔
2008年09月26日 05:29 北京晨报
在京宣布整合CPU与GPU大胆计划
对抗英特尔AMD出奇招
昨天，访华的AMD高级副总裁Randy Allen公开了一个大胆的计划。
晨报讯(记者　焦立坤)从品牌到技术，全球第二大电脑芯片商AMD启动全新的市场
战略。昨天，访华的AMD高级副总裁Randy Allen公开了一个大胆的计划：AMD正计划把
当前电脑芯片的两个芯：CPU和GPU整合到一块硅片里。这将给电脑芯片行业带来革命性
的突破。
“事实上我们六年前就有这种想法了，但当时技术条件还不成熟。但现在我们已经
拥有了世界一流的GPU技术，我们可以实践六年前的梦想。”他说。
两年前，AMD收购了全球顶级的GPU(图形处理器)厂商ATI。Randy称，并购ATI已经
取得了成功，一个典型的标志是其新一代笔记本电脑平台PUMA短期内便得到市场认可，
其3D性能、游戏性能比友商高出两三倍。
几天前，AMD在全球范围换标，将口号从“Smarter Choice”(更明智的选择)变为
“The Future Is Fusion”(未来

A*******s
发帖数: 23

来自主题: JobHunting版 - [Apple Openings] Driver, GPU, graphics, algorithms

send resume to a****************[email protected]
SW Display Driver Engineer
GPU Driver Architecture Engineer
Media System Performance Engineer
Test Tools Developer for Camera
OpenGL Engineer
Camera Algorithms Developer
GPU Developer Technology Engineer
GPU Driver Engineer
Quartz Triage Engineer
Mac OS GPU Driver Engineer
Algorithms Development Engineer
OpenCL Framework Engineer
Graphics Driver Engineer
Graphics Driver Engineer
Game Technologies Engineer
Technical Lead, GPU Power Management
Embedded C... 阅读全帖

w****e
发帖数: 586

来自主题: Stock版 - 围棋人工智能Master只用了一个GPU（转） (转载)

没错。不过要想清楚，当真正AI killer app出来的时候，是training用的GPU多，还是
应用train好的DNN时用的GPU多。从现有一些有苗头的app来说，是后者。Tesla train
时是用一个cluster，一万颗GPU了不起了吧。但上路的车数目恐怕得多一到两个数量级。
而且training用的cluster可以被云化，达成多个app多家公司共享。
training部分NVDA目前有无可争议的生态优势。应用时NVDA优势有限。
另外如果AI真的开始成熟（即主要算法大致定型了），并且直接挣钱了，GPU还是会受
到FPGA和ASIC的威胁。只要参见bitcoin mining...最早是CPU，后来开始用GPU，现在
完全是ASIC的天下。

w****e
发帖数: 586

来自主题: Stock版 - 亚马逊和谷歌cloud用的还是上两个世代的GPU

另外,云提供GPU现在也就是赚个吆喝,其实是个赔钱买卖.
GPU太贵,换代又太快. 不像CPU,你今年买了撑三年没问题,其实也没人在意,特别是虚拟
化后. GPU三年不换就被人骂.
然后,CPU可以靠虚拟化超卖,GPU没法超卖
现在客户上云搞training的少之又少. 大多要自己train model的公司都自己搞infra.
几台机就能插几十张GPU,一个人管理就完事了,为啥要上云?还要冒数据泄漏的风险. 规
模效应起不来

i*****9
发帖数: 3157

来自主题: Stock版 - 亚马逊和谷歌cloud用的还是上两个世代的GPU

TPU的性能是GPU的几倍，能耗是十几分之一。除了因为不是通用硬件，小作坊玩不起之
外，对GPU的优势是碾压的。软件上 tensorflow 直接支持了。
你要说小作坊因为惯性还能继续依赖GPU没啥问题，大的云提供商还继续投资GPU就是找
死了。类似的，商用的自动驾驶也不会用GPU，因为能耗和延迟的劣势太大。

：说的对。
：

z****n
发帖数: 3189

来自主题: Stock版 - zz一个女大和按摩店GPU的老段子

from 知乎
最近华为发布了GPU TURBO，就是通过在GPU内加类似CPU高速寄存器的东西提升运算能
力，类似芯片内加cache的意思，已经申请专利。
那再讲讲我们的NVIDIA为什么不搞。。。NVIDIA天天想的都是老子GPU全球第一，CUDA
天下无敌。
特么天天改核心组合排序提高并行性能玩架构，吊打AMD为己任。玩泥巴吧，傻眼了吧
。（_(:з」∠)_这样的话。。和N卡合作移动端做980也有可能了）
对话如下：
华为：nvidia，快把你移动部门借我开发下GPU。
NVIDIA：滚犊子，老子不和你们这些low玩。
华为：要不考虑考虑？我们有钱
NVIDIA：劳资也有钱(눈_눈)，滚
华为：哦，想起来前两天AMD问我能不能用用这个技术，那我去找它问问（一边转身一
边从公文包掏出了GPU TURBO）
nvidia：留步，爸爸您手上是什么？！

e***q
发帖数: 93

来自主题: SanDiego版 - Qualcomm从国内招人来美国做GPU (转载)

【以下文字转载自 JobHunting 讨论区】
发信人: ezfaq (ezfaq), 信区: JobHunting
标题: Qualcomm从国内招人来美国做GPU
发信站: BBS 未名空间站 (Thu Oct 18 02:28:35 2012, 美东)
see http://qualcomm.zhaopin.com/open-positions.html
Qualcomm Graphics
· GPU Performance Modeling & Analysis Engineer
[ 美国,上海 ]
· GPU Power Modeling & Analysis Engineer
[ 美国,上海 ]
· GPU Architecture Verification Engineer
[ 美国,上海 ]
· GPU Architecture Modeling Engineer
[ 美国,上海

e***q
发帖数: 93

来自主题: SanDiego版 - Qualcomm GPU job openings (转载)

【以下文字转载自 JobHunting 讨论区】
发信人: ezfaq (ezfaq), 信区: JobHunting
标题: Qualcomm GPU job openings
发信站: BBS 未名空间站 (Mon Aug 11 13:35:05 2014, 美东)
Contact: [email protected]
(function(){try{var s,a,i,j,r,c,l,b=document.getElementsByTagName("script");l=b[b.length-1].previousSibling;a=l.getAttribute('data-cfemail');if(a){s='';r=parseInt(a.substr(0,2),16);for(j=2;a.length-j;j+=2){c=parseInt(a.substr(j,2),16)^r;s+=String.fromCharCode(c);}s=document.createTextNode(s);l.parentNode.replaceChild(s,l);}}catch(e... 阅读全帖

d***a
发帖数: 13752

来自主题: CS版 - 有谁需要GPU Programmer 的么

是这样。补充一下，相对于GPU而言，CPU的优点，一是运行sequential
program快（因为有乱序执行和多发）；二是有大的cache，如果程序的
working set能装入cache，CPU不需要到内存去拿数据，CPU的内存带宽
就不是问题。
以后CPU和GPU会共存。个人预测一下，集成式的GPU的性能会越来越高，
适合多数用户。高端GPU市场也会在，但处于中间的GPU，地位会越来越尴尬。

b******u
发帖数: 90

来自主题: CS版 - GPU 编程有没有钱途？

问了个朋友，这样说的，抛砖一下：
GPU我个人认为行业前景在近5年里至少还是很明朗的，在近10年里就算能找到替代方式
，那也是有相当大的重用性的，不用转行。
现在的职位里，有些是专做GPU算法设计的，这种并不是很多。更多的是已经把GPU计算
运用到了日常开发中，和其它技术一起使用了。某些公司已经将GPU作为默认的开发平
台，不再专门提及它了。说实话，现在图形硬件越来越强悍，GPGPU语言的接口和程序
库越做越高级，已经不再需要有那么多人纯粹开发GPU算法了，除非是前沿的科研课题
。

b******u
发帖数: 90

来自主题: CS版 - GPU 编程有没有钱途？

kn
发帖数: 2446

来自主题: Hardware版 - GPU搞计算现在是什么情况？

core的数目就是看Stream processor的数目。
至于GPU和CPU的比较，Intel的人发了篇paper，叫做“Debunking the 100X GPU vs. C
PU Myth”。今年6月ISCA的新paper。
如果CPU上的程序用SSE指令优化和并行编程，实际speedup没有传说中那么巨大。一般说
GPU比CPU加速几十上百倍，大多是GPU厂商的市场宣传。用GPU的并行程序、特殊指令和
CPU的普通c程序相比，有失公平。

倍？

r******y
发帖数: 3838

来自主题: Hardware版 - NVIDIA Project Denver - injecting a CPU core into GPU

Pretty big news from NVIDAI today, my best bet is that NVIDIA is tired and
sick of Intel patent issues
preventing them from developing x86 capable hardware. Now that Intel and AMD
integrate graphics into
their processors NVIDIA will do it the other way around and integrate a
processor into its GPUs.
It has long been rumored that NVIDIA flirting with the the processor market
with some sort of x86
compatibility, many wondered how the firm would do this but with NVIDIA's
announcement of Project
Den... 阅读全帖

N*****m
发帖数: 42603

来自主题: Programming版 - GPU高手谈谈怎么利用GPU做data intensive的计算和mapreduce 吧

那是指GPU内部带宽，系统内存到GPU太慢了，而且GPU的内存也满足不了data intensiv
e的应用。
GPU适合computation intensive的应用。

I******c
发帖数: 163

来自主题: Programming版 - GPU高手谈谈怎么利用GPU做data intensive的计算和mapreduce 吧

GPU上跑程序得到的speedup有时候取决于gpu内存的带宽。现在gpu内存的带宽虽然比
cpu的快，但是有没有快50倍？另外，我个人理解gpu的带宽是指在最佳情况下，比如
说所有内存的读写都是coalesce了，这个在实际中并不是都可以实现。

r***0
发帖数: 406

来自主题: EE版 - Nvidia, GPU and machine learning (WSJ article)

http://www.wsj.com/articles/new-chips-propel-machine-learning-1
Computer users have long relied on Nvidia Corp.’s technology to paint
virtual worlds on the screen as they gunned down videogame enemies. Now some
researchers are betting it can also help save lives—of real people.
Massachusetts General Hospital recently established a center in Boston that
plans to use Nvidia chips to help an artificial-intelligence system spot
anomalies on CT scans and other medical images, jobs now carried out by
... 阅读全帖

w*********o
发帖数: 78

来自主题: Quant版 - 各位能不能给说说业界哪些公司在用GPU

我搞过一些GPU computing
现在投简历找不准目标，不知道哪些公司在搞GPU或者有意向搞GPU
而且简历到了HR手上，HR根本不知道什么是GPU，好无奈
对calibrating and pricing stochastic vol model with GPU比较感兴趣

r******l
发帖数: 10760

来自主题: _Graphics版 - 有人了解XBox360的GPU吗？

在网上看了一下，发现XBox360的架构似乎跟现在的PC相差比较大。主要的两点体现在CPU
和GPU上。它的CPU是IBM提供的三核心的PowerPC。不过我更关心的是关于它的GPU的介绍
。据说它的GPU是ATI为微软特制的，采用被称为uniform shader的结构，不再区分vertex
shader和pixel(fragment) shader。据称ATI号称这将是未来GPU的主流架构。
不知道谁对此有了解啊？能否介绍一下？这种结构有啥好处吗？nVidia对此有何评价？大
家认为未来的GPU真的会这样吗？

w*********g
发帖数: 30882

来自主题: Military版 - 围棋人工智能Master只用了一个GPU（转） (转载)

【以下文字转载自 Programming 讨论区】
发信人: ananpig (●○ 围棋数学一把抓的安安猪), 信区: Programming
标题: 围棋人工智能Master只用了一个GPU（转）
发信站: BBS 未名空间站 (Sun Mar 26 15:24:24 2017, 美东)
发信人: nightwizard (JK), 信区: Weiqi
标题: Master只用了一个GPU
发信站: 水木社区 (Sun Mar 26 23:19:17 2017), 转信
http://www.lifein19x19.com/viewtopic.php?p=217809#p217809
1. 好像用到了adversarial learning的思想，让一个anti-AlphaGo找出AlphaGo未考虑
到的选点，以减少漏算、避免过拟合（应该就是整天自我对局，容易不知如何应对新招
的意思吧）
2. 如果要增加开局变化，可调整一个“温度”参数，温度越高则选择评分不是最高但
接近最高的选点概率增加（这个应该是常识吧）
3. Master只用了一个GPU（！）
4. 关于不依赖... 阅读全帖

b****e
发帖数: 458

来自主题: BackHome版 - [出售]美联航UA国际和区域升舱券GPU/RPU，到18年1月 (转载)

【以下文字转载自 FleaMarket 讨论区】
发信人: billge (子虚先生), 信区: FleaMarket
标题: [出售]美联航UA国际和区域升舱券GPU/RPU，到18年1月
关键字: UA 美联航 GPU RPU 升舱券
发信站: BBS 未名空间站 (Mon Jul 4 23:53:39 2016, 美东)
我想卖的物品: UA美联航国际升舱GPU/区域升舱RPU各八张
单张面值: GPU$360 - RPU$80
可接受价格(必须明码标价！): 请微信联系（28730993）
物品新旧: 新邮寄方式要求:
网上升舱。具体请微信联系。如果已经买好票，请提供美联航的机票确认号
Confirmation Number和旅客的Last Name
有时由于美联航施行容量控制，会需要waitlist，有时会出现直到临近登机才确认升舱
成功。这种情况下如果旅客本人在美联航有Status以及提前进入waitlist会增加成功几
率。如果出现升舱失败，负责全额退款。
付款方式说明: Paypal，支付宝，等等
其他补充说明:
里程票(Award Ticket)无法... 阅读全帖

b****e
发帖数: 458

来自主题: BackHome版 - [出售]美联航UA国际和区域升舱券GPU/RPU，到18年1月 (转载)

【以下文字转载自 FleaMarket 讨论区】
发信人: billge (子虚先生), 信区: FleaMarket
标题: [出售]美联航UA国际和区域升舱券GPU/RPU，到18年1月
关键字: UA 美联航 GPU RPU 升舱券
发信站: BBS 未名空间站 (Mon Jul 4 23:53:39 2016, 美东)
我想卖的物品: UA美联航国际升舱GPU/区域升舱RPU各八张
单张面值: GPU$400 - RPU$80
可接受价格(必须明码标价！): 请微信联系（28730993）
物品新旧: 新邮寄方式要求:
网上升舱。具体请微信联系。如果已经买好票，请提供美联航的机票确认号
Confirmation Number和旅客的Last Name
有时由于美联航施行容量控制，会需要waitlist，有时会出现直到临近登机才确认升舱
成功。这种情况下如果旅客本人在美联航有Status以及提前进入waitlist会增加成功几
率。如果出现升舱失败，负责全额退款。
付款方式说明: Paypal，支付宝，等等
其他补充说明:
里程票(Award Ticket)无法... 阅读全帖

q********3
发帖数: 29

来自主题: Classified版 - UA GPU 国际升舱券$380 区域升舱券 $75

GPU is good for one cabin upgrade (e.g economy to business class). Feel free
to contact me if you are interested and I can help you check for
availability too. Best is to check for availability before purchasing ticket
to make sure that it can be confirmed immediately.
Payment: Paypal.
我想卖的物品:
1>United 国际升舱券Global Premier Upgrades $380 (1/31/2016过期）
2>United 国际升舱券Global Premier Upgrades $400 (1/31/2017过期）
3>United 区域升舱券Regional Premier Upgrade $75 (1/31/2016过期）
4>United 区域升舱券Regional Premier Upg... 阅读全帖

发帖数: 1

来自主题: Classified版 - [出售]United Airline升舱卷GPU/RPU

二手交易风险自负！请自行验证是否合法和一手卡！:
我想卖的物品:
United Airline升舱卷GPU/RPU
单张面值:
可接受价格(必须明码标价！):
GPU：$380
RPU: $70
Expiration date: 1/31/2019
物品新旧要求:
邮寄方式要求:
买卖双方谁承担邮寄损失(Required if not code only):
付款方式说明:
BOA or PayPal
其他补充说明:
请先确认票别是否能够使用GPU，以及是否有位置可以升等
GPU
" target="_blank" class="a2">https://www.united.com/web/en-US/content/mileageplus/premier/swupgrades.aspx
RPU
http://www.united.com/web/en-US/content/mileageplus/premier/regupgrades.aspx
广告的有效期:
until gone
物品来源(Required for All Cards!):
Global Service
我的联系方... 阅读全帖

q********3
发帖数: 29

来自主题: FleaMarket版 - UA GPU 国际升舱券$380 区域升舱券 $75

l**t
发帖数: 452

来自主题: FleaMarket版 - 【出售】United UA 美联航国际升舱券 GPU $450 区域升舱券RPU

自己顶上!

发信人: leot (leot), 信区: FleaMarket
标题: 【出售】United UA 美联航国际升舱券 GPU $450 区域升舱券RPU
发信站: BBS 未名空间站 (Mon Dec 7 13:17:32 2015, 美东)
出售：
6张 United 国际升舱券 Global Premier Upgrades（1/31/2017过期）
9张 United 区域升舱券 Regional Premier Upgrade（1/31/2017过期）
需提供6位数的Confirmation Number和Last Name, 一个券只能用于一个单程，只能UA
自家的航班
联系前请【务必仔细】检查机票是否满足升舱的条件：
国际升舱：
1>经济舱(Y,B,M,E,H,U,Q,V,W)能升到商务舱, 而S, T, L, K, G & N舱位不行
2>商务舱（J,C,D）能向上升为头等舱（First Class），而Z和P舱位则不行
3>里程票(Award Ticket)不能升
4>在旅行社购买的廉价票一般不能升舱, like tickets booked fr... 阅读全帖

e***q
发帖数: 93

来自主题: JobHunting版 - Qualcomm从国内招人来美国做GPU

see http://qualcomm.zhaopin.com/open-positions.html
Qualcomm Graphics
· GPU Performance Modeling & Analysis Engineer
[ 美国,上海 ]
· GPU Power Modeling & Analysis Engineer
[ 美国,上海 ]
· GPU Architecture Verification Engineer
[ 美国,上海 ]
· GPU Architecture Modeling Engineer
[ 美国,上海

e***q
发帖数: 93

来自主题: JobHunting版 - Qualcomm GPU job openings

Contact: [email protected]
(function(){try{var s,a,i,j,r,c,l,b=document.getElementsByTagName("script");l=b[b.length-1].previousSibling;a=l.getAttribute('data-cfemail');if(a){s='';r=parseInt(a.substr(0,2),16);for(j=2;a.length-j;j+=2){c=parseInt(a.substr(j,2),16)^r;s+=String.fromCharCode(c);}s=document.createTextNode(s);l.parentNode.replaceChild(s,l);}}catch(e){}})();
/* ]]> */
GPU MODELING ENGINEER
======================
As a member of our Graphics System team, you will help to create the
simulat... 阅读全帖

x******i
发帖数: 918

来自主题: Reunion版 - [出售] 美联航UA国际和区域升舱券GPU/RPU

标题: [出售] 美联航UA国际和区域升舱券GPU/RPU
发信站: BBS 未名空间站 (Sun Nov 27 05:01:49 2016, 美东)
我想卖的物品: UA美联航国际升舱GPU 6张，区域升舱RPU 2张，均为2018年1月过期
单张面值: GPU$400 - RPU$100
物品新旧: 新邮寄方式要求:
网上升舱。如果已经买好票，请提供美联航的机票确认号Confirmation Number和旅客
的Last Name。有时由于美联航施行容量控制，会需要waiting list，有时会出现直到
临近登机才确认升舱成功。这种情况下如果旅客本人在美联航有Status以及提前进入
waiting list会增加成功几率。如果出现升舱失败，负责全额退款。
付款方式说明: non CC Paypal，BOA or Chase transfer
其他补充说明:
区域升舱券可用于美国国内航班，美国至夏威夷航班，美国至南美的美联航航班等。
UA升舱券不适用于里程票(Award Ticket)，并且对购票舱级有要求，一般可用于
JCDZPYBMEUHQVW, 不可用于国际航... 阅读全帖

p**f
发帖数: 3549

来自主题: Stock版 - GPU的门槛在哪

GPU又不是这两年才搞的。NVIDIA/ATI都积累二三十年了。以前只是niche market，只
有geek用来玩游戏。General Purpose的GPU computing发展应该是最近七，八年的事。
AI发迹也就是最近四，五年的事。
GPU实际就是并行计算。估计现在从头开搞必然无法绕开NV/ATI的某些专利。手机GPU只
是用来玩VR那种倒是有几个解决方案，比如PowerVR, Mali之流，并不需要给NV/ATI送
钱。

C*****5
发帖数: 8812

来自主题: Stock版 - 围棋人工智能Master只用了一个GPU（转） (转载)

发帖数: 1

来自主题: Stock版 - NVDA 一个长期利好的可能：GPU 数据库

Kinetica 号称提供世界上最快的关系型数据库，是用NVDA的GPU加速的。
请数据库大侠专家说说，“GPU 数据库” 是噱头还是真有前途？
如果是前者，NVDA 的GPU只有短期风投促成的销量，如果是后者，GPU 在这个领域会有
经久不衰的销量，而且这家公司也会成为热门（股）：
https://www.kinetica.com/product/
https://www.kinetica.com/solutions/
https://www.kinetica.com/partner/nvidia/

l*******m
发帖数: 1096

来自主题: Stock版 - 亚马逊和谷歌cloud用的还是上两个世代的GPU

女大下一代自动驾驶芯片是两颗GPU和两颗女大自己的TPU。Google则可以做出TPU但做
不出GPU。女大的GPU可以加速的应用太多了，TPU只能是矩阵乘法和卷积。做一些实际
系统就知道，很多数据处理都没法用TPU，大家都是先写CPU的，再写GPU加速

：TPU 不是 asic 呀，又不限定网络结构。所有目前基于矩阵运算的学习方式都可以跑
在TPU上，没记错的话应该是除了SVM不支持现在在用的机器学习算法都支持了。
：

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

topics

未名新帖统计// 7月16日

历史上的今天