晓查 安妮 郭一璞 发自 凹非寺
量子位 报道 | 公众号 QbitAI
硬件设备,是任何一名深度学习er不可或缺的核心装备。各位初级调参魔法师们,你们有没有感到缺少那一根命中注定的魔杖?
可是,各种CPU、GPU、内存条、外设,那么多品牌种类型号参数,到底该怎么选?
为了帮你凑齐一套能打的装备,一位名叫Tim Dettmers的歪果小哥哥将自己一年组装七部工作站的装机经验凝练成一篇实用攻略分享了出来,帮你确定一整套硬件选型,并且,还根据今年的新硬件做了推荐。
好啦,下面我们从GPU开始,依次看看各重要部件应该如何选择,全文超过5000字,预计阅读时间11分钟。当然,文末还为大家准备了“精华清单”~
GPU显卡(GPU)是深度学习的重要部件,甚至比CPU更重要。做深度学习不用GPU只用CPU显然是不明智的,所以作者Tim先介绍了GPU的选择。
选购GPU有三大注意事项:性价比、显存、散热。
使用16bit的RTX 2070或者RTX 2080 Ti性价比更高。另外在eBay上购买二手的32bit GTX 1070、GTX 1080或者1080 Ti也是不错的选择。
除了GPU核心,显存(GPU RAM)也是不可忽视的部分。RTX比GTX系列显卡在显存方面更具优势,在显存相同的情况下,RTX能够训练两倍大的模型。
通常对显存的要求如下:
- 如果想在研究中追求最高成绩:显存>=11 GB;
- 在研究中搜寻有趣新架构:显存>=8 GB;
- 其他研究:8GB;
- Kaggle竞赛:4~8GB;
- 创业公司:8GB(取决于具体应用的模型大小)
- 公司:打造原型8GB,训练不小于11GB
需要注意的是,如果你购买了多个RTX显卡,一定不要忽视散热。两个显卡堆叠在相邻PCI-e插槽,很容易令GPU过热降频,可能导致性能下降30%。这个问题后面还会具体讨论。
内存选择内存(RAM)有两个参数:时钟频率、容量。这两个参数哪个更重要?