当前的位置：泉州人才网 >> 新闻中心 >> AI应用遍地开花，AI应用该如何选择显卡？ >> 正文

AI应用遍地开花，AI应用该如何选择显卡？

发布时间:2024-04-19 10:51:23 来源:微型计算机杂志

在我们分析了显卡市场情况、游戏显卡的选择之后，也需要为目前热门的AI进行分析和推荐。那么，对AI应用用户来说，如何选择显卡呢？怎样的显卡更适合AI计算用户的需求呢？

随着GPU和AI行业发展关系越来越近，有关AI计算的用户也逐渐增多，无论是AIGC相关的内容生成用户，还是AI大模型本地支持等，都需要显卡的介入。那么，AI应用、AI计算如何选择显卡呢？选择这类应用的显卡，关注的点应该放在哪里呢？

AI应用目前的情况来看，多数是依靠之前的训练完成的大模型，进行优化、包装后再推出的应用产物。比如著名的StableDiffusion，其原版需要自行创建运行环境，打包运行库等。但是也有很多厂商、爱好者等基于训练成熟的模型，再度进行二次创作，比如打包所有运行环境、简化安装步骤等，使得用户可以做到随用随装。但是无论如何，大模型本质上依旧需要自己完整的应用环境，这一点是不可避免的。

在这种情况下，如果要选择显卡，那么首先需要选择在软件支持上更为成熟、稳定的产品，毕竟AI应用或者软件的用户一般都会用于生产力创作而不是单纯娱乐。在软件环境方面，英伟达有非常成熟的CUDA以及一系列AI相关软件、加速库的支持，并且基本上已经形成了业内标准、闭环运行等，整体稳定性和可靠性非常出色，是目前最值得选择的AI应用显卡GPU品牌。

▲CUDA目前已经成为英伟达最大的护城河，也是英伟达在AI上最核心的竞争力。

其次还有AMD和英特尔等厂商，也在AI方面做了很多努力。比如英特尔目前在OneAPI方面投入了很多资源，因此在很多AI应用中表现也开始展露出独特的优势。AMD主要是ROCm软件，不过目前针对RadeonPro系列支持更为出色一些，在日常使用领域支持尚可，依旧需要时间优化。

▲AMD也在大力构建自己的AI软件支持生态圈，ROCm6.1带来了诸多创新功能。

因此，对绝大部分用户来说，AI计算的需求还是考虑英伟达RTX40系列甚至RTX30系列会更为友好，对一些专业用户或者有特殊要求的用户来说，采购AMD的Radeon或者英特尔ARC系列也未尝不可，但可能需要比较强的动手能力。

在AI应用显卡选择上，算力和显存两个因素都很重要，缺一不可。

先来看算力。这个大家都比较熟悉了，更高的算力意味着计算AI相关模型推理的时候，速度更快、效能更高。但是值得注意的是，硬件架构对应的软件支持在这里也有很重要的地位。比如英伟达的GPU在StableDiffusion的应用中，专门推出了针对GPUTensorCore加速的版本，整体效能又提升了不少。因此在算力选择上，一方面要看自己的实际需求，另一方面则是考虑技术持续进步的原因，尽量选择目前新一代的产品，比如有条件选择RTX40系列，针对RTX30系列的优先级可以适当降低，毕竟新技术、新架构才能发挥出更强的性能。

▲芯片更大，显然算力就更强，这一点无可厚非。

其次是显存。对显存来说，轻AI应用，比如典型的抠图、降噪等操作，对显存要求不高，一般显卡都可以满足需求。但是，针对大模型相关的应用，比如自然语言问答、文生图、图生图等应用，这些应用涉及大模型相关计算，有很多层、很多相关的零散数据以及新生成的数据都需要被临时存放，这些存放的地方就是显存。因此我们看到，在大模型计算方面，大显存的GPU相比小显存的GPU有非常强大的计算优势，尤其是数据量大、计算要求复杂的时候，这个优势会更为明显。一些实际测试中，以RTX4060Ti为例，8GB的版本在AI相关性能上只有16GB版本产品的1/2~1/3，甚至更低。

▲显存容量和速度，成为显卡计算AI的瓶颈之一，在企业级产品上，人们使用的是HBM3这样的超高速、超高带宽显存。

因此，上述两个因素基本上决定了我们将如何选择AI显卡，我们也将目前比较合适用作AI的显卡列举如下：

首先顶级市场，如果有条件并且对算力需求很高的话，PCIe版本的H100、H800等产品肯定是最佳选择，个人用户可以考虑RTX4090或者RTX4090D，也可以带来极为出色的算力表现。

▲显存更大的确运行速度快太多，这里面涉及数据存储、耦合等多种原因。

对高端市场用户而言，RTX4080SUPER、RTX4070TiSUPER以及RTX4080整体性能应该在伯仲之间，16G显存的这三款产品对高端用户来说也基本可以满足需求。

接下来是中高端市场，其实目前中端市场主要以RTX4070SUPER和RTX4070为主，从规格来看，两款显卡显存一样，只是流处理器存在差异，性能和价格严谨对位，用户可以根据预算自行选择。

在主流的中端市场，目前针对AI应用，最推荐的应该是16GB显存的RTX4060Ti显卡，更大的显存在大量AI推理中带来了远超8GB显存版本显卡的性能和实际表现，值得推荐。

在入门级市场，目前只有选择RTX3060系列。部分千元级入门用户也可以尝试选择英特尔ARCA750、A580系列显卡，目前英特尔在AI相关API和软件方面还是下了不少功夫，基本的文生图、图生图等AI工作还是可以满足的。

▲英特尔ARC目前也在大幅度加强AI计算能力，比如增加更多数据格式，为更多模型引擎优化等。

在梳理完成上述信息后，接下来就是针对AI应用的显卡推荐了。

索泰RTX4090DTRINITY24G

芯片：RTX4090D

流处理器数量：14592

核心频率：2280~2520MHz

显存配置：384bit24GBGDDR6X

参考售价：13999元

点评：这款RTX4090D整体外观设计非常独特，圆润的曲面造型让人一眼难忘。在用料和供电方面，24+4相供电和高品质元器件、扎实的做工以及规模巨大、效果出色的散热模块、RGB灯效，都彰显了这款显卡的不凡。

影驰RTX4070TiSUPER大将OC

芯片：RTX4070TiSUPER

流处理器数量：10240

核心频率：2295~2595MHz

显存配置：256bit16GBGDDR6X

参考售价：6499元

点评：作为一款AI应用的显卡，显存必须放在优先级很高的位置。整个RTX40系列显卡中，RTX4070TiSUPER显存配备了16GB容量，同时维持了较高的算力。影驰这款显卡整体用料做工都表现出色，很值得用户选择。

技嘉RTX4060TiWFOC16GB

芯片：RTX4060Ti

流处理器数量：4325

核心频率：2310~2565MHz

显存配置：128bit16GBGDDR6X

参考售价：3599元

点评：RTX4060Ti16GB是整个RTX40系16G显存显卡中最便宜的一款，被很多入门AI用户选择。技嘉这款显卡采用了双风扇设计，小巧玲珑，搭配风之力散热、强化金属背板，带来了不错的使用体验。

原文地址:https://news.qzrencai.com/p/20240419/41747839.html