博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
tesla p100 linux,NVIDIA Tesla P100计算卡性能首测:震撼地球!
阅读量:5106 次
发布时间:2019-06-13

本文共 1172 字,大约阅读时间需要 3 分钟。

GTX 1080/1070虽然性能很强悍,但它们在全新的帕斯卡家族中只能算是中档水准,真正的大杀器是顶级大核心GP100,拥有3840个FP32单精度、1920个FP64双精度CUDA核心,主要面向高性能计算领域。

担任首发的Tesla P100(似乎也叫Tesla P1),只开启了3584个单精度、1792个双精度核心,即便如此单、双精度浮点性能也高达10.6TFlops、5.3TFlops,同时还搭配了4096-bit 16GB HBM2高带宽显存,并支持全新的NVLink互连总线,取代传统PCI-E。

d0efd8a55ba7ab12f6b341bc635e27d1.png

那么它到底性能如何呢?圣地亚哥超级计算中心的Scott Le GrandRoss Walker、亚马逊网络服务的Scott Le Grand联合编写了一个通用计算测试工具AMBER,可模拟生物分子周围的力场,并与NVIDIA合作对Tesla P100进行了一番测试,包括单路、双路、四路。

由于测试所用硬件还是工程样品,操作系统是Linux,而且测试工具和测试方法是专门为了考察纯粹计算性能而设计的,所以结果反映的只是纯计算能力,和游戏表现无关。

参与对比的产品中,Tesla M40基于麦克斯韦架构大核心GM200,3072个流处理器,单精度性能突破7TFlops,双精度只有0.21TFlops,搭配384-bit 12GB GDDR5显存。

Tesla K80使用的是两个开普勒架构大核心GK210,4992个流处理器,单双精度浮点性能8.74、2.91TFlops,搭配两组384-bit 12GB GDDR5。

Tesla K40的核心是GK110,2880个流处理器,单双精度浮点性能4.29、1.43TFlops,搭配384-bit 12GB GDDR5。

GTX 1080、Titan X、980 Ti、980也都加入了对比,另外还有几颗纯CPU,包括双路的E5-2697 v4/2698 v3/2650 v3,分别有32/32/20个核心。

具体测试原理、流程啥的就不多说了,专业性太强,只简单看看结果:

2a0f3b6672d8ecbcc290923692041e8a.png

4038c4de4d614204340a561d212249a0.png

05d1447b32088fe83d9ff5011e9832f1.png

d4459cc0931b4da1caa770282725b542.png

d63725ef6c924ee909a2e17353b3084d.png

1fa49a0d8910158a4f6b3a636ee2ed34.png

a047b7d7557fff6d11adc6fce133bf19.png

47118958506c1556af513e2e341d2a41.png

698b1fcbd6204d94e880f3d79cf56145.png

82b95c49fd1bf5453efb8d79e0adc0a8.png

096cd2a20d87c5d6892e0cd46acd5ece.png

18ac05afab0b9b3cc4d189f29c79e008.png

相比于前辈M40,P100的计算性能提升相当猛,绝大部分项目都在50%左右,少数甚至超过80%,有的甚至接近100%!

事实上在大部分时候,单路P100都能干掉双路M40,领先幅度10-20%不等。

对比消费级游戏卡,P100单路已经相当于GTX Titan X四路的水准,也可以看到GTX 1080同样十分凶猛,多数情况下都达到或者接近M40的水平,但不够稳定,有时候相当于单块Titan X,有时候超过人家两块。

最遗憾的是,NV-Link总线的威力还没有发挥出来,双路、四路P100的提升幅度普遍还不如PCI-E。

d99a994f98b1d1ed8ee4dcb5bd500b1e.png

八路Tesla P100

- THE END -

转载请注明出处:快科技

责任编辑:

你可能感兴趣的文章
MySql update inner join!MySql跨表更新 多表update sql语句?如何将select出来的部分数据update到另一个表里面?...
查看>>
我最宏大的个人愿望
查看>>
北漂周记--第5记--拼命编程
查看>>
比赛总结一
查看>>
SpringBoot项目打包
查看>>
JSP的3种方式实现radio ,checkBox,select的默认选择值
查看>>
Linux操作系统 和 Windows操作系统 的区别
查看>>
《QQ欢乐斗地主》山寨版
查看>>
文件流的使用以及序列化和反序列化的方法使用
查看>>
Android-多线程AsyncTask
查看>>
第一个Spring冲刺周期团队进展报告
查看>>
C++函数基础知识
查看>>
红黑树 c++ 实现
查看>>
Android 获取网络链接类型
查看>>
报表服务框架:WEB前端UI
查看>>
5.9UDP客户端服务器-基于OK6410
查看>>
java自学基础、项目实战网站推荐
查看>>
软件包的使用
查看>>
linux中启动与终止lnmp的脚本
查看>>
gdb中信号的处理[转]
查看>>