這是Intel對early snoop的解釋
進入測試重點:
首先,先測試Early Snoop開啟/Auto狀態下的數值。此次我是採用nVidia K40m來測試。附帶一提的是,nVidia不支援跨QPI/UPI(SKL平台)的P2P。並且P2P的任何結果僅供參考 (reference only).
Early Snoop開啟下,P2P獲得的值:單向為 5.13, 7.96 GB/s 雙向(Bidirection)為 6.66, 6.95 GB/s
Early Snoop關閉下,P2P獲得的值:單向為 9.30, 9.31 GB/s 雙向(Bidirection)為 18.34, 17.98 GB/s
因此,如果使用Haswell平台應用在GPU P2P的環境,例如AI, Deep Learning, Tensorflow等,可以把early snoop給關閉獲取最大傳輸頻寬。
沒有留言:
張貼留言