性能大幅提升,NVIDIA發佈CUDA Toolkit 3.2
近日,NVIDIA正式發佈NVIDIA CUDA Toolkit 3.2正式版。該版本軟體可實現大幅的性能提升、包含全新的資料庫以及先進的集群管理特性,適合開發新一代GPU加速應用程式的開發者們使用。NVIDIA CUDA Toolkit 3.2包含了開發者開發CUDA C/C++應用程式所需的所有工具、庫以及文檔。同時,這款軟體也是諸多其它GPU計算語言解決方案的基礎。其新特性和增強內容如下:
• 在CUDA BLAS (CUBLAS) 庫中,最高可實現300%的性能提升。因而比最新的Intel MKL(數學內核庫)快8倍之多;
• 與最新的MKL相比,CUDA FFT (CUFFT) 庫的優化可實現2-20倍性能提升;
• 與最新的MKL相比,用於隨機生成數字的全新CURAND庫可實現10-20倍速度提升;
• 與最新的MKL相比,疏鬆陣列的全新CUSPARSE庫可實現6-30倍速度提升;
• 在GPU調試以及性能分析工具方面也實現了諸多改進。
此外,CUDA Toolkit 3.2版本還包含H.264編/解碼功能、全新的Tesla計算集群 (TCC) 、集群管理特性以及對新型6GB顯存Tesla和Quadro GPU的支持。
這種工具只會開發者有用而已 = = NVIDIA CUDA 在轉檔真的很有用 !! https://www.eetimes.com/electronics-news/4210815/Nvidia-describes-10-teraflops-processor
這玩具進度比小弟前一陣子預估的還快....Tflop PC的時代快到了
頁:
[1]