美國當地時間11月16日,在鹽湖城舉行的全球超算大會sc16上,浪潮釋出了深度學習一體機d1000,該産品部署了采用nvidia® tesla™ gpu技術的浪潮高性能計算叢集,運作多節點并行深度學習架構caffe-mpi,可大幅提升在人臉識别、圖檔分類、物體識别等應用場景的深度學習計算性能,并有效提高使用者在實際業務使用深度學習的生産力。
強強聯手産碩果
d1000産品整合了浪潮深度學習領域的最新技術成果,包括浪潮推動開發的并行版開源深度學習架構caffe-mpi,英偉達專為深度學習定制的tesla gpu及cudnn庫。浪潮展示了6節點的d1000産品方案,該方案的節點是浪潮專為深度學習開發的專用gpu伺服器,每個節點配置2顆處理器及4塊nvidia® tesla™ m40 gpu。
浪潮集團海外總部副總經理jay zhang現場講解
浪潮集團海外總部副總經理jay zhang表示,d1000在性能、擴充性等方面都大幅領先于以往的深度學習方案,可以滿足大部分客戶的應用需求。浪潮一直在加強深度學習前沿技術開發并緻力于建構良好的生态系統,并聯合nvidia等業界領先技術夥伴,将最新的技術整合為産品方案,轉化為使用者的實際應用價值。
nvidia解決方案和工程架構副總裁 marc hamilton演講
高性能深度學習架構caffe-mpi
caffe-mpi是浪潮團隊推動開發并開源釋出的叢集版caffe,這使得caffe這一業界最重要的深度學習架構實作了高效多節點并行。caffe-mpi不僅在單機多gpu方案中表現出高效的訓練性能,而且支援分布式叢集擴充。浪潮展示了6節點d1000産品方案在配置24塊tesla m40 gpu,并部署caffe-mpi,訓練googlenet(inception v1)網絡,每秒可以處理2000張圖檔,在短短18小時内将googlenet網絡的精确度提高至78%。随着訓練時間的增加,caffe-mpi的正确率将進一步提升。此外,caffe-mpi具有較高的可擴充性,其節點的擴充效率達到72%,并且caffe-mpi完全保留了原始caffe架構的特性,純粹的c++/cuda架構,支援指令行、python和matlab接口等多種程式設計方式,上手快,十分易用。
d1000釋出現場
讓使用者專注于業務應用
深度學習正在重新定義什麼叫可能性,從初創時期的公司到大型網際網路營運商,都在努力把深度學習融入實際業務中來拓展商業邊界。jay zhang表示,浪潮為客戶提供的是開箱即用的深度學習解決方案以及全程貼心服務,把使用者從平台部署配置優化等繁瑣工作中解放出來。
sc16現場吸睛的浪潮産品與方案
據了解,d1000統一整合了經過優化設計的浪潮高性能計算叢集硬體、caffe-mpi并行計算架構和依賴庫、經過充分測試驗證的os和cuda環境及叢集管理排程平台 clusterengine,産品實作在産線進行軟硬體一體化安裝、配置,使用者打開d1000即可使用caffe-mpi進行深度學習業務應用。
原文釋出時間為: 2016年11月17日
本文來自雲栖社群合作夥伴至頂網,了解相關資訊可以關注至頂網。