騰訊Angel獲世界互聯網大會領先科技獎:讓通信成本降低70%
快科技11月20日消息,2024年世界互聯網大會今日在浙江烏鎮開幕,騰訊獲得全新設立的世界互聯網大會傑出貢獻獎—創新突破類。
據"騰訊"公衆號介紹,騰訊Angel機器學習平臺也獲得了本年度世界互聯網大會領先科技獎。
騰訊稱,該獎項被視爲科技行業的最高榮譽之一,在270個申報項目中,共有20個項目獲獎。
評選委員會點評騰訊Angel機器學習平臺:突破萬億級模型分佈式訓練和推理以及大規模應用部署等難題。
據瞭解,突破主要在通信、效率、規模三方面實現。
通信:
從網卡到交換機,再到路由協議,騰訊自研的RDMA網絡實現了集羣高速互聯,單節點帶寬達到3.2T,相比於同類領先產品,性能提升30%,成本降低70%。
效率:
自研了訓練/推理框架,提出顯存加主存的一體化機制,實現多維並行和算子優化,相比開源框架,訓練性能提升2.6倍,推理速度提升2.3倍。
規模:
實現了單任務萬卡的線性擴展,GPU集羣加速比從50%提升到99%。
騰訊Angel機器學習平臺是幹嘛的,如果你手握一堆數據,想從零開始訓練一個大模型,整個過程可以分成三層,Angel會在中間層發揮作用。
其中,底層GPU、雲服務器等計算硬件提供算力支持,中層是機器學習平臺,負責處理數據、開發算法和執行訓練任務,上層是訓練好的大模型。
簡單來說,Angel機器學習平臺可以把一堆雜亂的數據經過清洗、訓練、加工等工序,變成一個強大的大模型。