新葡京娱乐场-大陆娱乐场开户注册

|
清華大學
  • 259 高校采購信息
  • 691 科技成果項目
  • 12 創新創業項目
  • 0 高校項目需求

人工智能大模型的高性能加速系統

2024-04-29 09:23:47
云上高博會 http://www.g2h0uzv.xyz
點擊收藏
所屬領域:
人工智能
項目成果/簡介:

1. 痛點問題

大模型的發展已成為人工智能領域的一個重要趨勢,其具有更強的表達能力和更高的準確性,可以幫助人類解決更復雜的實際問題。然而,大模型的訓練面臨巨大的計算壓力。主流的大模型參數量已達到TB量級,必然需要使用分布式系統進行處理,通過將模型和數據分配到多個計算設備上進行并行計算,從而提高訓練速度。但是,分布式訓練的成本非常高昂,需要使用大量高性能的計算設備,而這些設備的價格居高不下,甚至在市場上難以獲得。

并行訓練系統的性能優化是降低訓練成本的重要手段。目前開源的分布式訓練軟件包括英偉達公司的 Megatron-LM和微軟公司的 DeepSpeed 等。雖然這些框架可以在給定的硬件平臺上對給定模型進行較好的并行訓練支持,但還存在一些局限性:

(1)性能仍有提升空間。目前廣泛使用的方案基于數據并行,通信量巨大,并行效率低下;

(2)依賴并行專家進行調優。現有系統提供了更多混合的并行方式的選擇,在數量眾多的可行的并行方案中選擇最優的并行方案是十分困難的,而任意選擇的并行方案可能會花費數倍于最優方案的時間;

(3)對于具有動態性的模型支持不足。現有的系統對于混合專家模型等具有動態負載特性的場景缺乏有效的處理機制,導致負載不均衡現象嚴重,從而導致訓練效率低下;

(4)缺乏對于多種不同硬件平臺的支持。目前主流的軟件系統與英偉達公司的GPU硬件綁定程度較深,難以移植到其它硬件平臺。

2. 解決方案

本技術成果包含以下核心技術點:(1)考慮硬件拓撲結構和性能特點的并行訓練軟件系統搭建與調優技術;(2)針對具有動態性的模型的高性能并行訓練系統;(3)向國產算力系統移植并行訓練系統的能力。

基于上述核心技術,本技術成果可支撐大模型并行訓練解決方案。為有大模型訓練需求的客戶,如中小型企業、科研院校,提供高效的大模型并行訓練資源。從超算中心、數據中心、云廠商等處獲取大規模計算資源,并根據客戶的需求部署效率最佳的并行訓練軟件系統,從而支持客戶進行高效的大規模大模型分布式訓練,降低大模型訓練成本。

針對具有動態性的大模型的通信重疊調度機制

項目階段:

本項目擬先進行技術許可。

效益分析:

相比于已有的開源解決方案,本技術成果可提供針對不同硬件環境、目標模型規模,提供定制化并行性能調優,從而比選擇默認并行配置獲得更高的并行效率。例如針對混合專家模型,調優后的系統可獲得超過十倍的效率提升,從而為客戶節省更多成本。相比于專門雇傭并行專業人士的人力成本,使用統一的并行訓練解決方案成本更低。

會員登錄可查看 合作方式、專利情況及聯系方式

掃碼關注,查看更多科技成果

取消
百家乐与21点| 百家乐官网赢钱秘密| 太阳城娱乐城怎么样| 24山风水水口| 博彩网站评级| 百家乐重要心态| 平谷区| 金杯百家乐的玩法技巧和规则| 足球百家乐官网网上投注| 大发888娱乐城维护| 百家乐分析资料| 澳门百家乐官网打法百家乐官网破解方法 | 百家乐官网游戏机高手| 百家乐二路珠无敌稳赢打法| 筹码百家乐官网的玩法技巧和规则 | 香港百家乐六合彩| 怎么赢百家乐官网的玩法技巧和规则 | 保单百家乐路单| 百家乐官网投注哪个信誉好 | 电子百家乐| 大发888 赌博网站| 百家乐赌场| 百家乐必胜法技巧| 百家乐注码管理| 娱乐网百家乐官网的玩法技巧和规则 | 全讯网百家乐的玩法技巧和规则| 立博百家乐官网的玩法技巧和规则| 大玩家百家乐官网游戏| 利记娱乐| 大发888大家赢娱乐| 澳门1百家乐网| 百家乐巴厘岛平台| 网上百家乐官网是现场吗| 百家乐官网多少点数算赢| 江孜县| 兴仁县| 郑州市| 黄金城百家乐官网游戏| 网上百家乐官网真实吗| 澳门百家乐官网娱乐开户| 如何看百家乐官网的路纸|