![]() ![]() |
高效深度學習 讀者對象:機器學習堵
在生成式人工智能的時代,我們見證了模型推理對存儲空間和計算能力的巨大需求,這對大語言模型和視覺生成模型的實際應用提出了前所未有的挑戰(zhàn)。在這樣的背景下,高效模型壓縮和模型設計技術顯得尤為重要,它們是降低模型計算和存儲需求的關鍵,使得模型的快速部署和高效運行成為可能。本書系統(tǒng)地介紹了高效模型壓縮和模型設計的方法,在編寫上兼顧理論和實踐。本書主體部分詳細介紹了模型壓縮的方法論,包括高效模塊設計、模型剪枝、模型量化、模型二值化、神經(jīng)網(wǎng)絡架構搜索、知識蒸餾幾大部分。另外,簡要介紹了定制化硬件加速器的設計及大語言模型的加速和壓縮。
你還可能感興趣
我要評論
|