暫無商品咨詢信息 [發(fā)表商品咨詢]

DeepSeek-R1大模型是一款具備強(qiáng)大自然語言處理能力的人工智能模型,能夠高效完成文本生成、翻譯、問答、代碼編寫等多種任務(wù),適合企業(yè)級應(yīng)用和開發(fā)者集成。本書系統(tǒng)性地解析了大模型的核心原理、關(guān)鍵技術(shù)以及DeepSeek的多個實(shí)際應(yīng)用場景。
全書共分為12章,首先介紹大模型的基礎(chǔ)知識與發(fā)展歷程,從神經(jīng)網(wǎng)絡(luò)的起源到大規(guī)模預(yù)訓(xùn)練模型的演化,再到Transformer、BERT與GPT等模型架構(gòu)的深入剖析,幫助讀者理解大模型的技術(shù)基石。其次詳細(xì)解析了DeepSeek-R1及其Zero版本在強(qiáng)化學(xué)習(xí)與模型架構(gòu)上的核心技術(shù),包括混合專家模型、動態(tài)學(xué)習(xí)率調(diào)度、分布式訓(xùn)練及高效推理優(yōu)化策略等。再次聚焦于模型訓(xùn)練與開發(fā)實(shí)踐,介紹API調(diào)用、上下文拼接、多輪對話管理、模型微調(diào)、知識蒸餾等關(guān)鍵技術(shù),并結(jié)合DeepSeek實(shí)際案例展示其在數(shù)學(xué)推理、代碼生成等領(lǐng)域的應(yīng)用。最后著重探討了大模型在商業(yè)化落地場景中的高級應(yīng)用,如FIM補(bǔ)全、多輪對話、業(yè)務(wù)代碼自動化生成以及基于云部署的智能推薦搜索系統(tǒng)等。
本書內(nèi)容兼具理論深度與實(shí)戰(zhàn)價(jià)值,同時附贈相關(guān)案例代碼、各章思考題及教學(xué)視頻等學(xué)習(xí)資源,適合大模型開發(fā)者、AI研究人員、工程師、數(shù)據(jù)科學(xué)家、企業(yè)技術(shù)決策者以及對人工智能技術(shù)感興趣的高校師生閱讀。無論是希望深入理解大模型技術(shù)的專業(yè)人士,還是尋求在實(shí)際業(yè)務(wù)中應(yīng)用AI技術(shù)的從業(yè)者,都能從中獲得有價(jià)值的信息和實(shí)踐指導(dǎo)。
前言
第1部分 大模型基礎(chǔ)與核心技術(shù)
第1章 大模型簡介
1.1大模型基本概念與發(fā)展歷程
1.1.1從神經(jīng)網(wǎng)絡(luò)到大規(guī)模預(yù)訓(xùn)練模型
1.1.2深度學(xué)習(xí)時代:模型規(guī)模與數(shù)據(jù)驅(qū)動
1.1.3以DeepSeek為例:大模型應(yīng)用場景擴(kuò)展及其商業(yè)化進(jìn)程
1.2大模型關(guān)鍵技術(shù)概覽
1.2.1 Transformer架構(gòu)
1.2.2自監(jiān)督學(xué)習(xí)與預(yù)訓(xùn)練技術(shù)
1.2.3分布式計(jì)算與大模型并行化
1.3大模型訓(xùn)練、微調(diào)與推理
1.3.1數(shù)據(jù)預(yù)處理與模型初始化
1.3.2微調(diào)技術(shù):全參數(shù)微調(diào)與參數(shù)高效微調(diào)
1.3.3高效推理優(yōu)化:量化、剪枝與知識蒸餾
1.4對話大模型V3與推理大模型R1
1.4.1自然語言理解與自然語言生成模型的異同
……
| 基本信息 | |
|---|---|
| 出版社 | 機(jī)械工業(yè)出版社 |
| ISBN | 9787111779223 |
| 條碼 | 9787111779223 |
| 編者 | 丁小晶,崔遠(yuǎn) 編 |
| 譯者 | -- |
| 出版年月 | 2025-04-01 00:00:00.0 |
| 開本 | 16開 |
| 裝幀 | 平裝 |
| 頁數(shù) | 324 |
| 字?jǐn)?shù) | 449000 |
| 版次 | 1 |
| 印次 | 1 |
| 紙張 | 一般膠版紙 |
暫無商品評論信息 [發(fā)表商品評論]
暫無商品咨詢信息 [發(fā)表商品咨詢]