暫無商品咨詢信息 [發表商品咨詢]
1、傳統與智能深度融合,構建完整知識體系
遵循計算機視覺算法演化邏輯,將經典算法與前沿深度學習技術有機融合。從特征提取、目標檢測到三維重建,均以“從傳統方法到智能技術”為主線,幫助讀者厘清技術發展脈絡,構建統一、連貫、完整的知識體系。
2、零基礎友好設計,輕松邁入視覺智能之門
充分考慮初學者的知識背景,從人類視覺感知原理講起,循序漸進過渡到神經網絡與視覺語言模型,語言通俗易懂,邏輯清晰縝密,是計算機、電子及相關交叉學科讀者的理想入門之選。
3、知識實例化呈現,讓抽象理論“看得見”
采用“知識實例化”的編寫方式,將抽象算法轉化為直觀實例。通過大量具體案例演示算法流程,輔以全彩圖表和可運行代碼(基于Skimage、OpenCV、PyTorch),讓復雜理論和模型結構變得生動易懂。
4、理論與實踐深度綁定,鍛造工程實踐能力
理論教材與配套PyTorch實踐教程風格統一、內容同步。理論講解中的編程實例與實踐教學的深度學習框架相對應,形成“理論學習-實踐操作-知識鞏固”的完整閉環。
5、教學資源豐富,助力高效教與學
每章配備精選習題,涵蓋基礎鞏固、代碼實踐與前沿技術探討,幫助讀者深化理解。配套實踐教程提供 “實踐引導 + 問題思考”模式,注重培養工程思維與創新意識,適配課堂教學與自學。
本書系統整合了計算機視覺領域的經典算法與現代智能視覺技術,全面介紹了該領域的核心理論與方法體系。本書內容豐富,涵蓋了以下主要知識點:計算機視覺基本概念及技術基礎、人類視覺感知與圖像特征多層表達、圖像特征與圖像對齊、二值圖像分析、區域分割、紋理特征分析、相機成像模型和標定技術、光流計算、三維重建、傳統目標檢測與識別算法、傳統目標跟蹤算法、智能目標識別與跟蹤、三維點云特征及理解、視覺語言模型等。
本書適合作為計算機科學與技術、軟件工程及電子類專業本科生、研究生的教材或教學參考書,也可供從事計算機視覺應用與研究的開發人員和科研人員使用。對于計算機視覺先行課程知識欠缺的讀者,本書提供了循序漸進、易于理解的學習路徑,幫助他們系統掌握計算機視覺算法原理和關鍵技術。
謝源,現任華東師范大學計算機科學與技術學院教授、博導,國家優青,閩江學者講座教授,人社部“香江學者”。于2010年和2013年分別獲得廈門大學計算機系和中國科學院自動化所工學碩士和博士學位。2014年獲國家人社部和博管會的資助,授予“香江學者”的稱號,赴香港理工大學計算機系從事兩年的博士后研究工作。歷任中國科學院自動化研究所助理研究員(2013)和副研究員(2016)。
第 1章 計算機視覺基礎 1
1.1 概述 1
1.1.1 計算機視覺概念 1
1.1.2 計算機視覺的發展歷史及應用 2
1.1.3 與其他學科之間的關系 7
1.1.4 計算機視覺算法流程 9
1.2 數字圖像基礎 11
1.2.1 數字圖像基本概念 11
1.2.2 數字圖像質量影響因素 16
1.2.3 數字圖像基本運算 18
1.2.4 數字圖像的空域處理 20
1.2.5 圖像濾波處理 21
1.3 機器學習與人工智能技術 22
1.3.1 人工智能技術的發展 22
1.3.2 機器學習概念及常用算法 23
1.3.3 機器學習與深度學習 27
1.3.4 深度學習技術的發展 29
1.3.5 神經元與人工神經網絡 30
1.3.6 神經網絡結構 32
1.3.7 卷積神經網絡 34
1.4 計算機視覺編程基礎 37
1.4.1 Python語言簡介 37
1.4.2 圖像處理的軟件包 39
1.4.3 深度學習編程框架 40
1.4.4 深度學習編程實例 43
習題 45
第 2章人類視覺感知與圖像特征多層
表達 46
2.1 人眼結構與視覺特性 46
2.1.1 人眼結構 46
2.1.2 人眼視覺特性 47
2.1.3 人類視覺感知 48
2.1.4 顏色感知與色彩空間 50
2.1.5 視覺感知特征及作用 54
2.2 圖像的多層次表達 55
2.2.1 圖像金字塔與人類的感知 55
2.2.2 圖像金字塔技術的作用 56
2.3 濾波器 57
2.3.1 濾波器概念 57
2.3.2 空域濾波器 58
2.3.3 頻域濾波處理 67
2.3.4 圖像濾波與金字塔生成 71
2.4 深度學習的多層特征 72
2.4.1 圖像的卷積運算 72
2.4.2 卷積神經網絡及多層特征 74
習題 75
第3章圖像特征與圖像對齊 77
3.1 圖像特征及常見類型 77
3.2 點特征 80
3.3 邊緣特征 85
3.4 區域特征 92
3.5 多視圖及特征對應 95
3.6 特征匹配技術 97
3.7 圖像對齊技術基礎 99
3.8 全局圖像對齊 101
3.8.1 基于幾何變換的對齊 102
3.8.2 基于投影變換的對齊 103
3.9 智能圖像對齊 104
3.9.1 塊對齊算法 104
3.9.2 最優匹配點的智能圖像對齊
算法 105
3.9.3 智能幾何變換對齊 106
3.9.4 智能關鍵點匹配算法 107
習題 108
第4章二值圖像分析 109
4.1 二值圖像概念 109
4.2 二值圖像的創建 110
4.3 連通性及連通成分標記 111
4.4 區域的邊界 113
4.5 圖像骨架化 113
4.6 數學形態學處理方法 115
4.6.1 數學形態學基本運算 117
4.6.2 數學形態學處理算法 121
4.7 二值圖像的應用實例 126
習題 127
第5章 區域分割 128
5.1 區域分割概念 128
5.2 傳統圖像分割 128
5.2.1 閾值分割法 128
5.2.2 基于區域的分割技術 136
5.2.3 基于輪廓的分割技術 139
5.3 圖像語義概念 147
5.4 語義分割技術發展及CNN基礎 148
5.5 基于深度學習的語義分割 151
5.5.1 基于FCN的語義分割技術 151
5.5.2 其他語義分割網絡 153
5.5.3 基于注意力機制的語義分割 156
5.6 基于區域的智能分割算法 158
習題 160
第6章紋理特征分析 161
6.1紋理的定義及分類 161
6.2紋理特征分析的常用方法 162
6.3基于紋理的分類與識別 166
6.4圖像修復 167
6.5圖像風格化處理 174
習題 179
第7章相機成像模型和標定技術 180
7.1從3D到2D的成像 180
7.2相機成像模型 182
7.3攝像機標定技術基礎 184
7.4對極幾何與攝像機自標定 188
7.5智能成像模型學習方法 190
習題 192
第8章光流計算 193
8.1光流概念 193
8.2光流估計的用途 194
8.3運動場與光流的關系 195
8.4光流估計方法 196
8.5基于深度學習的光流估計 201
8.6基于光流的智能表情分析實例 203
習題 205
第9章三維重建 206
9.1三維重建基礎 206
9.2三維場景表達方法 206
9.2.1立體表面表達 206
9.2.2空間點云表達 208
9.2.3體表達 209
9.2.4體素表達 210
9.2.5深度映像表達 211
9.3三維形狀重建 212
9.3.1基于明暗恢復形狀 212
9.3.2基于紋理恢復形狀 213
9.4主動視覺與被動視覺重建 214
9.4.1主動視覺重建 214
9.4.2被動視覺重建 217
9.5智能三維重建算法 221
9.5.1單幅圖像重建技術 221
9.5.2神經輻射場重建 223
9.5.3DeepSDF重建 224
習題 226
第 10章傳統目標檢測與識別算法 227
10.1目標識別概念 227
10.2目標識別算法分類 228
10.3目標識別算法流程 229
10.4滑動窗口目標檢測算法 232
10.5目標識別詞袋算法 233
10.6基于AdaBoost的人臉檢測算法 235
習題 238
第 11章傳統目標跟蹤算法 239
11.1目標跟蹤概念 239
11.2目標跟蹤技術難點 240
11.3運動目標檢測與跟蹤 241
11.4傳統跟蹤算法基礎 241
11.5典型目標跟蹤算法 244
11.5.1核跟蹤算法基礎 244
11.5.2均值漂移算法 244
11.6卡爾曼濾波器跟蹤算法 246
11.7相關濾波運動跟蹤算法 248
習題 249
第 12章智能目標識別與跟蹤 251
12.1智能目標識別算法基礎 251
12.2R-CNN算法 252
12.3SPP-Net算法 252
12.4Fast R-CNN算法 254
12.5Faster R-CNN算法 255
12.6YOLOv1算法 256
12.7SSD算法 257
12.8YOLOv2算法 259
12.9YOLOv3算法 260
12.10基于YOLO的其他跟蹤算法 261
習題 263
第 13章三維點云特征及理解 265
13.1點云濾波處理與表達 266
13.1.1點云濾波基礎 266
13.1.2點云關鍵點提取與描述 267
13.1.3點云體素化與稀疏化表達 269
13.2點云特征描述方法 270
13.2.1點云特征描述子 271
13.2.2特征描述的算法實例 276
13.3智能點云運算算法實例 276
13.3.1智能點云運算技術的發展 276
13.3.2PointNet算法 277
13.3.3PointNet++算法 280
13.3.4PointConv算法 281
13.4三維點云語義理解 282
13.5三維點云目標分類 284
習題 286
第 14章視覺語言模型 287
14.1語言模型技術基礎 287
14.1.1語言模型的詞嵌入 287
14.1.2預訓練語言模型 288
14.1.3 大語言模型技術及發展 292
14.2視覺語言模型基礎 293
14.3端到端的視覺語言模型 296
14.3.1CLIP模型 296
14.3.2ALBEF模型 298
14.3.3VLMo 300
14.3.4BLIP模型 301
14.3.5CoCa模型 302
14.3.6BEiT-3模型 304
14.4基于預訓練的視覺語言模型 305
14.4.1BLIP-2模型 305
14.4.2InstructBLIP模型 305
14.4.3MiniGPT-4模型 306
14.4.4LLaVA模型 307
14.4.5VisualGLM-6B模型 308
14.4.6CogVLM模型 309
14.4.7MiniGPT-5模型 310
14.4.8GPT-4V模型 311
14.5穩定擴散模型 312
14.5.1擴散模型 313
14.5.2去噪擴散概率模型 313
14.5.3LDM 314
14.5.4SDM 315
習題 316
| 基本信息 | |
|---|---|
| 出版社 | 人民郵電出版社 |
| ISBN | 9787115663177 |
| 條碼 | 9787115663177 |
| 編者 | 謝源 高巖 全紅艷 著 |
| 譯者 | -- |
| 出版年月 | 2025-10-01 00:00:00.0 |
| 開本 | 16開 |
| 裝幀 | 平裝 |
| 頁數 | 316 |
| 字數 | 548 |
| 版次 | 1 |
| 印次 | 1 |
| 紙張 | |
暫無商品評論信息 [發表商品評論]
暫無商品咨詢信息 [發表商品咨詢]