內容簡介
《聲學事件檢測理論與方法》係統地介紹聲學事件檢測的相關理論與方法,以及新研究進展。內容包括聲學事件檢測的基本原理、一般數據規模下的聲學事件檢測、大數據規模下的聲學事件檢測。在一般數據規模下的檢測中,重點介紹基於長時特徵的檢測理論與方法,包括基於基頻段特徵的檢測、基於混閤模型的檢測、基於稀疏低秩特徵的檢測,以及基於鬆弛邊際與並行在綫的模型訓練方法。在大數據規模下的檢測中,重點介紹適閤大數據的快速和在綫式模型訓練方法,包括基於支持嚮量機的加速訓練、基於深度模型的加速訓練、通用型在綫及隨機梯度下降算法,以及牛頓型隨機梯度下降算法等。最後介紹兩個典型應用:行車周邊聲音環境的感知以及音頻場景識彆。
《聲學事件檢測理論與方法》可作為高等院校計算機應用、信號與信息處理、通信與電子係統等專業及學科的研究生教材,也可供該領域的科研及工程技術人員參考。
內頁插圖
目錄
前言
第1章 緒論
1.1 聲學事件檢測技術的發展
1.1.1 聲學事件檢測的起源與發展脈絡
1.1.2 基於特徵的聲學事件檢測
1.1.3 基於模型的聲學事件檢測
1.2 聲學事件檢測技術的應用
1.3 聲學事件檢測係統的結構
1.4 本書的結構
第2章 聲學事件檢測中的常用特徵和模型
2.1 聲學事件檢測中的常用特徵
2.1.1 聲音信號的數字化
2.1.2 聲音信號的時域特徵
2.1.3 聲音信號的頻域特徵
2.1.4 聲音信號的時頻域特徵
2.1.5 特徵降維與選擇
2.2 聲學事件檢測中的常用模型
2.2.1 淺層模型
2.2.2 深度模型
2.3 本章小結
第3章 基於基頻段特徵的聲學事件檢測
3.1 引言
3.2 長時特徵提取
3.2.1 長時統計特徵提取
3.2.2 基於基頻段的特徵提取
3.3 基於長時統計特徵的聲學事件檢測
3.3.1 基於單分類器和多分類器融閤的聲學事件檢測
3.3.2 基於類內細分聚類的聲學事件檢測
3.3.3 基於拒識和確認的聲學事件檢測
3.4 實驗和結果
3.4.1 實驗設置
3.4.2 實驗結果與分析
3.5 本章小結
第4章 基於混閤模型的聲學事件檢測
4.1 引言
4.2 僞高斯混閤模型
4.2.1 僞高斯混閤模型的構建
4.2.2 僞高斯混閤模型參數估計的EM算法.
4.3 異質混閤模型
4.3.1 多變量Logistic混閤模型的可辨識性
4.3.2 異質混閤模型的構建
4.3.3 異質混閤模型的參數估計
4.4 實驗和結果
4.4.1 基於僞高斯混閤模型的聲學事件檢測
4.4.2 基於異質混閤模型的聲學事件檢測
4.5 本章小結
第5章 基於稀疏低秩特徵的聲學事件檢測
5.1 引言
5.2 基於稀疏錶示特徵的聲學事件檢測
5.3 基於低秩矩陣錶示特徵的聲學事件檢測
5.3.1 低秩矩陣錶示特徵提取
5.3.2 低秩矩陣分類的問題描述.
5.3.3 基於加速近似梯度方法的矩陣分類學習
5.4 基於低秩張量錶示特徵的聲學事件檢測
5.4.1 張量計算相關記號.
5.4.2 低秩張量錶示特徵提取
5.4.3 基於加速近似梯度方法的張量分類學習
5.5 實驗和結果
5.5.1 基於稀疏錶示特徵的聲學事件檢測
5.5.2 基於低秩矩陣錶示特徵的聲學事件檢測
5.5.3 基於低秩張量錶示特徵的聲學事件檢測
5.6 本章小結
第6章 基於鬆弛邊際下模型訓練的聲學事件檢測
6.1 引言
6.2 基於跡範限製下的最大邊際矩陣分類
6.2.1 基於跡範限製與鬆弛邊際的矩陣分類問題描述
6.2.2 基於交替搜索方式的矩陣分類學習算法
6.3 基於跡範限製下的最大邊際張量分類
6.3.1 基於跡範限製與鬆弛邊際的張量分類問題描述
6.3.2 基於交替搜索方式的張量分類學習算法
6.4 實驗和結果
6.5 本章小結
第7章 基於在綫並行模型訓練的聲學事件檢測
7.1 引言
7.2 在綫並行的矩陣數據分類學習方法
7.2.1 基於加速近似梯度方法的矩陣分類在綫學習
7.2.2 基於逼近加速近似梯度方法的在綫學習
7.2.3 基於小批量更新的在綫學習
7.2.4 基於並行計算加速的矩陣分類學習
7.3 在綫並行的張量數據分類學習方法
7.4 實驗和結果
7.4.1 基於在綫並行學習的低秩矩陣特徵分類
7.4.2 基於在綫並行學習的低秩張量特徵分類
7.5 本章小結
第8章 基於錨空間的聲學事件檢測
8.1 引言
8.2 錨模型簡介
8.3 基於狀態變化統計量的錨空間聲學事件檢測
8.3.1 基於狀態變化統計量的錨空間生成方法
8.3.2 實驗與討論
8.4 基於高斯混閤模型錨空間的聲學事件檢測
8.4.1 基於高斯混閤模型錨空間的目標與集外錨模闆的生成
8.4.2 基於高斯混閤模型的聲學事件檢測機製
8.5 基於稀疏分解錨空間的聲學事件檢測
8.5.1 基於稀疏分解錨空間的目標與集外錨模闆的生成
8.5.2 基於稀疏分解的聲學事件檢測機製
85.3 實驗與討論
8.6 本章小結
第9章 麵嚮大數據環境下聲學事件檢測的凸優化理論
9.1 引言
9.2 與聲學事件檢測相關的凸優化理論
9.2.1 早期凸優化
9.2.2 凸優化基礎
9.2.3 一階方法的動機
9.3 光滑與非光滑的凸優化一階方法
9.3.1 光滑目標
9.3.2 復閤優化目標函數
9.3.3 近端目標
9.4 隨機化技術
9.5 並行和分布式計算
9.6 本章小結
第10章 麵嚮大數據處理的支持嚮量機模型的加速算法
10.1 隨機對偶坐標上升法
10.1.1 問題描述及相關工作
10.1.2 基於對偶間隙邊界的SDCA收斂性分析
10.2 加速近端隨機對偶坐標上升法
10.2.1 問題描述及相關工作
10.2.2 基於對偶間隙邊界的Prox-SDCA收斂性分析
10.3 本章小結
第11章 麵嚮大數據處理的深度模型的加速算法
11.1 引言
11.2 全梯度與隨機梯度下降算法
11.3 加速梯度算法
11.4 指數型收斂的隨機梯度下降算法
11.4.1 隨機平均梯度法.
11.4.2 隨機方差減梯度方法
11.5 坐標梯度下降算法
11.6 本章小結
第12章 麵嚮大數據的通用型在綫及隨機梯度下降算法
12.1 引言
12.2 通用在綫梯度法
12.2.1 通用的在綫原始梯度方法
12.2.2 通用的在綫對偶梯度方法
12.2.3 通用的在綫快速梯度方法
12.3 通用隨機梯度法
12.3.1 算法描述
12.3.2 收斂性分析
12.4 數值實驗
12.4.1 LASSO問題
12.4.2 施泰納問題
12.5 本章小結
第13章 麵嚮大數據的牛頓型隨機梯度下降算法
13.1 引言
13.2 近端牛頓型隨機梯度法
13.2.1 正則化的二次模型
13.2.2 Hessian矩陣的近似
13.3 算法的收斂性分析
13.4 數值實驗
13.5 本章小結
第14章 基於聲學事件檢測的行車周邊聲音環境感知
14.1 引言
14.2 實驗環境與基綫係統
14.3 基於徑嚮基函數神經網絡噪聲建模的聲學事件檢測
14.4 基於等響度麯綫的聲學事件檢測
14.5 基於基頻軌跡特徵的聲學事件檢測
14.6 本章小結
第15章 音頻場景識彆
15.1 引言
15.2 基於高斯直方圖特徵的音頻場景識彆
15.2.1 高斯直方圖特徵
15.2.2 分類模型
15.3 基於遷移學習的音頻場景識彆
15.3.1 遷移學習概述
15.3.2 基於樣本平衡化的音頻場景識彆
15.3.3 基於改進樣本平衡化的音頻場景識彆
15.4 實驗和結果
15.5 本章小結
參考文獻
前言/序言
人類生活在一個充滿聲音的世界中,各種活動、事件無不伴隨著豐富多彩的聲音。對聲音的感知與理解是人類認知世界的最重要途徑之一。隨著信息技術的迅猛發展,開展機器模仿人類對聲音認知能力的相關研究越來越受到重視。
聲音感知與理解的目標是使計算機能感知入耳聽覺所能關注和理解的聲音。聲音的類型大體可分為語音和非語音,對不同的聲音類型,所應采取的處理方法也不盡相同。有關語音感知與理解方麵的研究已較為豐富,如語音識彆、說話人識彆等。近年來,針對非語音感知與理解的研究已逐漸成為學術界的研究熱點。研究者普遍認為非語音的聲音也能傳遞有用的信息,通過對這些聲音的分析和處理,能夠為智能決策提供重要的信息。非語音感知和理解的核心技術之一正是本書所要討論的問題——聲學事件檢測。
聲學事件檢測是指對連續聲音信號流中一段具有明確語義的片段進行分析,並標定其語義類彆的過程。聲學事件檢測是機器對環境聲音場景進行感知和語義理解的重要基礎,其在未來類人機器人聲音環境的語義理解、無人車行車周邊環境的聲音感知等方麵將發揮重要的作用。
聲學事件檢測的研究經過十幾年的發展已經取得瞭長足的進步。從其發展過程看,經曆瞭從簡單事件類型到復雜事件類型的檢測,從孤立片段的事件檢測到連續聲音流中的事件檢測,從實驗室模擬的聲學事件到現實生活中的聲學事件檢測的過程。多年來在語音識彆和音樂處理方麵的研究工作,為聲學事件檢測提供瞭數字信號處理與機器學習層麵的技術積纍;而機器的環境感知以及基於語義的多媒體信息檢索對聲學事件檢測的強烈需求,牽引和驅動瞭聲學事件檢測的發展。近年來,數字信號處理與機器學習中,如稀疏錶示與壓縮感知、深度學習等方麵的突破,為聲學事件檢測研究提供瞭更有效的理論方法和技術手段。
全書共15章,分彆介紹聲學事件檢測中的特徵提取和常用模型、一般數據規模下的聲學事件檢測、大數據規模下的聲學事件檢測,以及聲學事件檢測的典型應用。其目的不僅讓讀者對聲學事件檢測理論和方法有一個係統的瞭解,而且努力將本領域的新動態介紹給讀者,希望讀者能在學術思想上受到啓發。
聲學事件檢測理論與方法 下載 mobi epub pdf txt 電子書 格式