100 likes | 288 Views
動態時間校正 (Dynamic Time Warping). 動態時間校正. 兩個 N 維空間的向量,它們之間的距離可以定義為 兩點之間的直線距離, 稱為歐基里得距離( Euclidean Distance ) 假設有兩個 3 維空間的向量,分別為 x (4 , 7) 與 y (7 , 11) ,則此兩向量之間的距離為 :. 動態時間校正. 若兩個向量的長度不同,那它們之間的距離,可利用動態時間校正來解決
E N D
動態時間校正 • 兩個N維空間的向量,它們之間的距離可以定義為兩點之間的直線距離,稱為歐基里得距離(Euclidean Distance) • 假設有兩個3維空間的向量,分別為x(4 , 7)與y(7 , 11),則此兩向量之間的距離為:
動態時間校正 • 若兩個向量的長度不同,那它們之間的距離,可利用動態時間校正來解決 • 假設有兩個向量t(t1,t2,…,tN)與r(r1,r2,…,rM),它們各別的長度為N與M,則DTW 的目標是要找出一條最短路徑,使得兩向量的距離最小 r4 r3 r2 r1 t1 t2 t3 t4 t5 t6
動態時間校正 • 路徑必須滿足下列條件: • 端點關係:頭對頭、尾對尾 • 局部關係:假設某一點D(i , j)為最佳路徑上的點,其前一點路徑只有三種可能:D(i-1 , j)、D(i-1 , j-1)和D(i , j-1)
DTW 步驟 • 定義D(i , j)為ti與rj之間的距離值 • 利用遞迴找出向量t與r之間的最小累積距離值A(N,M),其遞迴關係如下所示: 其中D(i ,j)為ti與rj之間(i , j)的距離值 A(i ,j)為原點(1 , 1)到(i , j)的最小累積距離值
動態時間校正 4 6 8 3 4 1 2 2 3 10 0 5 3 2 5 7 5 0 1 5 0 7 3 2 各點的距離值 5 10 14 9 13 17 12 -1 6 6 9 18 11 16 4 4 8 8 11 16 16 2 1 13 6 6 16 18 1 -3 2 9 -1 4 從原點到各點之最小累積距離值
動態時間校正 • 延伸到聲紋辨識上 • 假設每個音框有N維的特徵向量,則樣本音框SF1與測試音框TF1之間的距離D(1 , 1)為: 樣本音框(SF) SF4 SF3 SF2 SF1 測試音框(TF) TF1 TF2 TF3 TF4 TF5 TF6