40 likes | 223 Views
(a) 原音声. (1) NORMAL /ape/. (b) /ate/ の閉鎖前部 /a/ と /ape/ の閉鎖後部 /pe/ (Cross-Splicing). (2) VC 1 -C 2 V /at-pe/. (c) 単独発声 /a/ と /ape/ の閉鎖後部 /pe/. (3) V-C 2 V /a-pe/. (d)/ape/ の閉鎖後部 /pe/ のみ. (4) CV(POST). デモ音声1:音素クロススプライシング. ○ 音素修復は先行母音に含まれる情報を利用する. クリックすると 音声を聞くこと ができます.
E N D
(a) 原音声 (1) NORMAL /ape/ (b) /ate/の閉鎖前部/a/と/ape/の閉鎖後部/pe/ (Cross-Splicing) (2) VC1-C2V /at-pe/ (c) 単独発声/a/と/ape/の閉鎖後部/pe/ (3) V-C2V /a-pe/ (d)/ape/の閉鎖後部/pe/のみ (4) CV(POST) デモ音声1:音素クロススプライシング ○音素修復は先行母音に含まれる情報を利用する クリックすると 音声を聞くこと ができます (論文内図4に対応、関連実験結果は図6)
音声/ape/ (1) Original (2) Noise 10ms (3) Noise 30ms (4) Noise 50ms (5) Noise 70ms デモ音声2:雑音置換 ○音素修復は雑音置換長が長くなると難しくなる (論文内図5に対応、関連実験結果は図6) クリックすると 音声を聞くこと ができます
デモ音声3:話者間クロススプライシング ○音素修復は異なる話者の先行母音情報も利用する クリックすると 音声を聞くこと ができます (論文内図8に対応、実験結果は論文内図9) ノイズ 無 有(70ms) /aka/ (3) Talker conflict刺激 (V:B-CV:A -> ak:B+ka:A) Talker A /apa/ (2) Phoneme conflict刺激 (VC1-C2V -> ak:A+pa:A) /aka/ (4) Talker/Phoneme conflict刺激 (VC1:A-C2V:B -> ap:A+ka:B) Talker B /apa/ (1) NORMAL刺激 (VCV -> ap:B+pa:B)
閉鎖時間長 増大方向 話者競合 有 無 閉鎖時間長 減少方向 話者競合 有 無 120(ms) 120(ms) 通常 /ape/ 無声 /ape/ 150(ms) 90(ms) 180(ms) 60(ms) 210(ms) 30(ms) 促音 /appe/ 有声 /abe/ 250(ms) 0(ms) デモ音声4:閉鎖時間変化 ○促音化は話者間でも起こるが、有声化は起きない。 原音声ape/の閉鎖時間を変化。 話者競合ありは、話者間で合成する際の閉鎖区間を変化。