削除された内容 追加された内容
編集の要約なし
追加: 出典付き定義・解説、修正: Wikipedia様式
 
1行目:
'''PSOLA''' (Pitch Synchronous Overlap and Add; '''ピッチ同期重畳加算''') は「ピッチに基づいた音声の分割・変換・再合成」をおこなう[[音声処理]]の枠組み<ref>特定のアルゴリズムではなく、流れ・型である。 "a pitch-synchronous overlap-add (PSOLA) '''approach''' ... we first present the common PSOLA '''framework'''" MOULINES, et al. (1990).</ref>である。ピッチ同期波形重畳法<ref>
{{Wikify|date=2021年2月4日 (木) 08:52 (UTC)}}
{{citation|author=板橋秀一|year=2005|title=音声工学|page=169|publisher=森北出版|isbn=9784627828117}}</ref>とも。
'''PSOLA''' (Pitch Synchronous Overlap and Add; '''ピッチ同期重畳加算''' あるいは ピッチ同期波形重畳法<ref>
{{citation
| author = 板橋秀一
| year = 2005
| title = 音声工学
| page = 169
| publisher = 森北出版
| isbn = 9784627828117
}}</ref>) とは、音声信号の {{trnote|スペクトルをある程度保ったまま}} [[ピッチ]]や持続時間([[テンポ]])を変更可能な、[[音声処理]](特に[[音声合成]])のための[[デジタル信号処理]]手法である。
 
PSOLAを採用した音声処理ではスペクトル包絡/[[フォルマント]]を保ったまま[[音高]]や持続時間([[テンポ]])を変更できる。
PSOLAは、音声波形を {{trnote|波形周期(ピッチ)と同期した分析窓で、<ref name=Kortekaas97>
 
PSOLAは次の3つの段階(分析・変換・再合成)からなる<ref>"The PSOLA synthesis scheme involves the three following steps: an analysis of the original speech waveform ... modifications brought to this intermediate representation ... the synthesis of the modified signal from the modified intermediate representation" MOULINES, et al. (1990). ''PITCH-SYNCHRONOUS WAVEFORM PROCESSING TECHNIQUES FOR TEXT-TO-SPEECH SYNTHESIS USING DIPHONES''.</ref>。
 
# 分析: 信号を短い区間の集合へ変換<ref>"consists of a sequence of short-term signals x<sub>m</sub>(n)" MOULINES, et al. (1990).</ref>。'''区間長は可変'''、短時間での'''ピッチ'''に'''同期'''('''P'''itch-'''S'''ynchronous)<ref>"at a pitch-synchronous rate on the voiced portions of the signal and at a constant rate on the unvoiced portions." MOULINES, et al. (1990).</ref>
# 変換: 区間ごとあるいは区間単位で操作
# 再合成: [[重畳加算法|重畳加算]]('''O'''ver'''L'''ap-'''A'''dd)
 
PSOLA分析では、対象の音声波形を {{trnote|波形がもつ周期(ピッチ)と同期した分析窓で、を用い<ref name=Kortekaas97>
{{citation
| author1 = R. Kortekaas
19行目:
| journal = Journal of the Acoustical Society of America (JASA)
| volume = 101 | issue = 4 | pages = 2202&ndash;2213
}}</ref>}}互いにオーバーラップした短い断片({{trnote|/区間(基本周期の2倍程度<ref name=Kortekaas97/>}})に分割して処理する。

変換例として、信号のピッチを下げるには断片を互いに遠ざけ、ピッチを上げるには互いに近付けて断片を再配置する。({{trnote|なお、この操作は断片を離す/重ねる結果として信号長/持続時間変化するため、次の補正ので、<ref name=Kortekaas97/> 次の補正を行う}}) 信号の持続時間を長くするには 引き続き同じ断片を複数回繰り返し、短くするには いずれかの断片を間引きする。{{trnote|一連の操作の後、}} 各

変換された断片[[重畳加算法]] ({{lang-en|overlap-add}}) で結合され信号が再合成される。
 
PSOLAを採用しかつ操作が時間領域でおこなわれるアルゴリズムはTD-PSOLAと総称され、また周波数領域でおこなわれるアルゴリズムはFD-PSOLAと総称される<ref>"The modifications of the speech signal are performed either in the frequency domain (FD-PSOLA) ... or directly in the time domain (TD-PSOLA)" MOULINES, et al. (1990).</ref>。
 
PSOLAは音声信号の[[韻律 (言語学)|韻律]] ({{lang-en|prosody}}) の変更に使用できる。
27 ⟶ 33行目:
* [[重畳加算法]]
* [[波形接続型音声合成]]
*[[フェーズボコーダ]](一定区間長/STFTで分析)
 
== 参考文献 ==