-
ATR 音声データベースセット C の文音声の個人性類似度 https://www.konan-u.ac.jp/hp/kitlab/pub/ieice_sp201302.pdf
-
ATR 音 声 デ ー タ ベ ー ス 内の 文音 声 に お け る 知 覚 的 話者 間類 似 度 の 計 測 https://www.jstage.jst.go.jp/article/jasj/71/10/71_KJ00010046986/_pdf/-char/ja
-
ATR母音発話MRIデータから作製した声道模型の音響特性作製した声道模型の音響特性 https://www.konan-u.ac.jp/hp/kitlab/pub/asj200803_slide.pdf
- 喉頭腔共鳴:喉頭腔で生じる共鳴 – 主声道の共鳴とほぼ独立で,ホルマントのうち1つ(F4)を生じさせる(Takemoto et al 2006)生じさせる(Takemoto et al., 2006)
-
音声の音響特徴量の動的成分が個人性知覚に与える影響に関する研究(修論) https://dspace.jaist.ac.jp/dspace/bitstream/10119/10425/7/paper.pdf
-
女性声優の声質表現語抽出の試み https://www.konan-u.ac.jp/hp/kitlab/pub/spsc202303_voiceactor.pdf
- 表現語にとどまっており、音響特徴量までは出していない
-
鼻音 Nasality in Speech and Its Contribution to Speaker Individuality https://www.isca-speech.org/archive/pdfs/interspeech_2014/amino14_interspeech.pdf
-
単母音の音響特徴量の変化が個人性知覚に与える影響 https://www.konan-u.ac.jp/hp/kitlab/pub/ieice_sp200703_slide.pdf
- 声帯振動特性と高周波帯域は大事というはなし
-
話者認識 https://www.sp.ipc.i.u-tokyo.ac.jp/~saruwatari/SP-Grad2016_06.pdf
-
-
Save m77so/8977f7a801604fb767d37108b37ecd2f to your computer and use it in GitHub Desktop.
import librosa | |
import librosa.display | |
import numpy as np | |
import matplotlib.pyplot as plt | |
import scipy | |
# def librosa.lpc(y, order): return a | |
def lpc_formant(a, fs): | |
poles = np.roots(a) | |
intns = np.abs(poles) | |
bandw = np.log(intns) * fs / (2*np.pi) / (-2) | |
ff = np.angle(poles) * fs / 2.0 / np.pi | |
return ff[(ff>10) & (ff < fs / 2 - 10) & (bandw < 400)] | |
def lpc_spectrogram(a, fs, worN= 513): | |
freqs, h =scipy.signal.freqz(1.0, a, worN=worN) | |
return freqs * fs / 2 / np.pi, np.abs(h) | |
https://www.jstage.jst.go.jp/article/jasj/68/10/68_KJ00008230190/_pdf/-char/ja
加齢に関係する持続母音の音響特徴量 ジッタ(振動周期の不 規則性),シマ(振幅の不 規則 性),喉頭雑 音量
女性の年齢推定はF0が重要 男性は韻律特徴
嗄声の特徴で有名なのはGRBAS
下咽頭腔の形状の違いは2.5kHzに影響する 4,5Fの接近で張りのある声質になる
F1-4の動的特性よりも平均的な値が個人差を決める重要な要因になる
https://www.jstage.jst.go.jp/article/jasj/58/9/58_KJ00001457953/_pdf/-char/ja
F0 F1-F3のユークリッドノルム 全音声区間での平均スペクトルのピークレベルと2-3kHz帯域での平均値との差 咽頭雑音 母音部の調波構造の評価(2-3,3-4,4-5kHzにわけ、フーリエの調波構造が明瞭かどうか)
https://www.jstage.jst.go.jp/article/jasj/57/5/57_KJ00001457674/_pdf 2001
- 高い声ー低い声
- かすれた声ー澄んだ声
- 落ち着きのある声ー落ち着きのない声
- 迫力のある声ー弱々しい声
- 太い声ー細い声
- 張りのある声ー張りのない声
- 鼻声
https://www.toshiba.co.jp/tech/review/2016/04/71_04pdf/f01.pdf 話者の声の特徴を直感的な言葉で成業できる音声合成技術
https://www.toshiba.co.jp/tech/review/2013/09/68_09pdf/a04.pdf
https://www.slideshare.net/NU_I_TODALAB/toda20160803-miru2016
http://www.slp.cs.tut.ac.jp/~kyama/Lecture/AdvSLP/
https://www.slideshare.net/synergy_marketing/201307-25508611
ここでは音響特徴量に
- ピッチ周波数平均
- エネルギー平均
- ピッチ周波数標準偏差(抑揚
- 息漏れ性(スペクトル傾斜
- 倍音ノイズ比率
を用いる
F1, F2はf0が高いときLPCでは誤差が大きい。ピッチ同期分析、パルス列を仮定したLPCといった実装がある。 https://www.jstage.jst.go.jp/article/jasj/70/10/70_KJ00009557626/_pdf