R値が劣化する要因は?

 POLQAによる音声品質評価の場合、遅延時間の大小に関係なく、遅延時間が一定の場合には良いスコアが出やすい傾向があります。R値と音声遅延時間の関係を表したのが図1です。確かに音声遅延時間が大きいからといってR値が悪いとは言えないことが分かります。

図1●音声遅延時間とPEXQで評価したR値に相関関係はない
[画像のクリックで拡大表示]

 では、音声遅延時間以外にR値を劣化させる要因はどこにあるのでしょうか? PEXQの測定結果からR値が劣化する要因を推測してみましょう。

 表2にSkypeの時間帯別の音声品質測定結果を示します。表2の「Overall Level」は音声サンプル全体のシグナルレベル(音量)、「Pause Level」は音声サンプルの中で無音(non-speech)部分の平均音量、「Active Speech」は音声が入っている部分の平均音量、「Attenuation」はリファレンスファイルと比較した場合の信号の減衰を指します。「R-Factor」はR値、「MOS-LQO」はMOS値に該当します。

表2●PEXQによる音声品質測定結果(Skype)
[画像のクリックで拡大表示]

 表2を見ると、昼時間帯だけ「Pause Level」「SNR」の値が他の時間帯の測定結果と隔たりがあることが分かります。「Pause Level」は無音部分の音量、「SNR」は雑音比です。このことから、リファレンスファイルと比較して雑音が大きいためにR値が低くなっていると考えられます。