2.2 语音质量参数
语音质量主要有三种ITU标准:
(1)MOS(ITU-P.800),1~5分,5分最好,属于主观评价指标;
(2)PSQM(ITU-P.861),0~6.5分,0分最好,属于客观评价指标;另外,PSQM+属于PSQM评分标准的扩展,评分标准与PSQM相同;
(3)PESQ(ITU-P.862),-0.5~4.5分,4.5分最好,属于客观评价指标,又称之为“话音清晰度”指标;另外,PESQ_LQ是PESQ评分标准的扩展,范围为1~4.5分,更接近于MOS的1~5分标准;
当然,影响话音质量的参数指标还有以下几种:
(4)回声(ECHO),指传输系统由于阻抗不匹配等原因,对声源发出的声音产生的“反射”现象,即说话者很快听到的自己发出的声音。一般,人的耳朵能够识别的回声以150ms为界,超过150ms的回声,人耳能够比较明显的分辨,会产生反感,在150ms以内的回声,一般人都可以接受,基本听不出来。
(5)语音间断(HIT),指由于丢包等传输原因或编解码等原因造成的语音不连续,人耳听到的是断断续续的话音,会产生极大反感。信息产业部的测试规范中规定,20ms以上的语音间断都必须统计,语音间断累计和与总通话时长的比值,称为“语音间断比”,通常这个值不应该超过2%。
(6)语音滑动(CLIP),指由于静音压缩等编解码原因造成的语音边缘模糊,通常是由静音到有声部分或者由有声到静音部分出现声音丢失,人耳听到的是失真的话音,会产生极大反感。信息产业部的测试规范中规定,20ms以上的语音滑动都必须统计,语音滑动累计和与总通话时长的比值,称为“语音滑动比”,通常这个值为零,否则不能入网。
以上六个部分,是用户可以感受到的话音质量指标参数,因此属于QOE的范畴。我们再介绍一下QoS的话音质量指标,这些参数包括时延、抖动、丢包、乱序等,通常与传输质量有关,不属于用户能够体验的部分,因此属于QoS的范畴。
(7)时延(DELAY),指语音在传输系统中需要的传输时间。时延一般分为单向时延(One-Way-Delay)和双向时延(Round-Trip-Delay);单向时延指语音(文件)从发端到收端的传送时间,它直接反映了网络传输质量,对话音质量产生间接影响;双向时延指语音(文件)从发端到收端再回到发端所经历的时间,一般比两倍的单向时延要长,因为收端要对语音进行处理。单向时延的测试精度取决于两点,其一为测试仪表的精度,其二为收发两端采用的共同时钟的精度,思博伦的Abacus5000能够达到2ms的测试精度;网络测试中若采用NTP-Server时钟同步,则其时钟精度为1~10ms,若采用GPS/CDMA为时钟同步源,则其时钟精度小于1ms。一般认为,单向时延应该不超过150ms。