
语音端点检测VAD(Speech Endpoint Detection)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
语音端点检测(VAD, Voice Activity Detector)是一种技术,用于识别音频流中人类语音的存在与否及起止位置,从而有效提升语音处理系统的效率和准确性。
端点检测是指确定句子的时间起始点和终点,并忽略中间少量的非语音帧,用于语音识别(Speech Endpoint Detection)。熵是信息论中的一个量度指标,用来反映信息的程度。随机事件的不确定性越大,则其熵值也越高,所携带的信息量也就越多。
本次作业采用谱熵法对语音进行端点检测。
全部评论 (0)
还没有任何评论哟~


