智能语音技术概述
智能语音技术通过对语音进行分析、理解和合成,是计算机设备实现“能听会说”、具备自然语音交流的技术能力。其涉及的范围主要有:
- 语音合成技术
- 语音识别技术
- 语音测评技术
- 语音降噪与增强技术
- …
智能语音技术的研究难点
智能语音技术是一门跨领域的技术,需要掌握各领域的基础知识、掌握很多技能才能实用化
智能语音技术的应用场景
智能语音技术的处理对象
语音的基本常识
语音的产生
人的发声:肺部呼出的气流通过支气管到达喉头,引发喉头中声带的颤动,振动产生声音,再有口腔或鼻腔控制发声位置。
声音(Sound)是由物体振动产生的声波。是通过介质(空气或固体、液体)传播并能被人或动物听觉感官所感知的波动现象。可以被人耳识别的声波频率在20Hz~20000Hz之间
语音的物理载体及其特征属性
语音的物理载体是一种声波,声波的特征属性包括:
- 音色:区别声音的基本特征
- 音调:声波的频率
- 音高:声波的强度或者振动幅度决定
- 音长:发音的持续时间
语音和语言
- 语音的内涵:语音是人类语言的物质表达;是语言的外部形式;最直接的记录人的思维活动符号体系;人的发音器官发出的具有一定社会意义的声音。
- 语音是声音和语言的组合体。
- 语音是一段语音序列携带语言信息的声音。
音节
音节是能够自然发出和觉察到的最小语音单位。一个音节有一个或几个元音或辅音按照一定的规则组织起来。
语音信号
语音是人类交流的发声形式;语音的基