智慧语音系统内置的声学模型以汉语拼音声韵母为基本识别单元进行声学建模,兼顾了模型的颗粒度及可扩展性。为了提高模型训练的鲁棒性,采用数万小时:全面用语音数据,并进行了dataauament,主要包括speed,/volumn/,RIR/pitch,/noise perturbation 等手段,把训练数报量又扩大了20倍。支持语言模型和声学模型定制化。语言模型可针对客户的行业领域的专有词汇、行业术语等做优化,如业务流程中的热词资源可以通过语言模型实时训练后,达到理想的识别效果;声学模型则针对客户所属地区的口音做针对性优化。针对业务中出现的新兴词汇,可通过自定义发音的热词机制做到即时支持,无需做额外的模型训练工作。热词数量支持万条以上,并可在运行时灵活切换。