多通道语音前端信号处理

先声互联多通道语音前端信号处理引擎(以下称“先声前端处理”)综合利用了多麦克风空间滤波、语音分离、解混响和声源定位等多项基于物理建模的信号处理技术,并融合了基于机器学习的数据建模机制,为远讲免提模式的语音识别和通信应用提供优异的,对背景噪声、非平稳干扰、设备回声、以及房间混响等不利声学因素的抑制能力。

先声前端处理引擎可广泛支持家居、车载、会议等多种应用场景。先声前端处理引擎支持灵活的麦克风阵列排布方式以及多参考源的情况,对麦克风间距和阵元一致性要求也低于传统的阵列增强算法,可有效提升客户产品方案的实施效率和灵活性。

根据不同的场景需求,先声前端处理引擎目前可支持以下三种不同的解决方案:

●双麦克风方案。主要面向以家用电子为主的消费类电子应用,可以灵活地应用于消费类音响、电视机顶盒、空调以及网络路由器等设备,可支持最远约4米的高清远讲拾音需求;

●四到六麦克风方案。主要面向高端家用电子产品、企业级应用以及机器人,可支持最远约6-8米的高清远讲拾音需求;

●七麦克风以上方案。主要面向对性能要求高的企业级应用和机器人,可支持最远约8-10米的高清远讲拾音需求。

嵌入式远讲语音唤醒

基于长短时记忆模型(LSTM)的声学建模,采用行业领先的特征域优化方案,具有响应快速、高准确率、极低误唤醒率、高噪声鲁棒性和低功耗等特点,支持上线后的模型迭代更新优化。

嵌入式语音识别

自然语言理解

先声互联自然语言处理(以下简称“NLP”)算法,通过基于规则,数理统计和深度学习等技术,为智能终端提供准确,流畅的信息交互,智能家居控制等NLP服务整体解决方案。

采用“云+端”架构,通过NLP“云”端的API服务接口,结合专有NLP知识库,满足客户在家居,车载,办公等场景下,智能终端NLP服务个性化定制的需求。