根据系统设计功能的要求,目前常用的语音识别芯片种类一般有:单片机(MCU)、DSP和SoC(System on Circuit)。考虑到普通单片机(MCU)资源的紧缺及运行速度较慢的缺点,因而在本系统设计将不考虑使用单片机(MCU)作为语音识别的处理器。DSP包含用作数字信号处理的专用部件,运算能力强、精度高,但目前DSP的价格比较高,同时考虑到本系统的特性,需要选择一种既有较强的运算能力,合适于语音识别的功能,并且能实现较好的用户操作界面,并带有文件系统(用于识别地图)的功能,因而选择DSP并不是明智之举。目前Texas Instruments公司新推出的一款芯片OMAP3530,它具有双内核ARMCortexTM-A8的内核和TMS320C64+TM DSP内核,属于高性能的OMAP35x架构系列产品,满足了系统设计的各种功能特性要求。
HTK(Hidden Markov Model Toolkit)是一套专门的建立和处理隐马可夫模型(HMMs)的实验工具包,由英国剑桥大学工程系(Cambridge University Engineering Department,CUED)开发的,主要应用于语音识别领域,也可以应用于语音合成、字符识别和DNA排序等研究领域。HTK经过剑桥大学、Entropic公司及Microsoft公司的不断增强和改进,使其在语音识别领域处于世界领先水平。
基于HTK的语言识别时,识别结果适用只能显示在DOS或终端上,而且不利于将结果保存、移植或者二次开发利用。在本语音识别系统中使用了HTK接口工具ATK(AnApplication Toolkit for HTK)。ATK是由英国剑桥大学开发的开源语音识别工具,是对HTK的C++多线程封装,跟HTK一样,它支持Linux和Windows,它包括HTK(HTKLib)、AHTK、AGram、ANGram、ADict、AHMMs、AResource、ARMan、ARec、ACode、ASour ce、ATee、AComponent、ABuffer、APacket、Asyn、FLite(SYNLib)、ALog模块部件。