语音识别常见问题集
发布时间:2019-04-20 | 点击次数:0 次
1.基础问题
1.1 使用方式
问:语音识别模块怎么使用?
答:只要接上电源,说对应的命令则可以使用。
问:语音识别模块可以自己制作烧录词条吗?
答:识别模块目前不能自行制作更换,需要我们对音频进行采集制作、修音调试等,再进行词条训练,最终才会达到一个比较好的识别效果。
1.2识别距离与识别率
问:语音识别的识别距离和识别率是多少?
答:在相对安静和没有回声的环境下:
1. WTK6900A芯片最好的识别距离是1米以内,识别率为90%以上;
2. WTK6900B芯片最好的识别距离是2米以内,识别率为90%以上;
3. WTK6900C芯片最好的识别距离是3米以内,识别率为90%以上;
4. 识别距离越远,识别率会慢慢下降。
问:什么是识别率,误识别,错识别
答:识别率是指在相同的环境,相同的距离情况下,识别IC可以识别的次数占总次数之比;
误识别是指在没有说出预先设定的词条,由于噪声,识别IC识别成功
错识别是指输入语音指令1(即词条1)却识别成语音指令2
例如:有2条指令:请打开灯,请关闭灯
在安静的环境下,距离识别模块的声音输入端(咪头)1米内的距离,一共输入100次语音指令(请打开灯 50次,请关闭灯 50次),如果请打开灯有46次能识别,请关闭灯有45次能识别,则总识别率为(46+45)/100*100%=91%
问:声音比较嘈杂,不能识别怎回事?
答:语音识别的过程是声音波形的对比,我们输入的环境太过于嘈杂,会对声音输入产生干扰,就像在嘈杂的环境中,我们听不清对方讲话一样。
暂时没有很好的解决办法,若是你可以承受较高成本,我们可以增加一些降噪电路或者麦克风阵列电路。
问:定制词条收费是怎样的?
答:定制词条会收取一定的诚意金,根据词条内容决定是否定制,每条词条大概500元左右,批量累计到一定数量,诚意金可充当贷款
问:在汽车驾驶室 使用情况如何,在有背景音乐场合可以吗?有人在说话 我能控制吗?在油烟机抽风是可以用吗?
答:你所说的场合都是具有噪声的环境,当输入指令的时候,这些噪声会随着指令一起传输到咪头中,影响了识别,特别像抽油烟机机这种噪声非常大的环境下,识别率会下降的比较厉害,因为此时的噪声或许已经比人的声音大了,所以这些有噪声的环境特别需要按照实际使用的情况测试,验证是否能符合你的要求。
问:为什么女声和童声会难识别,男声的比较容易识别
答:语音识别有一个语音库,识别的时候会和这个语音库进行对比,当前版本的语音库是没有童声的,所以会难识别;至于女声,音频频率较高,而人声主要频率是低频,所以也会难识别点;如果要想这两部分人群相对较好识别需要添加这两部分人群的录音。
问:当我和别人在旁边聊天的时候,会误触发
答;只要通电,语音识别是一直处于工作状态中的,会一直识别声音,如果产生了相似的波形,就会误识别的,因此语音识别是需要在相对安静的环境下使用的,误触发不能完全避免,只能降低。
问:为什么我说家乡话,也会识别成功
答:语音识别的识别过程是对比声音的波形的,不能区分你当前所说的是什么语种,当你说话的声音波形与语音库里面的声音波形相似,就会识别成功了
1.3识别的语种
问:可以做多国语言吗
答:可以识别32种,中文,英语,日语等等,但你要录制这个国家的命令词条,每个命令词条至少要录制20个人,男、女、老少都有最好。请用手机录音,并在唯创微信小程序上面录音即可。
问:自己家人有方言,可以做识别控制吗?
答:可以,但是识别率没有普通话的好,不建议使用方言控制。
问:可以同时识别三种语言吗?例如,中文,英文,日语
答:不行!
1.2如何与MCU通讯
问:语音识别模块有预留接口与我们的单片机通讯吗?
答:识别IC会预留标准UART串口,相关指令可以参考说明书
问:我的单片机为5V供电,可以和识别模块通过串口相连吗?
答:WTK6900芯片只支持3V,单片机5V供电需要加入电平转换电路;
WTK6900B与WTK6900CS可以支持。
问:请问我们可以自己修改波特率吗?只能支持9600吗?
答:波特率是程序里面设置的,出厂后用户不能更改的;WTK6900芯片目前只能支持9600,WTK6900B和WTK6900C在出厂前可以设置其他波特率
1.4电气参数
问:供电多少?
答:典型电压值:3.3V,,此时识别效果是最好的
问:工作电流多大,能否休眠,休眠的话电流多大
答:WTK6900A工作电流为7ma(不带负载),WTK6900B工作电流为12ma(不带负载),WTK6900C工作电流为24ma(不带负载),芯片休眠后无法识别,所以芯片一直都在工作状态,不会进入休眠;深度休眠功耗一般≤10ua
1.5器件选择
问:咪头的参数选择
答:咪头的选择需要结合产品的需求,如果产品是需要接收全方面的声音,如台灯,从各个角度输入语音指令都能识别,则可以选择全指向咪头,目前我司使用的咪头型号是 9767P 电容式咪头,灵敏度为55-57;如需要抗噪能力强一点,并且识别声音是单向的,那么可以选择单指向咪头
问:单指向咪头与全指向咪头有什么区别?
答:全指向咪头:是指360度都可以收得到声音,收音范围广,同时也易吸收到周围环境带来的杂音;
单指向咪头:只有一个角度范围内才可以收得到声音,收音范围有限,不易吸收外界带来的杂音,声音相对全指向咪头会清晰很多
问:喇叭的参数选择
答:一般使用8Ω/0.5W的喇叭
问:你们使用的稳压芯片参数是多少?我可以使用自己的稳压芯片吗?
答:我司使用的是型号是UP0108,输出的电流为300MA;因为这款芯片我们相对熟悉,建议还是使用这款芯片比较好,因为如果电源不稳会影响到识别的。
1.6词条
问:最多可以装得下多少词条
答:1.WTK6900A可以放48字以内;
2. WTK6900B可以放30字以内;
3. WTK6900C可以放80字以内;
问:词条为开灯,关灯这些可以吗?
答:词条太短,容易误触发,建议添加一个唤醒词,每次先唤醒后再识别开灯,关灯
2.特定行业问题
2.1灯具类
问:识别模块控制灯需要输出什么信号?
答:识别模块识别成功后通过IO口输出PWM信号,用来控制LED灯的开关以及调节亮度
问:识别芯片PWM输出频率是多少?
答:1.WTK6900A 芯片PWM输出的频率是250Hz,亮度分别是95%-65%-35%-5%
2.WTK6900B芯片PWM输出频率为3KHz,亮度为100%-84%-68%
-52%-36%-20%
问:我们的灯是24V 15W,能直接把模块接在板子上面吗?
答:不同调光模块支持的电压以及功率不同,我们最大可提供24V 100W的调光板
问:调光板型号是什么?
答:调光板名称:WTK6900调光板,可以配合WTK6900CS-B01的模块控制RGB灯条,支持红外控制。
问:你们的板可以控制220V的灯吗?
答:目前不支持,识别IC只是输出高低电平控制MOS管的导通闭合而已,如果要接220V的灯,需要外加继电器,识别IC通过控制MOS来控制继电器,从而来控制灯的开与关;
3.现有模块功能
3.1标准模块WTK6900B02 V2.03
问:WTK6900B02 V2.03模块有P1和P2两块板子,哪一块板子上面有语音识别功能的呢
答:WTK6900B02 V2.03-P2
问:WTK6900B02 V2.03-P2模块可以单独使用吗?
答:可以,不过测试的时候需要焊接电源线和咪头
问:WTK6900B02 V2.03-P1模块是用来做什么的,我可以不要吗?
答:WTK6900B02 V2.03-P1模块是模拟U盘的功能,用来更换词条的,多个P2模块配一个P1模块即可,如果不需要更换词条则可以不需要使用P1
问:WTK6900B02 V2.03-P2模块和WTK6900B01有什么区别呢?
答:WTK6900B02 V2.03为WTK6900B01的升级版,将词条放在Flash中,增加了可更换词条的功能
问:WTK6900B02 V2.03-P2模块和WTK6900B01词条是一样的吗?
答:是一样的,默认出厂词条都是珠光亮红版的词条
问:WTK6900B02 V2.03-P2模块要如何更换词条呢?
答:我们有更换词条的演示视频,可以发您参考一下
3.2灯板模块WTK6900M01 V2.02
问:最多可以控制多少路灯呢?
答:如果是使用IO,最多可以控制5路;如果您有MCU,识别IC识别成功后可以通过串口给您MCU数据,然后MCU再去执行相应的动作
问:触摸IC是怎么与识别IC通讯的呢
答:通过IO连接,触摸IC的输出信号接在识别IC的IO上
问:触摸按键按下是高电平还是低电平呢?
答:按下是高电平
问:我们可以自己修改触摸按键的灵敏度吗?
答:可以的,触摸按键电路中有一个电容C11是调节触摸灵敏度的,容值的范围是0-75PF,容值越大,灵敏度越低
目前板子上面的是10PF
问:我可以直接将灯并在你们的M01的板子上面吗?
答:M01板子的M0S管旁边预留了端子,上面的丝印标着LED+,LED-,可以直接并联灯;但是我们的灯是5V 5W以内的,所以并联的灯也是要符合这个要求
问:我们可以将咪头引线出来吗?有什么影响呢?
答:可以引线,不过引线建议不超过30CM,我们测试如果超过30CM影响会比较大;如果有屏蔽线,使用屏蔽线影响会小点