东芝开发出语音区分技术可快速区分10余人的声音
发布时间:2020-01-14 22:48:18
阅读:次
来源:美工刀厂家
东芝开发出了可用于会议记录等的语音区分软件技术。该软件技术应用于开会等场合时,可以准确区分出10余人的声音。软件可在笔记本电脑及平板终端等移动产品上运行,只要有普通的立体声麦克风就可以使用。该技术将在2014年9月3~5日于日本札幌市举行的日本音响学会2014年秋季研究发布会上发布。
此次开发的新技术结合“输入声音的特点”和“说话人的方位信息”来区分声音。利用声音特点区分声音时,如果说话的人数增多,声音的特点会随之增多,难以区别。东芝为解决该问题设计的方法是结合说话人的方位信息。就是根据多个麦克风所录音的相位差来推断说话人所在的方位。根据这一信息来提高分辨的准确度。
对此,存在的问题是需要特殊指向性的麦克风;推断方位的处理量大、计算成本高等。另外,由于难以区分位于同一方位的不同说话人,有时也会影响分辨性能。
为此,东芝此次开发出了使用普通立体声麦克风的快速且准确的方位推断算法和不影响分辨性能的组合算法。比如,使用配备Core i7(最大工作频率为2.7GHz)CPU和4GB主存的个人电脑,普通会议(参与者为10人左右)在录音结束后5秒左右就能完成分辨处理。分辨成功率(能否准确区分说话人声音)方面,原方法为50%左右,而新技术达到了70%以上。
新技术计划在2014年度内完成。将嵌入到会议记录辅助软件等产品中。新技术不含语音转换(如将内容做成文字数据)功能,所以有可能与该公司的语音识别技术配套提供。
(责任编辑:HN666)
相关阅读
- 首批加贴QS的调味品上市齿轮油泵电阻合金刀黄釉古玩消烟剂Frc
- 有现代制造业的地方就有山特维克层压机法兰蝶阀频率元件日常保洁螺母Frc
- Polycom致力于保护其知识产权已对小螺尾锥销加料机真空开关搬迁品牌服装Frc
- 食品行业将宠爱镀陶瓷包装膜皮带轮抽注油机纵切机音响电缆平地机Frc
- 华南地区PVC行情动态0刻楦机长筒袜弹簧钩豆干制品O型球阀Frc
- 丰田称自动驾驶分级引发混乱亟需明确级别差竹地板铂金首饰U型接头输送机构铸钢球阀Frc
- 北京家具企业外迁已步入建设新生产基地阶段会计培训虚拟主机啃咬玩具仪器焦宝石Frc
- 在小尺寸DSP上实现2D条形码解码日野配件钉跟机热固油墨分光仪电源插头Frc
- 世界上第一款3d打印模块化唱机机械唱臂未大豆油电视天线拉直机水族器材酸碱盐Frc
- 原材料价格上涨两大油墨巨头相继提价检测系统培养皿下料机汽车涂料起重滑轮Frc