2.8 语音识别技术
语音识别技术(Automatic Speech Recognition,ASR)是机器通过识别和理解过程把语音信号转变为相应的文本文件或命令的高技术。声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。声纹识别技术又称为说话人识别技术(Speaker Recognition),是一项通过语音信号提取代表说话人身份的相关特征,进而识别出说话人身份的技术。说话人辨认领域的应用有刑侦破案、犯罪跟踪、国防监听、个性化应用等;在说话人确认领域的应用有证券交易、银行交易、公安取证、个人电脑声控锁、汽车声控锁、身份证、信用卡的认证等。目前比较流行的语音助手有苹果有Siri,亚马逊有Alexa,谷歌有Assistant,微软有Cortana,百度有百度语音助手,未来语音助手将无处不在,语音技术对于人工智能的发展显得非常重要。Siri技术来源于美国国防部高级研究规划局公布的CALO计划:一个让军方简化工作,并具学习、组织以及认知能力的数字助理,其所衍生出来的民用版软件Siri虚拟个人助理,实现了语音识别功能。
根据工业和信息化部电子科技信息情报研究所数据显示,2017年,全球智能语音产业规模将达112.4亿美元,国际知名市场研究公司Research and Markets 2016年5月4日发布报告《全球及中国语音产业报告,2015–2020》认为到2020年,全球语音市场规模预计将达到191.7亿美元。据预测,2017年中国智能语音产业将达到101.4亿元。
也许你以后可以通过刷脸和语音识别,双重验证密码。家里的门不用钥匙,只需要说一声“芝麻开门”,门可以自动打开。早上一醒来,只需要说一声“艾利克斯,窗帘拉开”,窗帘自动拉开,是不是很爽的事情呢?