在很多武侠小说中,经常会看到一些武林高手虽然站在远处,却能通过读唇语知晓别人说了什么。时至今日,这项“特异功能”不再只是武侠小说中拥有的情节,下面就来认识一下这项神奇的唇语识别技术吧。
唇语识别技术是一项集机器视觉与自然语言处理于一体的技术,唇语识别技术通过机器视觉技术,从图像中连续识别出人脸,并提取此人连续的口型变化特征,随即将连续变化的特征输入到唇语识别模型中,识别出讲话人口型对应的发音,从而计算出可能性最大的表达语句。此外,唇语识别技术的精确度研发基于1万小时新闻式的唇语节目,目前英文准确度已经达到80%,中文准确度已经达到71%。
唇语识别技术在噪音太大或只有摄像头等无法准确捕捉声音的场合中具有很强的实用性。在马路、会议室、商场等噪音较大的场景里,唇语识别技术可以规避噪声对用户说话内容获取的影响,确保语音输入的准确率;此外,目前在电梯、马路等监控场景中只有摄像头,并没有麦克风,通过唇语识别技术可以获取指定用户的讲话信息,为公共安全提供有效支持。
唇语识别技术又可以应用于哪些领域呢?场景教育、身份识别、公共安全、移动支付、军事情报等领域中都可以应用唇语识别技术。比如,通过唇语识别技术支持下的口型支付密码,消费者动动嘴唇就能进行支付;而在军事情报领域中,唇语识别技术则让远距离获取情报成为可能;若在公安系统中加入唇语识别技术,公安人员则可通过平台获取视频中犯罪嫌疑人的语言信息,这将极大助力犯罪缉查工作的开展。
赵鹏