成果一:智能声纹识别系统
声纹识别又称说话人识别,通过对语音信号的分析和处理,提取代表说话人个性信息的特征,自动地鉴别说话人的身份。厦门大学声纹识别已有近二十年的研究基础,团队已先后主持五项国家自然基金,成果发表于TASLP、ICASSP、Interspeech等语音顶刊顶会。2020年发布国内首个声纹识别开源工具ASV-Subtools,助力国内外学术研究和工业落地。声纹识别包括文本无关、文本相关、文本提示三种类型,厦门大学在相应技术均有算法创新,包括神经网络自动纠正噪声标签、CTC多任务学习、ASR编码器迁移学习等,并在开源工具ASV-Subtools进行工程化实现。
产业化进展情况:
厦大团队采用先进的声纹技术,自主研发了包括短语音文本无关声纹识别、文本相关声纹识别及数字动态口令声纹识别技术,为合作伙伴提供了不同方式的说话人确认和辨认服务,尤其在远程身份认证中得到广泛的应用。2009年起,声纹识别系应用到全国各地的司法/社保/电力系统。2018年起,声纹识别技术在华为手机、骨传导耳机等系列智能终端产品落地应用。与华为合作成果获“2021年度优秀技术合作成果奖”。2023年,研发的说话人日志技术,应用于声云语音转写等平台。
应用前景:
声纹识别是人工智能的核心技术,其中“人”声纹主要应用场景为金融科技、数字政务、智慧生活等,据市场调研公司预估,2026年市场规模约50亿。“物”声纹可面向工业场景的异常声音检测,包括电网、水利、工厂等领域,该市场规模预计达千亿。团队将依托现有的自研声纹识别开源工具ASV-Subtools,兼容适配国产芯片、国产操作系统等支持国产化,并针对工业安全场景,支持“物”声纹,以共建声纹开源平台的形式和成套的产品服务大幅降低用户和厂商的成本。
合作方式:技术转让,合作开发,技术许可
成果二:闽南语识别与合成
闽南语是我国重要方言之一,它保留了晋、唐时期中原官话的特点,有“古汉语活化石”的美誉。目前,全世界大约有7000万人在说闽南话,主要分布在福建的厦、漳、泉地区,台湾,东南亚,广东潮汕,雷州半岛,海南岛部分地区以及浙江温州部分乡镇等。
研发闽南话智能语音系统对海峡两岸、东南亚以及“一带一路”的民间交流与语言传播都有很大帮助。厦门大学智能语音团队研发的闽南语智能语音系统,包括一系列的闽南方言人工智能技术,目前处于国内领先地位,其中闽南语合成是全国首创,而闽南语识别国内仅有科大讯飞和厦门大学等少数几家推出。
产业化进展情况:
厦门大学联合合作伙伴,已开放云端接口,并推出“闽南话识别”和“AI语音合成”小程序,相关技术应用于《说咱闽南话》APP、厦门公交站、云译翻译机、厦门消防报警、女足世界杯直播等场景。闽南语系统自推出以后,引起了社会各界的较大反响,《厦门晚报》、《厦门日报》、《福建新闻》栏目、中央人民广播电台、厦门电视台、福建电视台等媒体专门对此做了深度报道。
应用前景:
农村很多老年人不懂普通话,只会用闽南话交流;城市里小孩学闽南语越来越少,面临失传的风险;保护各地闽南口音,有利于文化传承。因此亟需通过人工智能技术,保护和传承闽南话!从国家战略来讲,闽南语作为海峡两岸交流的重要中介媒体,对促进两岸交流具有重要意义,对东南亚以及“一带一路”的民间交流与语言传播也都有很大帮助。
团队的目标是进一步构建完整的智能语音交互系统,使之成为闽南人日常生活的语音助手;研发闽南语学习软件,传承闽南文化;面向闽南地区和东南亚,服务7000万人口。
合作方式:技术转让,合作开发,技术许可
负责人简介
洪青阳,厦门大学信息学院教授,主要研究方向为语音识别、声纹识别,先后主持国家自然科学基金三项,科技部创新基金两项。带领XMUSPEECH团队连续两届获东方语种识别(OLR)竞赛第一名,成功研发闽南语识别与合成系统。核心技术应用到华为智能手机、说咱闽南话APP、声云语音转写和全国十几个省市的司法/社保/证券/电力系统。出版专著《语音识别:原理与应用》。获电子工业出版社“优秀作者奖”和华为“优秀技术合作成果奖”。
联系方式
联系人:洪青阳
邮 箱:qyhong@xmu.edu.cn
投 稿
校内成果投稿方式:
登入“科技系统-成果管理-科研团队和应用成果”板块进行填报
校外技术需求征集:
填写附件-企业技术需求提交登记表反馈至厦大科技处产学研办
电话:0592-2185633
邮箱:xyue@xmu.edu.cn