杨鸿武
[发布单位:物理与电子工程学院 来源:物理与电子工程学院 发布时间:2013-03-01]
基本情况
姓 名:杨鸿武
性 别:男
出 生 日 期 :1969.10.2
党 派:中共党员
职 称:教授
职 务
研 究 方 向 :语言声学和语音信号处理
籍 贯:甘肃合作
工 作 单 位:西北师范大学物理与电子工程学院
地 址:甘肃省兰州市安宁东路967号
电 话:18193125028
电 邮:yanghw@nwnu.edu.cn
教育背景及主要工作经历
教师简介:
西北师范大学物理与电子工程学院教授、博士生导师,清华大学计算机系博士。甘肃省杰出青年基金获得者。“甘肃省智能信息技术与应用工程研究中心”主任、“互联网教育数据学习分析国家地方联合工程实验室”副主任。省级重点学科“电子科学与技术”学科带头人、校级特色学科“电子科学与教育技术学科”负责人。中国计算机学会语音对话与听觉专业组委员、中国声学学会语言、音乐和听觉分会委员,IEEE、ACM、IEICE、中国计算机学会会员。先后前往日本名古屋工业大学、澳大利亚皇家墨尔本理工大学、香港中文大学访学。
主要从事语言声学和语音信号处理、跨语言智能信息处理等方面的研究工作。主持国家自然科学基金面上项目1项、地区项目2项,甘肃省杰出青年基金项目1项,甘肃省高等学校创新团队项目1项,其他省部级项目3项。获甘肃省高等学校优秀科研成果奖1项、教育部科学技术进步奖1项。发表SCI、EI检索论文20 余篇,申请和获得国家发明专利6 件、实用新型专利和计算机软件著作权20余件,出版著作2部。
教育背景:
2003.9~2007.7:清华大学计算机系,博士研究生
1992.9~1995.6:西北师范大学物理系,硕士研究生
1988.9~1992.6:西北师范大学物理系,本科
研究工作经历:
2016.9~今:西北师范大学博士研究生导师
2014.9~2015.8:中组部“西部之光”访问学者
2013.01~今:甘肃省重点学科“电子科学与技术”一级学科带头人
2011.11~2012.11:日本名古屋工业大学计算机系外国研究学者
2011.08~2011.10:澳大利亚皇家墨尔本理工大学校双语教学骨干教师培训
2009.08~今:西北师范大学物理与电子工程学院教授
2009.04、11~12:香港中文大学系统工程与工程管理学系访问学者
2006.02~2006.07:香港中文大学系统工程与工程管理学系研究助理
2005.01~今:西北师范大学物理与电子工程学院硕士研究生导师
2003.12~2009.07:西北师范大学物理与电子工程学院副教授
1998.08~2003.11:西北师范大学物理与电子工程学院讲师
1995.07~1998.07:西北师范大学物理系助教
行政和社会兼职工作
“甘肃省智能信息技术与应用工程研究中心”主任
“互联网教育数据学习分析国家地方联合工程实验室”副主任
中国计算机学会语音对话与听觉专业组委员
IEEE 会员、ACM 会员、IEICE 会员、中国计算机学会会员
个人荣誉
西北师范大学2016年优秀党务工作者;
2012年入选第二届甘肃省杰出青年基金计划;
“挑战者杯”甘肃省大学生课外学术科技作品竞赛优秀指导教师。
教学工作
本科教学:
承担本科生的《c程序设计》、《数据结构》、《计算机网络》、《嵌入式操作系统》、《学科前沿》等课程的教学工作,指导本科生的学年论文和毕业论文。
研究生教学:
承担研究生的《人工智能》、《语音信号处理》、《程序设计》、《模式识别》等课程的教学工作。
科研项目
“智能双语教学协同创新团队”,甘肃省高等学校协同创新团队项目(2017C-03),2017.9-2020.12
“基于深度学习的汉藏双语语音合成的研究”,国家自然科学基金地区项目(11664036),2017-2020,主持;
“汉藏双语个性化语音合成中的语言建模的研究”,国家自然科学基金项目(61263036),2013-2016,主持;
“汉语文语转换中语义与表现力联合建模”,国家自然科学基金面上项目(60875015),2009-2011,主持;
“藏汉双语跨语言语音合成的研究”,甘肃省杰出青年基金计划项目(1210RJDA007),2013-2015,主持;
“沿丝绸之路兰银官话方言声学建模的研究”,甘肃省自然科学基金项目(1107RJZA112),2011-2013,主持;
“基于语义的汉语表现力语音韵律建模的研究”, 教育部科学研究重点项目(208146),2008-2010,主持;
“兰州方言的感知分析与声学建模的研究”,甘肃省教育厅研究生导师项目(0801-04),2008-2010,主持;
“高表现力语音韵律建模的研究”,西北师范大学科研骨干培育项目(NWNU-KJCXGC-03-42),2007-2009,主持;
“汉藏双语跨语言语音转换中的关键技术研究”,国家自然科学基金项目(61262055),2013-2016,第一完成人;
“情感计算理论与方法研究”,国家自然科学基金重点项目(60433030),2005-2009,主要完成人;
“汉语双语可视语音合成中音视频联合建模的研究”,国家自然科学基金NSFC-RGC(中国香港)联合基金项目(60418012),主要完成人。
获奖情况
1. “汉藏双语语音合成”,甘肃省高等学校科研优秀成果奖,三等奖,甘肃省教育厅,2016KYCG-206;2016.10
2. “多模态的多语种语音、语言交互的研究与应用”,教育部科学技术进步奖,二等奖,教育部,2009-280;2010.1
3. “构建电子信息工程专业开放式创新实践平台,培养工科学生创新能力和实践能力”,甘肃省教学成果奖,教育厅级,甘肃省教育厅,20090369;2010.5
科研成果
发表论文目录:
Wang L, Yang H. Tibetan Word Segmentation Method Based on BiLSTM_CRF Model[C]// International Conference on Asian Language Processing, IEEE, 2018.
Song N, Yang H, Zhang T. A DNN-based framework for converting sign language to Mandarin-Tibetan cross-lingual emotional speech[C]// International Conference on Asian Language Processing, IEEE, 2018.
Chen L, Yang H, Wang H. Research on Dungan speech synthesis based on Deep Neural Network [C]// International Symposium on Chinese Spoken Language Processing (ISCSLP), IEEE, 2018.
Zhang W, Yang H, Zhi P. Emotional speech synthesis based on DNN and PAD emotional state model [C]// International Symposium on Chinese Spoken Language Processing (ISCSLP), IEEE, 2018.
Song N, Yang H, Zhi P. A deep learning based framework for converting sign language to emotional speech[C]// Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, IEEE, 2018.
Guo W, Yang H, Gan Z. A DNN-based Mandarin-Tibetan cross-lingual speech synthesis[C] Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, IEEE, 2018.
Yang H, Zhang W, Zhi P. A DNN-based emotional speech synthesis by speaker adaptation[C]// Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, IEEE, 2018.
Song N, Yang H, Zhi P. Towards realizing sign language to emotional speech conversion by deep learning[C]// International Conference of Pioneering Computer Scientists, Engineers and Educators, Springer, Singapore, 2018:416-430.
Song N, Yang H, Wu P. A Gesture-to-Emotional Speech Conversion by Combining Gesture Recognition and Facial Expression Recognition[C]// The first Asian Conference on Affective Computing and Intelligent Interaction, IEEE, 2018.
宋南, 吴沛文, 杨鸿武. 融合人脸表情的手语到汉藏双语情感语音转换[J]. 声学技术, 2018,37(4):372-379.
智鹏鹏, 杨鸿武, 宋南. 利用说话人自适应实现基于DNN的情感语音合成[J]. 重庆邮电大学学报(自然版), 2018.
Wu P, Yang H, Gan Z. Using Mandarin Training Corpus to Realize a Mandarin-Tibetan Cross-Lingual Emotional Speech Synthesis[C]//National Conference on Man-Machine Speech Communication. Springer, Singapore, 2017: 109-121.
Liu Y, Yang H, Yan C, et al. Optimal Power Splitting in a Full-Duplex Wireless Powered Network with a Bidirectional Relay[C]//International Conference on Communicatins and Networking in China. Springer, Cham, 2017: 485-494.
Wu P, Yang H, Gan Z. Towards Realizing Mandarin-Tibetan Bi-lingual Emotional Speech Synthesis with Mandarin Emotional Training Corpus[C]//International Conference of Pioneering Computer Scientists, Engineers and Educators. Springer, Singapore, 2017: 126-137.
甘振业, 陈浩, 杨鸿武. 结合EEMD与K-SVD字典训练的语音增强算法[J]. 清华大学学报(自然科学版), 2017(3):286-292.
杨鸿武, 张帅, 丁朋程. 基于FPGA的Mel倒谱系数提取方法设计与实现[J]. 仪表技术与传感器, 2017(3):82-85.
An X, Yang H, Gan Z. Towards Realizing Sign Language-to-Speech Conversion by Combining Deep Learning and Statistical Parametric Speech Synthesis[C]//International Conference of Young Computer Scientists, Engineers and Educators. Springer, Singapore, 2016: 678-690.
Zhao N, Yang H. Realizing speech to gesture conversion by keyword spotting[C]//Chinese Spoken Language Processing (ISCSLP), 2016 10th International Symposium on. IEEE, 2016: 1-5.
郝东亮, 杨鸿武, 张策,等. 面向汉语统计参数语音合成的标注生成方法[J]. 计算机工程与应用, 2016, 52(19):146-153.
赵娜, 杨鸿武. 基于关键词识别的语音到手势的转换[J]. 计算机工程与应用, 2016, 52(21):146-151.
Hongwu Yang(*), Keiichiro Oura, Haiyan Wang, Zhenye Gan, Keiichi Tokuda. Using speaker adaptive training to realize Mandarin-Tibetan cross-lingual speech synthesis [J]. Multimedia Tools and Applications, 2015, 74(22): 9927-9942.
Hao Chen, Zhenye Gan, Hongwu Yang(*). Realizing speech enhancement by combining EEMD and K-SVD dictionary training algorithm [C]. Proc. 9th Int. Symposium on Chinese Spoken Language Processing (ISCSLP), 2014.9.12-2014.9.14.
Hongwu Yang(*), Xiaochun An, Dong Pei, Yitong Liu. Towards realizing gesture-to-speech conversion with a HMM-based bilingual speech synthesis system [C]. Proc. 2nd IEEE International Conference on Orange Technologies (ICOT), 2014:97-100.
Hongwu Yang(*), Dongliang Hao, Hongyin Sun, Yitong Liu. Speech enhancement using orthogonal matching pursuit algorithm [C]. Proc. 2nd IEEE International Conference on Orange Technologies (ICOT), 2014:97-100.
Xiaoyong Lu, Hongwu Yang(*), Aibao Zhou. Applying PAD Three Dimensional Emotion Model to Convert Prosody of Emotional Speech [C]. Proc. 2nd IEEE International Conference on Orange Technologies (ICOT), 2014:89-92.
Zhenye Gan(*), Zhenwen Wang, Hongwu Yang. Realizing Tibetan Lhasa speech concatenation synthesis system Based on a large corpus [C]. Proc. 2nd IEEE International Conference on Orange Technologies (ICOT), 2014: 93-96.
Zhanfu An, Dong Pei(*), Hongwu Yang, Quanzhou Wang. A new strategy for improving the self-positioning precision of an autonomous mobile robot [C]. Proc. 2nd IEEE International Conference on Orange Technologies (ICOT), 2014: 85-88.
Guoxing Zhang(*), Yunsong Hua, Yanwen Shen, Hongwu Yang. The Sensitivity of the Focused Ultrasonic Method Used in Inclusion Testing of the Thick Steel Specimen [J]. Applied Mechanics and Materials, 2014, 455: 253-260. (EI: 20140117159365)
Hongwu Yang(*), Keiichiro Oura, Zhenye Gan, Keiichi Tokuda. Realizing Tibetan speech synthesis by speaker adaptive training [C]. Signal and Information Processing Association Annual Summit and Conference (APSIPA), 2013 Asia-Pacific. IEEE, 2013: 1-4.
GUO Wei-Tong, YANG Hong-Wu*, PEI Dong, LIANG Qing-Qing. Prosody Conversion of Chinese Northwest Mandarin Dialect based on Five Degree Tone Model [J]. JDCTA:International Journal of Digital Content Technology and its Application, 2012, 6(17):323-332.
Manman Li, Hongwu Yang*, Weitong Guo, Dong Pei, Hongying Sun. Endpoint Detection of Noisy Speech using Empirical Mode Decomposition[J]. JDCTA:International Journal of Digital Content Technology and its Application, 2012, 6(10): 196-203.
Manman Li, Hongwu Yang*, Shuo Yang. Endpoint Detection Based on EMD in Noisy Environment [C]. Proceedings of 6th International Conference on Computer Science and Convergence Information Techology (ICCIT2011), 2011, 783-787, Jeju Island.
Jinlong Li, Hongwu Yang*, Weizhao Zhang, Lianhong Cai. A lyrics to singing voice synthesis system with variable timbre [C]. Proc. 2011 ICAIC, pp 186-193, 2011.
Zhiyong Wu, Helen Meng, Hongwu Yang, Lianhong Cai. Modeling the expressivity of input text semantics for Chinese text-to-speech synthesis in a spoken dialog system [J]. IEEE Transactions on Audio, Speech and Language Processing, 2009, 17(8): 1567-1577.
LIU Yali, YANG Hongwu*, ZHOU Hui. SPEAKER IDENTIFATION BASED ON EMD [C]. Proc. IEEE IC-NIDC2009, Beijing, China,808-812, 2009.
YANG Hongwu*, LIU Yali, HUANG Dezhi. Speaker Recognition Based on Weighted Mel-cepstrum [C]. Proc. ICCIT2009, Seoul, Korea, 200-203,2009.
YANG HONG-WU*, MENG HELEN M., CAI LIAN-HONG. Modeling the Acoustic Correlates of Dialog ACT for Expressive Chinese TTS System[C]. Proc. CIICT2008, Sep. 26-28, Beijing, IET PRESS, 2008: 49-53.
YANG HONG-WU*, GUO WEI-TONG, LIANG QING-QING. A Speaking Rate Adjustable Digital Speech Repeater for Listening Comprehension in Second Language Learning [C]. Proc. CSSE 2008, Wuhan, Dec.12-14,Vol. 5: 893-896,IEEE Press, 2008.
XIE Lei, YANG Hong-wu. Dynamic Bayesian Network Inversion for Robust Speech Recognition [J]. IEICE Transactions on Information and Systems, 2007, E90-D(7): 1117-1120.
YANG Hong-wu*, HUANG De-zhi, CAI Lian-hong. Weighted Mel-Cepstral Analysis of Speech Based on Psychoacoustic Model [J]. IEICE Transactions on Information and Systems, 2006,E89-D(12): 2998-3001.
YANG Hong-wu*, MENG Helen M., CAI Lian-hong. Modeling the Acoustic Correlates of Expressive Elements in Text Genres for Expressive Text-to-Speech Synthesis [C]. Proc. InterSpeech2006, Pittsburg, USA, Sep. 17-21, ISCA Press, 2006: 1806-1809.
YANG Hong-wu*, MENG Helen M., WU Zhi-yong, CAI Lian-hong. Modeling the Global Acoustic Correlates of Expressivity for Chinese Text-to-Speech Synthesis [C]. Proc. IEEE / ACL 2006 Workshop on Spoken Language Technology, Aruba, Dec. 13-16, IEEE Press, 2006: 138-141.
Hong-Wu YANG*, Wei-Tong GUO, Dong PEI , Qing-Qing LIANG. Mandarin To Lanzhou Dialect Conversion based on Five Degree Tone Model [C]. Proc.7rd ISCSLP, Taiwan, 2010, 387-391.
安晓春, 杨鸿武, 甘振业. 手语到普通话/藏语语音转换系统的实现[C]// 全国人机语音通讯学术会议. 2015.
王海燕, 杨鸿武(*), 甘振业, 裴东. 基于说话人自适应训练的汉藏双语语音合成 [J]. 清华大学学报, 2013, 53(6): 776-780.
郭威彤,杨鸿武(*),宋继华,顾香,甘振业。面向方言语音合成的文本分析的研究 [J]. 计算机工程, 2015, 41(9): 184-189.
赵涛涛, 杨鸿武(*). 结合EMD和加权Mel倒谱的语音共振峰提取算法 [J]. 计算机工程与应用, 2015, 51(9): 207-212.
徐世鹏. 杨鸿武(*), 王海燕. 面向藏语语音合成的语音基元自动标注方法 [J]. 计算机工程与应用, 2015, 51(06): 199-203.
赵爱芳,裴东,王全州,杨鸿武,安占福,复杂环境中多信息融合的手势识别 [J].计算机工程与应用,2014,50(05):180-184.
赵高超,杨鸿武,裴东,王全州. 基于TMS320F2812的电机增量式PID控制系统 [J].仪表技术与传感器,2014,(06):10 6-108+112.
杨鸿武(*),赵涛涛. 一种基于加权Mel倒谱的语音信号共振峰提取算法 [J]. 西北师范大学学报(自然科学版),2014,50(01):53-57.
鲁小勇, 杨鸿武*,等. 基于PAD三维情绪模型的情感语音韵律转换 [J]. 计算机工程与应用, 2013, 49(5): 230-235.
孙红英, 杨鸿武*, 陶中幸. 语谱分析的FPGA实现 [J]. 电子与信息学报, 2011, 33(5): 1238-1243.
梁青青, 杨鸿武*, 郭威彤, 裴东. 一种基于语音识别和语速修改的语音复读系统 [J]. 计算机工程, 2011, 37(5): 288-290.
刘博, 杨鸿武*, 甘振业, 郭威彤. 利用SAMPA实现藏语的字音转换[J]. 计算机工程与应用, 46(36): 117-121, 2011.
郭威彤, 杨鸿武*, 梁青青, 裴东. 普通话到西安话的韵律转换 [J]. 计算机工程与应用, 46(16): 122-127, 2011.
周小星, 王安娜, 孙红英, 杨鸿武. 基于压缩感知过程的语音增强[J]. 清华大学学报, 2011, 51(9): 1252-1256.
李锦珑, 杨鸿武*, 梁青青, 裴东, 刘慧娟. 基于GMM的歌曲Morphing算法 [J]. 计算机工程, 36(24): 172-174+177, 2010.
梁青青,杨鸿武*+,郭威彤,裴东,甘振业. 利用五度字调模型实现普通话到兰州方言的转换 [J]. 声学技术, 2010, 29(6): 620-625.
李锦珑, 杨鸿武*+, 裴东, 刘慧娟. 歌词到歌曲转换系统的实现 [J]. 计算机工程与应用, 2010, Vol.46(16): 124-126.
杨鸿武*, 王晓丽, 陈龙, 裴东, 郭威彤, 蔡莲红. 基于语法树高度的汉语韵律短语预测 [J]. 计算机工程与应用, 45(36): 139-143+167, 2010.
主编教材及专著:
杨鸿武,裴东.数字信号处理权威指南 [M].人民邮电出版社,2012.1.
蔡莲红, 杨鸿武, 吴志勇. 语音合成 [M]. 机械工业出版社, 2005.3.
申请和获得的专利:
杨鸿武,吴沛文. 一种跨语言情感语音合成方法及系统[P]. 甘肃:CN201710415814.5, 2017-08-29. (发明专利,公开)
杨鸿武;王辉. 一种基于ARM芯片的语谱分析装置[P]. 甘肃:CN201710338751.8, 2017-07-28. (发明专利,公开)
杨鸿武, 赵娜, 冯欢,等. 一种基于hmm的歌曲合成方法及装置[P]., 甘肃:CN106971703A, 2017. (发明专利,公开)
杨鸿武,王海燕,徐世鹏,等. 汉藏双语语音合成方法及装置[P]. 甘肃:CN104217713A, 2014-12-17. (发明专利,公开)
杨鸿武,安晓春. 手势到汉藏双语语音转换方法及装置[P]. 甘肃:CN104538025A, 2015-04-22. (发明专利,公开)
杨鸿武,张策,陆晓燕,等. 藏语TTVS系统的实现方法 [P]. 甘肃:201510649149.7. (发明专利,公开)
郭威彤,杨鸿武,甘振业,等. 便携式室内空气质量快速检测仪[P]. 中国: CN201310587485.4, 2014-2-19.(发明专利,授权)
杨鸿武, 宋南. 一种智能感控灯:, CN 206894967U[P]. 2018.(实用新型专利,授权)
杨鸿武, 宋南, 甘振业等. 一种智能花盆支架:, CN207152370U[P]. 2018.(实用新型专利,授权)
杨鸿武, 王辉. 一种基于ARM芯片的语谱分析装置:, CN206961516U[P]. 2018.(实用新型专利,授权)
杨鸿武, 安艳玲, 甘振业等. 一种多功能智能晴雨伞:, CN207055017U[P]. 2018.(实用新型专利,授权)
杨鸿武, 宋南. 一种可无线调控的多功能数字时钟:, CN206301161U[P]. 2017.(实用新型专利,授权)
杨鸿武;吴沛文;朱小娜等. 一种盲人智能语音辅助眼镜:, CN206102931U[P]. 2017.(实用新型专利,授权)
杨鸿武;智鹏鹏;甘振业等. 一种语音智能行李箱:, CN 206079382U[P]. 2017.(实用新型专利,授权)
杨鸿武,张帅,甘振业. 一种基于FPGA的藏语语音合成装置:, CN206505717U[P]. 2017.(实用新型专利,授权)
杨鸿武;张帅;孔新杰等. 一种基于FPGA的MLSA合成滤波器:, CN205789092U[P]. 2016.(实用新型专利,授权)
杨鸿武,吴沛文,朱小娜等. 一种可远程控制的智能生态鸟笼:, CN205667226U[P]. 2016.(实用新型专利,授权)
杨鸿武*,张策,陆晓燕,等. 一种基于改进式TAC的高精度时间间隔测量仪 [P]. 甘肃: 201520742600.5. (实用新型专利,授权)
杨鸿武*,白祖仕,甘振业. 一种基于FPGA的语音手势转换装置 [P]. 201520743955.6. (实用新型专利,授权)
杨鸿武*,白祖仕,甘振业,等. 一种基于FPGA的方言保存装置 [P]. 201520741997.6, 2016. (实用新型专利,授权)
杨鸿武,王海燕,刘平和,等. 儿童教学监护机器人[P]. 甘肃:CN203300127U, 2013-11-20. (实用新型专利,授权)
甘振业,陈浩,杨鸿武. 一种仰视读书支架 [P]. 甘肃:CN204410025U, 2015-06-24. (实用新型专利,授权)
杨鸿武,安艳玲. 智能语音识别翻译软件. 计算机软件著作权. 2017SR206581, 2017.
杨鸿武,齐芳堃,智鹏鹏等. 汉语韵律预测系统. 计算机软件著作权. 2017SR086809, 2017.
杨鸿武,吴佳欣. 基于BLSTM的藏语孤立词的语音识别软件. 计算机软件著作权. 2017SR365609, 2017.
杨鸿武,安晓春,杨艳珍. 语音半自动标注系统. 计算机软件著作权. 2016SR028869, 2016.
杨鸿武,智鹏鹏,甘振业等. 方言标注系统. 计算机软件著作权. 2016SR323150, 2016.
杨鸿武,吴佳欣. 基于BLSTM的藏语拉萨方言的语音识别软件. 计算机软件著作权. 2016SR223291, 2016.
杨鸿武,赵娜. 基于关键词识别的语音到手势的转换系统. 计算机软件著作权. 2016SR229119, 2016.
杨鸿武,赵娜,冯欢. 基于HMM的歌词到歌声转换系统. 计算机软件著作权. 2016SR259346, 2016.
杨鸿武,安晓春. 语音编辑器软件. 计算机软件著作权. 2015SR290592, 2016.
杨鸿武, 张策. 基于声韵母的藏语连续语音识别系统. 计算机软件著作权,2015SR044288, 2015.
杨鸿武, 安晓春, 甘振业. 手势到汉藏双语语音转换系统. 计算机软件著作权,2014SR196824, 2014.
杨鸿武, 郝东亮. 面向统计参数的语音合成的标注生成系统.计算机软件著作权,2014SR154700, 2014.
杨鸿武,王海燕,甘振业. 汉藏双语语音合成系统. 计算机软件著作权, 2014SR110084, 2014.
::::::::版权所有 2010-2012 西北师范大学物理与电子工程学院::::::::
地址:兰州市安宁区安宁东路967号 邮编:730070 电话:0931-7971503 Email: wdxybgs@nwnu.edu.cn
甘公网安备62010502001275号 陇ICP备17000462号-1