欢迎访问广西师范大学文学院/新闻与传播学院!
今天是

“中文之光·研究生论坛”第193期(下):粤语语音多模态数据库建设及相关研究

发布者:廖慧芝发布时间:2021-01-06浏览次数:597

 2020年12月26日,“中文之光研究生论坛”第193期在我校雁山校区文二区102教室举行。本次讲座邀请到了暨南大学的教授、博士生导师侯兴泉教授为我院师生做题为“粤语语音多模态数据库建设及相关研究”的报告。讲座由陈小燕老师主持,我院汉语言文字学和语言学与应用语言学专业研究生参加了本次论坛。

 侯教授首先向大家诠释了开展言语多模态研究的必要性:如果要想全面了解和解释言语产生和使用的机制,采集和分析跟言语产生和运用密切相关的语音、文字、手势、表情、生理数据和交际场景等不同模态数据是尤为重要的。

 接着侯教授就向大家介绍了国内外多模态数据库建设的最新成果。就国外而言,有面向人工智能的多模态数据库SmartKom、CHIL、NESPOLE,有面向医学诊断和语言康复的多模态数据库OSA、Erlangen-CLP。国内在语言学方面,侯教授向同学们普及了粤语音档库、粤语口语语料库、粤语语音数据库。其中“粤语音档库”有侯精一主编《现代汉语方言音库·广州话音档》(1995)、邵慧君主持的九十多个粤方言点的单字音语料库(2008)、《广州话单音节语图册》(2014)等。粤语口语语料库有陆镜光主持的香港粤语语料库,李行德、吴香莲和梁长城主持的香港粤语儿童语言资料库和罗心宝、冯淑仪和梁文德主持的香港成人口语语料库等。粤语语音数据库则有粤语语音数据库(CUCorpora)、粤语语音电话数据库(CUCall)和带粤语口音的汉语言语数据库(CACSC)等。该类数据目前已采录的数据大致包括粤语歌谣、粤语病理嗓音、粤语诗词吟诵等数据。

 在提问环节,同学们踊跃发问,侯教授亦耐心而详尽地给予解答。本次讲座侯教授为我院师生提供了崭新而丰富的研究工具,拓展了我院研究生们的研究视角。最后,同学们既对侯教授的年轻有为和博闻广识表示敬佩,又对干货满满的讲座表示意犹未尽。

 (文/胡智轩  审/韦敏)

 侯教授作报告

 讲座现场

Copyright © 广西师范大学文学院/新闻与传播学院版权所有 地址:桂林市育才路15号 邮编:541004 电话:0773-5846272
书记信箱:sj_gxnuwxy@163.com 院长信箱:yz_gxnuwxy@163.com 院纪委信箱:wxyjjjch@163.com
版权所有:广西师范大学文学院/新闻与传播学院 (桂ICP备05000954号-1,桂公网安备45030502000260号)