想象一下,用最地道的梅城音和阿妹机器人讨论今暗晡做腌面同煮汤的秘诀,用手机App“一键生成”一首客家山歌,漂泊在外的游子对着手机说句话,传出来的却是自家阿婆口吻的温柔叮嘱……这一切,距离我们还有多远?
其实,AI距离会说一口正宗、自然的梅县客家话,只差“临门一脚”了!由广东外语外贸大学客家文化研究所(国家社科基金项目“农村方言文化的传承困境与出路研究”首席专家,中国语言资源保护工程核心专家组成员严修鸿教授领衔)、阿里巴巴AI Data团队等相关部门联合牵头发起的“梅县客家方言系统化采集工程” 即日启动,正式向梅江区、梅县区及蕉岭县乡亲发出“乡音征集令”!
值得一提的是,这一“数字方言火种”计划已在梅州方言中率先完成,上海、南昌、漳州、开封、成都等城市方言项目也正同步推进。这意味着我们不能让客家话在这场“数字方言赛跑”中甘于人后。您的每一次发声,都是为客家话守住一席之地的关键力量。
为什么AI学客家话,
格外有难度?
AI看似无所不能,但要让它掌握客家话,特别是保留了大量古汉语音韵特征的梅县客家话,绝非易事。
本次项目的核心参与者、客家话研究学者介绍,客家方言被誉为古汉语的“活化石”。以梅县话为标准音的客家话,完整保留了古汉语发展至今经历的全浊清化、浊上字读阴平,非组白读为重唇、歌部存古读ai韵,殷韵读合口等等特征,声调多达6个,且存在复杂的连读变调现象。同一个字,在不同词语、不同语境中,音高和时长都会发生变化。例如,“梅江河”和“梅江”其中的“江”字声调就有细微差异。
“如果没有成千上万梅州乡亲亲口说出来的鲜活语料,AI生成的客家话,只会是生硬、别扭的‘客普’(客家口音的普通话),丢失了千年来沉淀在乡音里的韵味和情感。”项目负责人强调。
记住乡音
我们需要这样的您
只要您符合以下条件,就是我们在寻找的“乡音守护者”:
1.成长背景:自幼(12岁前)主要生活在梅江区、梅县区等核心区域,家庭及日常交流环境以客家话为主。
2.语言能力:能说一口地道、流利、自然的梅城音客家话,日常交流无混杂其他方言或普通话的“洋泾浜”现象。
记住乡音
您的声音,
将成为永恒的“数字乡愁”
我们发起这次采集,目标不仅是训练AI,更深层的意义在于——用现代科技,为正在变化的乡音留下一份真实、完整、鲜活的“数字档案”。
如今,在年轻一代中,能自然使用地道客家话交流的人越来越少。许多承载着客家人千年迁徙记忆、生产智慧的词汇和说法,正在悄然消失。我们不想让这份属于世界客都的独特声音,就这样
参与方式
手机录制:您只需用手机,以自然语速朗读我们提供的简短文本(包含日常对话、谚语、故事等)。
时长自由:录音时长完全由您决定,10分钟、半小时甚至更长至20小时都无上欢迎!每一条地道发音,都将被永久保存,进入“梅县客家方言高质量数据库”,成为未来语言研究、AI技术训练、文化传承的珍贵原料。
心意致谢:对于成功参与并完成有效录音的志愿者,我们将提供一份适当的报酬,聊表谢意。报酬的标准:一个小时有效的录音是70元。
采集对象
本次采集主要针对梅江区(含金山、江南、西郊等街道)及梅县区(程江、南口、丙村、雁洋等镇)及蕉岭县的客家方言。其他县市的版本我们将在后续陆续开展。
如何加入?
从即日起,您可以通过手机访问以下网站报名,并完成一个简短的“乡音小测试”:
扫码进入发音志愿者报名及测试
登录网址:https://audiocap.alibaba-inc.com/audiocap/kejia/home
如有疑问,欢迎邮件咨询:200711609@gdufs.edu.cn
我们会有专人尽快回复。
录制技巧小贴士
做好的关键——诚心,耐心,细心!先看普通话对译,理解后再看词句,慢读一遍后再录音。要求读音与汉字提醒一致,不多不少刚刚好!
比如注意:尘灰 不读 灰尘(词序);㧡 读kai 不读核。岁数,读sii 不读 su等等。
期待与展望
“参与录音的乡亲越多,我们收集的语料越丰富、越全面,客家话AI模型就能越快问世,说得也越地道。”项目组表示。
未来,这个客家话AI模型不仅能生成大段的客家话文本和语音,还可以应用于各种场景:比如为政务服务提供本地语言支持、辅助客家话教学和传承、甚至创作新的客家山歌和文艺作品。
“我们的愿景,就是通过科技与人文的结合,为海内外客家人留下一份可以‘听’得见、‘用’得上的数字乡愁。让阿姆的话,在人工智能时代,依然能被清晰地听见、被深情地传递、被永远地记住。”
记住乡音乡韵,留下乡愁乡情。保护语言资源,传承中华文明。期待您的加入,让世界听到最正的客家音!
订阅后可查看全文(剩余80%)