11月14日,大模型与语言资源学术研讨会暨粤语语料库建设与大模型评测重点实验室启动会在广州大学(黄埔校区)举行。此次大会由广州大学与广州市社会科学界联合会联合主办,汇聚了省市相关部门领导、学术委员会专家学者以及产业企业代表等约百余位嘉宾,旨在推动语言资源的数字化与大模型应用的多语言服务化,标志着广东省在粤语语料库建设方面迈出了重要一步。大会由广州市社科联副主席郭德焱主持。
交流会现场
中国工程院院士、广州大学网络空间安全学院名誉院长方滨兴,广州市政协党组成员、副主席陈雄桥,香港科技大学(广州)党委书记、广州大学二级教授屈哨兵,广东省社科联二级巡视员何方俊,广州市委网信办副主任贺忠,广州市人大常委会教科文卫工委主任弓鸿午,广州市政协文史委主任李汉强,广州大学党委常委、副校长张其学,广州市社科联党组书记、主席崔颂东,广州市社科院副院长杨再高,广州广播电视台总编辑滕建新,广州日报社副社长陈韶航出席活动,阿里云智能集团安琳,大湾区产业发展研究院钟课枝,天翼数字生活科技有限公司赵子颖,科大讯飞华南人工智能研究院周国华,紫为云科技有限公司顾友良,腾讯计算机系统有限公司张丹丹等来自省内外30余家单位的企业界代表,以及广州大学师生代表参加活动。
“人文科学+科技创新”传承保护粤语 探索中国特色、岭南风格的城市文化传承、保护与发展之路
粤语是岭南文化最重要的基因和最具特色的要素,为全面贯彻落实党的二十届三中全会精神,弘扬广州历史文化,传承广州千年文脉,广州大学与广州市社科联经过多次调研、多方论证,决定以人工智能时代粤语语言的传承发展为着力点,合作共建“粤语语料库建设与大模型评测重点实验室”,期望通过多学科交叉融合创新研究,探索具有中国特色、岭南风格的城市文化传承、保护与发展之路。
广州大学副校长张其学致辞
“粤语作为中华文化的瑰宝,承载着粤港澳大湾区深厚的历史文化底蕴。我们有责任,也有义务,利用现代科技手段,保护和传承好这一宝贵的文化遗产。”广州大学张其学副校长在致辞中指出,“粤语语料库建设与大模型评测重点实验室”(以下简称“实验室”)的成立,是广州大学服务国家战略、响应时代号召的具体行动,是广州大学在跨学科建设中迈出的重要一步。实验室不仅能推动粤语文化的数字化传承,更能在粤港澳大湾区乃至全球的文化交流与合作中发挥积极作用,还将成为广州大学跨学科发展中的重要学术平台。期待实验室在未来能够结出丰硕的成果,为中华文化的传承与发展,为粤港澳大湾区的繁荣与进步,为推动国家科技创新、提升文化自信,贡献智慧和力量。
广州市社科联党组书记、主席崔颂东致辞
“我们认真学习贯彻党的二十届三中全会精神,深入实施哲学社会科学创新工程,全面推进学科体系、学术体系和话语体系建设和创新,积极探索人文科学与科技创新相融合的路径,奋力在构建中国哲学社会科学自主知识体系上展现新担当新作为。”广州市社科联主席崔颂东指出,此次与广州大学合作共建粤语语料库建设与大模型评测重点实验室,是打造跨学科协同创新科研平台进行“新协同”、紧抓哲学社会科学创新“新机遇”、锚定学科交叉融合破题大模型“新赛道”的重要举措。他强调,要扎扎实实把实验室各项建设落到实处,为广州加快实现老城市新活力、“四个出新出彩”,在进一步全面深化改革、推进中国式现代化建设中当好排头兵,继续在高质量发展方面发挥领头羊和火车头作用贡献社科力量。
阿里云智能集团研究中心主任安琳致辞
阿里云智能集团研究中心主任安琳指出了构建粤语AI产业生态并推动其创新、繁荣、健康的重要性,介绍了如何通过开源开放的模式来推动粤语语料库的建设。同时介绍了通义千问大模型在全球开源社区中的影响力和生态建设,以及阿里云在促进中国大模型生态繁荣方面的努力。他表示将全力以赴支持重点实验室的建设工作。
“粤语语料+大模型” 创新融合 重点实验室“双首席科学家” 领航探索粤语发展新高地
“当语言遇到大模型,每个国家,每个语种,要重新审视自己的文化语言战略。”会上,重点实验室主任、广州大学齐佳音教授介绍,重点实验室将通过建立岭南文化核心语料及细分领域知识库、粤语数据资产库、粤语高质量数据集,以重点实验室为载体形成面向人工智能应用的粤语文化数据资源基础服务能力以及面向人工智能粤语服务的内容安全合规评测能力,为粤语的数据化、资源化、服务化和产业化助力。重点实验室采取1+1+N的运行机制,由广州大学和广州市社会科学界联合会联合共建,采取政产学研用一体化的模式,形成围绕粤语语料库建设与智能化服务的合作生态。重点实验室第一期建设周期为五年,长远目标是成为立足粤港澳大湾区、面向国家语言服务战略、通用粤语语料库及大模型粤语服务评测的国内乃至全球首屈一指的科研与对外服务专业学术性机构。
实验室启动
重点实验室设立“双首席科学家”。由中国工程院院士、广州大学网络空间安全学院名誉院长、中国电子信息产业集团有限公司资深首席科学家方滨兴院士,香港科技大学(广州)党委书记、广州大学二级教授、国家语委科研机构国家语言服务与粤港澳大湾区语言研究中心主任屈哨兵教授分别担任重点实验室技术首席专家与语言首席专家,承担学术指导和咨询工作,保障重点实验室学术发展方向。广州大学张其学副校长和广州市社科联崔颂东主席担任实验室指导委员会主任,协调整合各界资源,为重点实验室运行提供指导。
首席专家为学术委员会专家颁发聘书
广州大学方滨兴院士,市政协副主席陈雄桥,省社科联二级巡视员何方俊,市人大常委会教科文卫工委主任弓鸿午,市社科联主席崔颂东,广州大学副校长张其学,市委网信办副主任贺忠等共同启动重点实验室,开启了粤语语料库建设与大模型评测重点实验室的崭新篇章,这一仪式标志着该实验室正式投入使用。崔颂东和张其学为首席专家颁发聘书,首席专家为学术委员会专家颁发聘书,各方共同见证了这一凝聚智慧与希望的重要时刻。
重点实验室以广州大学为主体,依托广州大学网络空间安全学院、人文学院、新闻与传播学院,打造跨学科协同创新科研平台。重点实验室以广州为基地,推动广东、香港、澳门的学术团体以及互联网企业,共建共享粤语语料数据库。接下来,重点实验室将围绕粤语文化精神标识体系研究、通用粤语语料库建设、大模型粤语言语交互质量评测、大模型粤语言语交互质量提升研究四个方向开展科学研究。
聚焦大模型技术、语言资源研究与语料库建设 院士专家分享前沿见解
中国工程院院士、广州大学网络空间安全学院名誉院长方滨兴院士,广州大学二级教授、香港科技大学(广州)党委书记屈哨兵教授,北京语言大学语言资源高精尖创新中心主任荀恩东教授分别作了精彩的主旨报告,分享了他们在大模型技术、语言资源研究、语料库建设等方面的最新成果与见解。主旨报告环节由广州大学科学研究院副院长、社科处处长张延平主持。
方滨兴院士以《大模型保险箍:大模型护栏的一种模式》为主题作主旨报告,介绍了当前大模型安全合规风险与挑战、多文化背景下的全球企业大模型安全监管创新应用,指出多文化背景下大模型内部价值对齐的难点以及大模型安全护栏的必要性,重点分享了其团队提出的大模型安全合规的保险箍模式的实践与持续研发情况,并对我国大模型安全未来监管提出了建议。
屈哨兵教授在题为《立足数字中文,做好语言服务》的主旨报告中表示,必须高度重视我国人工智能语料库建设。屈教授首先介绍了国家语委科研机构“国家语言服务与粤港澳大湾区语言研究中心”在语言服务方面的工作。其次,通过分析当前人工智能语料库发展的瓶颈与困难,提出关于中文人工智能语料库建设的建议。他指出,要将建设新时代中国特色中文人工智能语料库作为国家战略统筹推进,尽快突破瓶颈,为人工智能时代的高质量语言服务奠定数据基础。
荀恩东教授以《语料库建设及应用》为题作主旨报告。报告从语言生活与语言数据、语料库与大模型和BCC语料库建设三个方面进行介绍。荀教授首先介绍了从语言生活到语言数据的技术处理逻辑和方法,其次重点介绍了语料库建设中的关键技术,最后以北京语言大学建设的中文语料库BCC为例,分享了建设经验。
与会专家学者及产业界精英参观广州大学中央实验室
下午,与会专家学者及产业界代表在参观了广州大学中央实验室后,围绕大会主题展开了深入的交流与研讨。
与会嘉宾合影
此次大会的成功举办,不仅为广东省乃至全国的语言资源研究与大模型技术发展注入了强劲活力,也为相关领域的专家学者、产业界人士提供了一个促进思想碰撞与技术交融的交流合作平台。与会人员表示,由衷期待粤语语料库建设与大模型评测重点实验室能够充分发挥其独特优势与深厚潜力,精研深耕,以一系列具有开创性、突破性与广泛影响力的卓越成果,为我国语言资源的保护与利用贡献力量,在时代的浪潮中留下浓墨重彩的奋进之笔。(中国教育在线 林剑 通讯员/广大宣)
① 凡本站注明“稿件来源:中国教育在线”的所有文字、图片和音视频稿件,版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本站协议授权的媒体、网站,在下载使用时必须注明“稿件来源:中国教育在线”,违者本站将依法追究责任。
② 本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。