Qomhra: A Bilingual Irish-English Large Language Model

发布时间：2026/7/5 15:17:08

Qomhra: A Bilingual Irish-English Large Language Model

一、文章主要内容总结本文介绍了双语（爱尔兰语-英语）大语言模型Qomhrá的开发过程、核心实验及成果，聚焦低资源语言（爱尔兰语）的LLM构建难题，提出了涵盖双语持续预训练（CPT）、指令微调、人类偏好对齐的完整流程：背景与动机：爱尔兰语作为官方语言，在语言技术领域滞后于其他欧洲语言，缺乏高质量标注数据和成熟LLM。现有研究（如gaBERT、UCCIX）未覆盖指令微调与偏好对齐环节，无法直接用于聊天机器人开发。核心方法：预训练：基于Qwen-3-8B模型，混合爱尔兰语（含UCCIX开源数据、国家语料库等）和英语（维基百科数据）语料进行双语CPT，避免灾难性遗忘；指令微调：通过评估6个闭源LLM的爱尔兰语生成能力，选定Gemini-2.5-Pro翻译Dolly V2数据集，构建3万条双语平行指令数据集，采用LoRA进行微调；人类偏好对齐：利用Gemini-2.5-Pro翻译LIMA数据集，生成1千条含"可接受/不可接受"响应的偏好数据集，验证其与爱尔兰语母语者判断的一致性。实验结果：预训练后，Qomhrá在爱尔兰语任务上较基线提升最高29%，英语任务提升44%，未出现显著灾难性遗忘；指令微调后，模型在翻译、世界知识等开放式任务上性能显著改善，响应长度更合理；Gemini-2.5-Pro生成的偏好数据与母语者判断一致性达98.9%（Cohen’s κ=0.

This is Going to Sound Crazy, But What If We Used Large Language Models to Boost Automatic Databa...

This is Going to Sound Crazy, But What If We Used Large Language Models to Boost Automatic Databa...

2026/7/5 15:17:08 ID: 215886

mybatis缓存

mybatis缓存

2026/7/5 15:17:05 ID: 215885

OneNote到Markdown无损迁移终极指南：解放你的数字笔记

OneNote到Markdown无损迁移终极指南：解放你的数字笔记

2026/7/5 15:16:56 ID: 215884

RPCS3汉化补丁终极指南：3步免费解锁中文游戏体验

RPCS3汉化补丁终极指南：3步免费解锁中文游戏体验

2026/7/5 16:05:21 ID: 216645

深度解析内存加载机制：PE文件与shellcode生成的技术实现

深度解析内存加载机制：PE文件与shellcode生成的技术实现

2026/7/5 16:05:18 ID: 216644

深度解析Flexpilot IDE：开源AI编程助手的实战应用指南

深度解析Flexpilot IDE：开源AI编程助手的实战应用指南

2026/7/5 16:05:15 ID: 216643

深度解析darktable：开源摄影工作流应用的架构设计与模块化图像处理系统

深度解析darktable：开源摄影工作流应用的架构设计与模块化图像处理系统

2026/7/5 16:05:12 ID: 216642

STGCN时空图卷积网络：突破交通预测瓶颈的纯卷积架构革命

STGCN时空图卷积网络：突破交通预测瓶颈的纯卷积架构革命

2026/7/5 16:05:05 ID: 216641

3大架构升级：构建智能化开发平台的完整路线图

3大架构升级：构建智能化开发平台的完整路线图

2026/7/5 16:05:02 ID: 216640

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

2026/7/5 0:00:00 ID: 201947

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

2026/7/5 0:00:46 ID: 201948

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

2026/7/5 0:00:53 ID: 201949

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

2026/7/5 0:00:00 ID: 201947

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

2026/7/5 0:00:46 ID: 201948

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

2026/7/5 0:00:53 ID: 201949

FAE放射组学分析工具：医学影像特征探索的完整解决方案

FAE放射组学分析工具：医学影像特征探索的完整解决方案

2026/7/4 17:50:58 ID: 132550

基于Dify与DeepSeek构建私有知识库问答系统实战指南

基于Dify与DeepSeek构建私有知识库问答系统实战指南

2026/7/5 14:41:18 ID: 132551

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

2026/7/4 3:31:24 ID: 132552