生成式AI驱动的考古学智能教学系统构建研究——以《考古通论》课程知识图谱开发为例
摘要
关键词
AI驱动;知识图谱;智慧考古
正文
1引言
在全球高等教育数字化与考古事业快速发展的背景下,传统教学模式难以有效整合海量考古成果与多学科知识,制约了高层次复合型人才培养。作为省级研究生精品在线课程《考古通论》建设的阶段性成果,本研究聚焦生成式AI与知识图谱技术,旨在构建面向考古学专业的智能教学系统。
当前考古专业教育面临三大挑战:知识体系非线性与教学线性之间的矛盾、高阶能力培养滞后于学科发展,以及教学资源更新缓慢。[]生成式AI和知识图谱技术为破解这些困境提供了新路径。本研究重点解决三大核心问题:如何构建融合时间、空间与文化层的多维知识表征模型;如何通过领域微调提升生成式AI在考古专业任务中的准确性与推理能力;如何建立系统与学习者双向适应的智能教学机制。
研究成果具有多重意义:理论层面,提出“时间—空间—实体—关系”四维知识模型,突破传统二维图谱局限;实践层面,开发集成省级课程与国家级数据资源的智能教学平台,有效提升研究生专业认知与实务能力;政策层面,响应新文科建设号召,为文科数字化转型提供可复制的河南案例与实践范式。
2文献综述
2.1考古学教育信息化研究
考古学专业教育信息化正经历从数字化向智能化的转型。在虚拟仿真领域,河南省一流本科课程“黄泛区考古与文物保护虚拟仿真实验平台”,精确复现了黄泛区考古工地文化层的叠压关系。[]
混合式教学模式在遗址教学中成效显著。河南大学《考古学导论》教学团队以州桥遗址为案例,构建“线上微课+虚拟探方+线下研讨”三维教学模式。
现存问题集中体现在智能化与知识关联层面。研究生“证据链构建能力”普遍不足,未能有效整合多学科领域的依据交叉验证。
2.2知识图谱教育应用
知识图谱技术为考古知识体系化提供新路径。在学科建模方面,湖南博物院构建的文物知识图谱在湖南音乐文物与故事展中的应用创新,全景式展现中国音乐史。[]
学习路径推荐研究取得突破性进展。山东大学开发的“AI考古”动态学习引擎,依据学生知识掌握度与研究方向生成个性化路径,使非线性学习占比达81%。[]
考古领域知识图谱建设面临独特挑战。以二里头遗址研究为例,需同步整合宫城布局(空间)、文化分期(时间)、礼器组合(器物)三维数据,而现有系统多采用二维平面建模,这种局限性导致学生对多证据链的协同论证能力不足。
2.3生成式AI教育创新
生成式AI为考古教育注入新动能。二里头夏都遗址博物馆“夏都探源”是我省首个聚焦考古研究的人工智能问答系统。[]该系统依托DeepSeek技术,结合检索增强生成能力,可以实现从提问到知识生成的全流程优化。
个性化内容生成取得实质性进展。浙江大学基于跨模态生成模型、迁移泛化等新技术,在包括智能数据处理、遗址文物分析、古文字解读等方面取得了进展。[]
领域适配性仍是主要障碍。现存问题集中体现在两方面:其一,专业语料库建设滞后,生成观点与学术共识存在较明显的偏差;其二,多模态融合不足,现有系统尚未实现跨模态关联分析。
3系统构建
3.1考古知识图谱构建
为支撑课程教学与科研训练,本研究构建了面向考古学领域的“四维时空知识模型”(TSER),其本体框架涵盖时间、空间、实体和关系四个维度。时间上,采用学界公认的分期断代标准,覆盖旧石器时代至宋元明清六大时期,并对典型文化进行细致分期。空间维度整合了第三次全国文物普查GIS数据,涵盖3285处重点遗址,未来将结合第四次全国文物普查数据进行更新。实体维度构建了系统化的遗存分类体系,如陶器类型学参照《中国考古学·夏商卷》进行分类。[]关系维度则定义了文化谱系关联规则,如仰韶文化彩陶的传播路径。
该框架已整合包括碳十四测年数据、甲骨文记录和殷墟地层数据在内的多源信息,形成实体节点3.7万个、关系边21万条的多维互证网络。
在多模态资源整合方面,对课程资源进行了系统化处理:利用OpenCV技术对108集微课视频提取关键帧并标注时空标签,空间标注误差控制在±0.1°以内;同时接入开封城摞城BIM模型,涵盖唐至清六个文化层,并与《宋会要辑稿》《汴京遗迹志》等文献实现语义关联,层厚测量误差不超过±5cm。
3.2大语言模型领域适配
为提升学术文本处理与生成能力,开展了大语言模型的领域适配工作。首先建设专业语料库,整合“中华文明探源工程”发布的考古报告数据,涵盖238处重要遗址的发掘记录,并系统收集1980–2023年间《考古学报》《考古》等核心期刊论文2万篇,采用PDFMiner进行文本解析与结构化处理。
采用LoRA方法对LLaMA2-13B模型进行微调,使其具备时空推理与类型学分析能力。模型能够响应如“二里头文化三期青铜器特征”等复杂查询,准确关联相应年代与技术特征;在陶器线图分类任务中,对器形的分类准确率达到82.3%。
3.3智能导学引擎设计
智能导学引擎依托知识图谱与大语言模型能力,实现动态学习路径的个性化推荐。通过深度知识追踪(DKT)模型诊断学生知识状态,结合LDA主题模型分析科研兴趣,构建“商代礼制研究”兴趣向量。采用NSGA-II多目标优化算法生成学习路径,在实际应用中显著提升学习效率。
实践模块引入AR技术,开发了邙山陵墓群虚拟发掘系统。通过高精度三维扫描构建东汉帝陵模型,空间分辨率达2mm,并依据《田野考古工作规程》制定操作评估标准,如探方布设误差超过5cm即扣15分,推动学生规范开展田野实践。
4教学应用
4.1应用模式设计
2024年3月至6月,系统在河南大学2023级硕士生中开展应用,依托TSER模型为不同研究方向的学生生成个性化学习路径。例如,青铜器研究方向学生的典型学习路径经优化后涵盖“二里头铜爵铸造工艺→郑州商城范铸技术→殷墟青铜礼器组合”等重要节点。实践表明,超过83%的学生学习路径呈现高度个性化特征。
在学术能力训练方面,微调后的LLaMA2-13B模型有效辅助学生完成陶器类型分析等任务。针对器物线图,模型不仅能输出标准分类与分期信息,还可提供跨遗址对比分析。经专家双盲评审,实验组学术报告规范度显著高于对照组。
虚拟研讨系统通过多智能体模拟学术辩论场景,学生借助HoloLens设备参与角色扮演,系统实时生成论证逻辑图。实验期间累计形成238份有效辩论记录,学生关键证据引用率显著提高。
4.2实施与评价
我们在河南大学文博专业硕士生中开展对照实验。实验组使用本系统进行学习与实践,对照组采用传统MOOC方式。实验组在“商代墓葬制度”单元学习耗时减少37.3%,AR实践操作规范得分显著优于对照组,学术研讨中论点覆盖专业核心期刊结论的比例达89.7%。
评价体系涵盖知识、能力与情感三个维度。实验组在动态图谱构建指数、标准化测试正确率、课题论证多样性和学术写作质量上均显著优于对照组。情感体验测量显示,学生在自主性与沉浸度方面提升显著,质性访谈中多数学生认为AR技术有效增强了考古研究的具身认知。
5实证分析
5.1学习成效提升显著
核心概念掌握效率提高。基于TSER四维知识模型,实验组学生在夏商周核心概念学习方面表现突出,习得效率较传统教学组提升38%。重要知识点的平均掌握时间由对照组的12.3小时缩短至7.6小时。这一结果与山西博物院在2017–2022年开展的文物知识图谱教学实验结论一致。[]
学术写作规范性明显改善。依托领域适应性优化的LLaMA2-13B模型,实验组学生在学术报告写作中表现出更高的规范性,平均得分为4.3,较对照组提升22.9%。该模型在专业术语标准化和文献引用格式方面的修正成功率达72%。
5.2学习行为模式发生积极转变
非线性学习路径成为主流。实验组中81%的学生展现出非连续性的学习路径,远高于传统组的23%,其知识结构呈多中心拓扑特征。主攻青铜器研究的学生可平均跨越3.2个文化期进行学习,而传统组仅覆盖1.4个。这一发现与唐蕃古道文物知识图谱中的跨文化关联研究方法形成呼应。[]
技术实践能力与论证能力协同提升。通过AR技术支持的邙山陵墓群虚拟发掘系统,学生实际操作时长与多证据论证能力呈显著正相关。这一结果与河南大学《考古通论》课程2024年度报告中所强调的“三维空间认知重构显著提升空间推理能力”的结论高度一致。
5.3认知能力与学术素养显著增强
时空认知体系有效建立。87%的学生认为“时空图谱帮助建立了文明演进的整体观念”。此类认知提升机制与湖南博物院音乐文物知识图谱项目中91%的时空关联准确率具有内在一致性。
学术思辨能力进一步深化。在多智能体辩论系统的辅助下,75%的学生能够更深入地理解学术争议。这一成效与山西博物院2022年虚拟研讨系统中论点覆盖率提升29%的发现相互印证。
6结论
本研究构建的TSER四维时空知识模型,涵盖3.7万实体和21万关系边,主要创新体现于三方面:强化时空关联,支持跨期概念学习;引入多目标优化算法,提升学生跨文化期学习效率;实现多模态融合,与山西博物院已有工作形成有效互补。
智能技术推动考古教学由经验主导向数据驱动转变。依托深度知识追踪模型,核心概念掌握效率提升38%;借助AR虚拟发掘系统,学生操作规范度提升40.6%,误差控制在5cm以内。
多智能体辩论系统有效促进了人机协同阐释机制的建立:学生文献引证类型显著增加,对核心期刊内容的覆盖率达89.7%,论证逻辑性明显增强,学术理解深度评分提高29%。
综上所述,本研究以《考古通论》课程数字化转型为核心,通过知识图谱与领域大模型的融合应用,有效解决了传统考古教学中时空限制和操作风险的问题,为考古复合型人才培养提供了可复制、可推广的路径,顺应了“十四五”文物科技创新规划对交叉学科人才的需求,为数字人文教育提供了扎实的实践案例。
...