1. 古典波斯诗歌情感计算分析框架概述在数字人文与计算文学研究领域情感计算技术正逐渐成为解析古典文本情感维度的有力工具。我们构建的这个分析框架专门针对古典波斯诗歌的情感特征进行量化研究覆盖了从哈菲兹到萨迪等10位代表性诗人的61,573行诗句。不同于传统的情感分析方法该框架创新性地融合了多标签分类、置信度加权和Laplacian谱分解等技术能够捕捉波斯诗歌中复杂微妙的情感结构。波斯诗歌以其丰富的情感表达和精妙的隐喻系统闻名于世。从鲁米的苏菲神秘主义到哈菲兹的抒情诗这些作品不仅承载着诗人的个人情感也反映了特定历史时期的文化情感模式。我们的分析框架将这些文学特征转化为可计算的情感维度包括忧郁、浪漫痴迷、自我毁灭理想化等9个核心情感类别。技术亮点框架采用不确定性感知的设计理念22.2%的诗句因情感信号不明确而被系统主动弃权这种严谨的处理方式特别适合文学文本分析避免了过度解读的风险。2. 方法论与技术实现细节2.1 数据准备与标注流程我们使用的诗歌文本来自Ganjoor开放数据库这是波斯语世界最重要的古典诗歌数字档案之一。为确保分析质量我们建立了严格的标注规范标注者资质所有标注人员均为波斯文学专业研究者熟悉古典诗歌的修辞传统和文化背景标注指南定义了9个情感类别及其操作化定义见表1质量控制要求标注者提供置信度评分0-1和波斯语标注理由多标签处理允许单行诗句标注多个情感标签表1情感类别定义与示例情感类别定义特征典型诗句示例忧郁持久悲伤、对痛苦的美化我的脸被肝血洗过浪漫痴迷认知固着、崇拜式奉献无论我看向何处都是你的影像自我毁灭理想化将自我牺牲视为有意义的爱即使你匕首相向我也亲吻你的脚2.2 技术架构与算法选择框架的核心是由四个关键技术组件构成的处理流水线置信度加权多标签分类器基于BERT架构进行迁移学习输出每个情感标签的概率分布设置0.7的置信度阈值低于此值则弃权诗人个性量化指标使用Jensen-Shannon散度计算诗人情感分布与整体基准的差异公式DJS(Pi||P0) 1/2 [DKL(Pi||M) DKL(P0||M)]其中M1/2(PiP0)情感共现图构建节点9个情感类别边权重情感共现频率的PMI值应用图Laplacian归一化处理Eigenmood嵌入空间对图Laplacian矩阵进行谱分解选取前三个特征向量构成三维情感空间每个诗人的情感特征表示为该空间中的坐标点3. 分析结果与诗人情感特征3.1 整体情感分布特征在61,573行诗句的分析中我们观察到几个显著模式情感集中性少数情感类别占据主导地位特别是忧郁和浪漫痴迷诗人异质性不同诗人的情感特征差异显著DJS值范围0.003-0.046文化持续性某些情感模式跨越数个世纪保持稳定表2代表性诗人的情感特征比较诗人诗句数量主要情感特征个性度(DJS)哈菲兹5,221忧郁、浪漫痴迷0.0035萨迪6,864浪漫痴迷、忧郁0.0106帕尔文5,573忧郁、自我毁灭理想化0.04593.2 典型诗人深度解析以14世纪诗人哈菲兹为例其情感特征表现为忧郁主导29.4%的诗句被标注为忧郁显著高于基准矛盾表达常将快乐意象如葡萄酒与忧郁情感并置光谱分析在Eigenmood空间中呈现独特的坐标分布哈菲兹的典型诗句分析 我去酒馆哭泣寻求补偿/或许能从悲伤手中解脱情感标签忧郁(0.9)、浪漫痴迷(0.7)修辞分析将世俗场所酒馆与精神解脱并置4. 技术挑战与解决方案4.1 文学文本的特殊性处理古典诗歌的情感分析面临诸多挑战我们采用以下解决方案隐喻处理建立波斯诗歌特定隐喻映射表如夜莺→痴情结合上下文调整情感权重文化特定情感自我毁灭理想化在西方文本中罕见但在波斯爱情诗中常见定制标注指南捕捉这类文化特定情感时代语言差异使用历史波斯语词典处理古语词标注者接受历史语言学培训4.2 算法优化与调参在实际应用中我们发现了几个关键优化点置信度校准采用温度缩放法(Temperature Scaling)校准模型输出概率避免某些情感类别被系统性高估或低估样本不平衡处理对罕见情感类别如精神自恋采用焦点损失(Focal Loss)调整类别权重防止模型忽视少数类图结构优化测试不同相似度度量余弦、Jaccard等最终选择PMI作为边权重计算方式5. 应用前景与扩展方向这一分析框架在多个方面具有扩展潜力跨文化比较将相同方法应用于阿拉伯、中国古典诗歌比较不同文化传统的情感表达模式历时性研究按世纪划分诗歌样本分析情感模式的历史演变轨迹教育应用开发诗歌情感可视化教学工具帮助学生理解诗歌情感层次实践建议对于想尝试类似研究的学者建议从小规模样本开始如单一位诗人的作品先验证标注方案的一致性再扩展至更大规模的分析。在实际操作中我们总结了以下几点经验标注一致性检查至关重要建议定期计算标注者间信度(Krippendorffs α)文学文本需要更高的弃权率阈值我们使用0.7而非常见的0.5情感类别定义应保持适度抽象过于具体的定义会导致标注困难这个框架的价值不仅在于技术实现更在于它提供了一种将计算方法与人文阐释相结合的范例。通过量化分析我们既能发现宏观的情感模式又能通过远读-近读的循环回到具体诗句进行细读验证。这种多层次的分析方法为数字人文研究提供了新的可能性。