1. 波斯诗歌情感计算的技术框架数字人文领域的情感计算研究通常采用多层级分析框架。在波斯诗歌的分析案例中研究者构建了一个包含9个核心情感维度的本体论体系1.1 情感维度定义忧郁(Melancholia)表现为悲伤、哀叹和存在性焦虑的情感基调浪漫痴迷(Romantic Obsession)对爱情对象的强迫性思念和理想化情感依赖(Emotional Dependency)人际关系中的依附性和需求感自我毁灭理想化(Self-Destructive Idealization)将牺牲与痛苦美化的倾向矛盾依恋(Ambivalent Attachment)爱恨交织的情感状态精神自恋(Spiritual Narcissism)精神优越感和自我神圣化身份碎片化(Identity Fragmentation)自我认知的不连贯性内在投射(Internal Projection)将情感体验内化的倾向理想化(Idealization)对人或概念的完美化想象1.2 技术实现路径分析流程包含三个关键阶段文本预处理波斯语文本的Unicode标准化古典波斯语的特殊字符处理诗节分割与元数据标注特征提取# 示例基于Transformer的特征提取 from transformers import AutoTokenizer, AutoModel tokenizer AutoTokenizer.from_pretrained(HooshvareLab/bert-fa-base-uncased) model AutoModel.from_pretrained(HooshvareLab/bert-fa-base-uncased) inputs tokenizer(verse_text, return_tensorspt) outputs model(**inputs) verse_embedding outputs.last_hidden_state.mean(dim1)情感标注使用多标签分类模型每个维度输出0-1的置信度分数设置0.7的置信度阈值(低于此值则标注为弃权)2. 诗人情感特征比较分析2.1 数据概况研究涵盖了10位波斯诗人共计61,573节诗主要数据特征如下诗人诗节数弃权率主要情感维度Khayyam35638.5%忧郁、身份碎片化Parvin5,57338.4%自我毁灭理想化Jahan12,2996.5%情感依赖Hafez5,22118.2%浪漫痴迷2.2 关键发现情感配置差异通过Jensen-Shannon散度(DJS)量化结果显示Khayyam表现出最强的独特性(DJS0.0901)忧郁维度显著高于基线(Δ0.232)身份碎片化维度突出(Δ0.101)示例诗句若我的到来出于自愿我本不会来若成为我可能为何我成了我Hafez最接近情感基线(DJS0.0035)平衡的多重情感表达典型的浪漫痴迷诗句你面容的记忆在我心中是我晨昏的止痛药技术说明DJS计算基于以下公式DJS(P||Q) 1/2 [DKL(P||M) DKL(Q||M)]其中M1/2(PQ)DKL为Kullback-Leibler散度3. 方法论创新与验证3.1 不确定性管理研究采用三重不确定性机制弃权机制低置信度预测自动排除置信度加权预测分数作为概率权重温度缩放校准预测置信度# 温度缩放实现示例 def temperature_scale(logits, temperature): return logits / temperature scaled_probs torch.softmax(temperature_scale(logits, T0.56), dim-1)3.2 人工验证结果在500节诗的验证集上平均标注者间一致性(κ)0.818模型与人工标注的宏观F10.794弃权决策的适当性达到85.6%4. 文学研究启示4.1 传统解读的量化验证Khaghani的修辞性自我定位精神自恋维度突出(Δ0.086)典型诗句他们称我为第二托勒密认作当代智者Parvin的道德对话风格自我毁灭理想化显著(Δ0.073)让它飞吧它燃烧着灰烬在微笑4.2 分析限制本体论边界某些复杂情感可能无法被现有维度完全捕获如苏菲诗歌中的神秘合一体验历史语境缺失量化分析难以捕捉特定历史时期的文学惯例需要与传统文学史研究结合5. 实践应用建议5.1 技术选型对于类似研究项目推荐文本处理波斯语专用分词工具Hazm古典文本预处理库Persian-preprocessing模型架构# 多标签分类模型架构示例 from transformers import BertPreTrainedModel class PersianPoetryClassifier(BertPreTrainedModel): def __init__(self, config): super().__init__(config) self.bert BertModel(config) self.dropout nn.Dropout(0.1) self.classifier nn.Linear(config.hidden_size, 9) # 9个情感维度 def forward(self, **inputs): outputs self.bert(**inputs) pooled outputs[1] pooled self.dropout(pooled) return torch.sigmoid(self.classifier(pooled))5.2 分析流程优化迭代标注首轮分析后识别本体论缺口针对性增加新维度跨诗派比较建立不同文学流派的情感基准如将苏菲诗人与宫廷诗人对比可视化设计# 情感维度可视化示例 import matplotlib.pyplot as plt def plot_poet_profile(poet_name, deltas): colors [red if x 0 else green for x in deltas] plt.barh(emotion_names, deltas, colorcolors) plt.title(f{poet_name}情感特征偏移) plt.show()6. 扩展研究方向历时性分析追踪特定情感维度的历史演变如中世纪到现代的情感表达变化跨文化比较建立波斯与阿拉伯、中国诗歌的情感对应需要解决跨语言情感标注对齐生成式应用基于情感特征的诗句生成条件化语言模型控制输出情感在实际操作中我们发现有几点特别值得注意波斯语诗歌的隐喻密度会显著影响模型性能需要增加专门的隐喻处理层不同历史时期的正字法差异可能导致嵌入空间不一致建议分时期训练情感维度的文化特异性问题西方开发的情感词典可能不适用于波斯古典文学这种量化方法不应取代传统细读但当作为补充工具时它能帮助研究者发现传统方法难以察觉的大规模模式。特别是在处理全集规模的分析时计算工具可以有效地扩展文学研究者的认知边界。