前言前面两个实验已经完成了自媒体作品数据的清洗和标题特征构建分别生成了summary_all_platforms、content_analysis和title_feature_analysis三张分析表。本次实验不再继续做 ETL 转换而是进入可视化分析阶段使用助睿 BI 对这些结果表进行图表配置和仪表盘搭建。本次实验的重点是把前期加工好的数据转化为可观察、可比较、可解释的可视化图表。通过指标卡、排名图、柱状图、条形图和趋势图分析自媒体作品在不同平台上的流量表现、互动效果、作者排名、标题关键词影响和时间变化规律。整个实验可以理解为一条从“分析数据集”到“综合仪表盘”的可视化流程这次实验的关键点不是把图表简单堆在页面上而是按照“总览—对比—归因—趋势”的思路组织仪表盘。先用核心指标建立整体认知再通过排名图定位优秀样本和短板样本接着用标题特征分析解释差异最后结合趋势图观察内容传播的时间变化。第一部分实验背景1.1 实验目的本次实验使用助睿 BI 完成自媒体运营数据的可视化探索主要目标是基于前期 ETL 产出的数据表搭建一个能够展示平台表现、作者排名、标题影响和流量趋势的综合分析仪表盘。通过本次实验我主要完成以下任务1. 熟悉助睿 BI 的数据源连接和数据集构建流程 2. 掌握基于数据库结果表创建分析数据集的方法 3. 使用指标卡展示作品数、平台数、浏览量、互动量等核心指标 4. 使用柱状图、条形图展示作者排名和作品排名 5. 使用标题特征分析表量化不同标题关键词的互动效果 6. 使用折线图观察平台流量随时间变化的趋势 7. 将多个图表整合到同一个仪表盘中形成完整的数据分析视图 8. 根据图表结果总结自媒体运营分析结论。本次实验的核心思路是先把数据加工结果转化为可视化图表再通过图表观察差异、解释原因并形成后续运营优化方向。1.2 实验环境平台全称助睿数智Uniplore一站式数据科学实验平台 平台定位覆盖数据接入、ETL处理、机器学习建模到可视化分析的全链路 Agentic 零代码数据智能产品 产品官网https://www.uniplore.com/ 实验平台地址https://lab.guilian.cn/本次主要使用平台中的助睿 BI 可视化分析模块。该模块支持通过拖拽字段的方式配置指标卡、柱状图、条形图、折线图、饼图等图表也可以将多个工作表组合成仪表盘。1.3 实验数据说明本次实验使用前期实验生成的三张结果表。第一张表是summary_all_platforms该表用于全平台概况分析主要保存不同日期、不同平台的作品数量、浏览量、点赞量、收藏量、分享量等汇总指标。第二张表是content_analysis该表用于重点平台深度分析主要保存 B站 和 CSDN 的作品明细数据包括作者、标题、平台、浏览量、互动量、发布时间和标题特征字段等。第三张表是title_feature_analysis该表用于标题关键词效果分析主要保存不同平台下各类标题关键词的平均互动量、整体平均互动量和样本数量。三张表的用途如下数据表主要用途对应图表summary_all_platforms全平台整体概况指标卡、平台概况图content_analysis作者排名、作品排名、趋势分析排名图、趋势图title_feature_analysis标题关键词效果分析条形图、对比图1.4 分析思路本次可视化分析围绕五个问题展开1. 全平台整体内容产出和流量规模如何 2. B站 和 CSDN 两个平台的表现有什么差异 3. 哪些作者或作品的数据表现更突出 4. 不同标题关键词是否会影响浏览量和互动量 5. 作品数据随时间是否存在增长趋势或长尾效应仪表盘布局按照“先总览后细分”的方式设计。顶部展示全局指标中部展示平台对比和排名情况底部展示标题特征分析和趋势变化。这样用户进入仪表盘后可以先看到整体结果再进一步观察具体差异。第二部分实验步骤2.1 连接助睿 BI 数据源进入助睿实验平台后我先打开助睿 BI 可视化模块。由于前面实验已经将处理结果写入团队私有数据库所以本次不需要重新导入 CSV 文件只需要连接数据库并读取已经生成的结果表。在 BI 页面中进入数据源管理选择团队私有数据库连接。如果列表中已经存在数据库连接可以直接使用如果没有连接则需要先配置数据库地址、账号、密码和库名。连接成功后可以在数据源中看到前期生成的数据表。这里重点检查三张表是否存在summary_all_platforms content_analysis title_feature_analysis如果三张表都能正常查看说明数据源准备完成可以继续创建分析数据集。配置要点1. 本次实验使用的是前期 ETL 产出的数据库表不需要重新上传 CSV。 2. 数据源应选择团队私有数据库。 3. 需要确认 summary_all_platforms、content_analysis、title_feature_analysis 三张表存在。 4. 如果看不到表先检查数据库连接和表所在库名是否正确。 5. 数据源连接成功后再进入数据集创建环节。2.2 创建全平台概况数据集第一类数据集用于展示整体运营情况。我选择summary_all_platforms表创建一个新的分析数据集命名为全平台概况数据集该数据集主要用于制作作品总数、平台数量、总浏览量、总互动量等指标卡。创建数据集后我检查字段类型。日期字段应识别为日期类型平台字段应识别为文本类型浏览量、点赞量、收藏量、分享量等字段应识别为数值类型。如果字段类型识别错误需要在数据集字段配置中进行调整。比如浏览量字段如果被识别成文本就无法正确求和。配置要点1. 数据表选择 summary_all_platforms。 2. 数据集名称建议设置为“全平台概况数据集”。 3. 数值字段必须设置为可聚合字段否则后续指标卡无法正确计算。2.3 创建重点平台明细数据集第二类数据集用于分析 B站 和 CSDN 的作品表现。我选择content_analysis表创建数据集命名为重点平台内容明细数据集这个数据集主要用于制作作者排名、作品排名和时间趋势图。该表中既包含作品基础字段也包含前面实验生成的互动特征字段。因此在创建数据集时要重点检查以下字段author_name title platform date views total_interaction has_best has_lowcode has_practice has_tutorial has_pit其中author_name可以用于学生排名title可以用于作品排名platform可以用于筛选 B站 或 CSDNdate可以用于趋势分析views和total_interaction可以作为核心指标。配置要点1. 数据表选择 content_analysis。 2. author_name 用于作者维度分析。 3. title 用于单篇作品排名。 4. platform 用于区分 B站 和 CSDN。 5. views 用于浏览量、播放量或阅读量统计。 6. total_interaction 用于互动表现分析。 7. date 字段要设置为日期类型方便制作趋势图。2.4 创建标题特征分析数据集第三类数据集用于分析标题关键词效果。我选择title_feature_analysis表创建数据集命名为标题特征分析数据集该数据集的作用是对比不同标题关键词对应作品的平均互动量以及这些作品与平台整体平均互动水平之间的差距。该表主要字段包括platform feature_name avg_interaction overall_avg sample_count其中feature_name表示标题关键词例如“保姆级”“零代码”“实战”“教程/指南”“踩坑”avg_interaction表示含该关键词作品的平均互动量overall_avg表示平台整体平均互动量sample_count表示样本数量。配置要点1. 数据表选择 title_feature_analysis。 2. feature_name 作为标题关键词维度。 3. platform 用于区分不同平台。 4. avg_interaction 用于展示关键词作品平均互动量。 5. overall_avg 用于作为整体平均水平对照。 6. sample_count 用于判断样本量是否足够。2.5 制作全平台核心指标卡数据集创建完成后我先制作顶部核心指标卡。指标卡用于快速展示整体运营状态让用户一进入仪表盘就能看到全局情况。本次配置的核心指标包括全平台作品总数 覆盖平台数 全平台总浏览量 全平台总互动量 B站作品数 CSDN作品数 B站总播放量 CSDN总阅读量其中全平台作品总数可以使用记录计数覆盖平台数可以对platform字段做去重计数总浏览量可以对total_views求和总互动量可以由点赞、收藏、分享、投币等字段汇总计算。对于 B站 和 CSDN 的指标可以在图表中增加平台筛选条件。例如 B站总播放量设置筛选条件platform B站CSDN总阅读量设置筛选条件platform CSDN配置要点1. 指标卡适合展示总量类核心指标。 2. 作品总数使用记录计数。 3. 平台数使用 platform 去重计数。 4. 总浏览量使用 total_views 求和。 5. 分平台指标需要添加 platform 筛选条件。 6. 指标卡标题要写清楚避免用户只看到数字但不知道含义。2.6 制作作者表现排名图完成全局指标后我开始制作作者表现排名图。作者排名可以帮助我们观察哪些同学的作品整体表现更好。这里分别制作 B站 和 CSDN 的作者排名图。B站作者排名使用content_analysis数据集筛选条件为platform B站维度选择author_name指标选择views 的平均值图表类型选择条形图或柱状图并按照平均浏览量降序排序展示前 10 名。CSDN 作者排名的配置方式类似只需要将筛选条件改为platform CSDN这里使用平均值而不是求和是因为不同作者的作品数量可能存在差异。使用平均浏览量可以更公平地比较单篇作品的平均表现。配置要点1. 数据集选择 content_analysis。 2. 维度选择 author_name。 3. 指标选择 views并设置聚合方式为平均值。 4. 分别筛选 platform B站 和 platform CSDN。 5. 排序方式设置为按平均浏览量降序。 6. 展示数量建议限制为 TOP10避免图表过长。2.7 制作单篇作品排名图作者排名展示的是“人”的整体表现单篇作品排名则用来识别具体的高传播内容。因此我继续制作作品排名图。B站作品排名图配置如下数据集content_analysis 筛选条件platform B站 维度title 指标views 求和或最大值 排序按 views 降序 展示数量TOP10CSDN作品排名图配置如下数据集content_analysis 筛选条件platform CSDN 维度title 指标views 求和或最大值 排序按 views 降序 展示数量TOP10作品排名图可以帮助我们找到单篇爆发较好的作品。后续分析时可以结合这些作品的标题、发布时间和关键词特征进一步总结内容传播效果较好的原因。配置要点1. 作品排名维度选择 title。 2. 指标选择 views。 3. B站图表筛选 platform B站。 4. CSDN图表筛选 platform CSDN。 5. 排序方式使用 views 降序。 6. 如果标题过长可以使用横向条形图提升可读性。2.8 制作标题关键词影响分析图标题关键词分析是本次实验的重点之一。这里使用title_feature_analysis数据集主要观察不同标题关键词对应作品的平均互动量是否高于平台整体平均水平。本次标题关键词影响分析没有只做一张图而是分成两类图表来展示1. 标题特征对比柱状图对比关键词作品平均互动量和平台整体平均互动量 2. 标题特征提升倍率条形图计算关键词作品相对整体平均水平的提升倍数。由于 B站 和 CSDN 的内容分发机制、用户互动方式和平台指标含义不同所以本次没有把两个平台混在一起分析而是分别制作 B站 和 CSDN 的标题特征图表。最终得到四张图CSDN标题特征对比柱状图 CSDN标题特征提升倍率条形图 B站标题特征对比柱状图 B站标题特征提升倍率条形图2.8.1 制作标题特征对比柱状图首先制作的是标题特征对比柱状图。这个图主要用于比较“含某类关键词作品的平均互动量”和“该平台整体平均互动量”之间的差异。配置时选择title_feature_analysis数据集维度选择feature_name指标选择avg_interaction和overall_avg。其中avg_interaction表示含有某个标题关键词的作品平均互动量overall_avg表示当前平台所有作品的整体平均互动量。CSDN 标题特征对比柱状图配置如下数据集title_feature_analysis 筛选条件platform CSDN 维度feature_name 指标avg_interaction 图表类型柱状图 排序方式按 avg_interaction 降序B站标题特征对比柱状图配置方式相同只需要将平台筛选条件改为 B站数据集title_feature_analysis 筛选条件platform B站 维度feature_name 指标avg_interaction 图表类型柱状图 排序方式按 avg_interaction 降序通过对比柱状图可以直观看出哪些标题关键词对应作品的平均互动量高于平台整体平均水平。如果某个关键词的avg_interaction明显高于overall_avg说明该类标题在当前平台上可能具有更好的互动表现。2.8.2 制作标题特征提升倍率条形图仅看平均互动量还不够直观因此我继续制作标题特征提升倍率条形图。提升倍率用于表示某类标题关键词作品的平均互动量是平台整体平均互动量的多少倍。计算逻辑如下提升倍率 avg_interaction / overall_avg如果提升倍率大于 1说明含该关键词的作品平均互动量高于平台整体平均水平如果提升倍率小于 1说明该关键词对应作品的互动表现低于整体水平。CSDN 标题特征提升倍率条形图配置如下数据集title_feature_analysis 筛选条件platform CSDN 维度feature_name 指标avg_interaction / overall_avg 图表类型条形图 排序方式按提升倍率降序B站标题特征提升倍率条形图配置如下数据集title_feature_analysis 筛选条件platform B站 维度feature_name 指标avg_interaction / overall_avg 图表类型条形图 排序方式按提升倍率降序提升倍率条形图比单纯的平均互动量图更适合做横向比较。因为不同平台的基础流量水平不同直接比较互动量可能不公平而提升倍率可以反映某类标题关键词相对于本平台整体水平的提升效果。2.8.3 图表分析思路完成四张图后可以从两个角度进行观察。第一看对比柱状图。如果某个关键词的avg_interaction高于overall_avg说明该关键词作品的互动表现高于平台平均水平。例如“教程/指南”“实战”“保姆级”等关键词如果柱子明显高于整体平均值就可以说明这类标题更容易获得互动。第二看提升倍率条形图。如果某个关键词的提升倍率大于 1说明该关键词具有正向提升效果如果提升倍率接近 1说明它和平台整体水平差异不大如果提升倍率低于 1则说明该类标题在当前数据中没有体现出明显优势。需要注意的是标题关键词分析不能只看倍率还要结合sample_count判断样本数量。如果某个关键词样本数量很少即使提升倍率较高也需要谨慎解读不能直接认为该关键词一定有效。配置要点1. 数据集选择 title_feature_analysis。 2. feature_name 作为标题关键词维度。 3. avg_interaction 表示含该关键词作品的平均互动量。 4. overall_avg 表示当前平台整体平均互动量。 5. 标题特征对比柱状图需要同时放入 avg_interaction 和 overall_avg 两个指标。 6. 标题特征提升倍率条形图需要新增计算指标avg_interaction / overall_avg。 7. B站 和 CSDN 要分别筛选后单独作图不建议混在一起比较。 8. 图表排序建议按 avg_interaction 或提升倍率降序排列。 9. sample_count 较小的关键词需要谨慎分析避免样本量过少导致结论偏差。2.9 制作平台每日流量趋势图完成排名和标题分析后我继续制作时间趋势图。趋势图用于观察作品浏览量随日期变化的情况。平台每日流量趋势图使用content_analysis数据集。配置如下维度date 指标views 求和 图表类型折线图 筛选条件platform B站 或 platform CSDN趋势图主要用于观察流量是否持续上升、是否存在明显波动以及某些日期是否出现异常增长。如果某一天流量突然升高可以结合对应日期发布的作品进行进一步分析。配置要点1. date 字段必须识别为日期类型。 2. 指标选择 views 求和。 3. 图表类型选择折线图。 4. 可以按 platform 分组展示不同平台趋势。 5. 如果日期显示混乱需要检查日期格式和排序方式。 6. 趋势图适合放在仪表盘下方用于补充时间维度分析。2.10 搭建综合仪表盘各类工作表制作完成后我进入仪表盘页面将图表拖入同一个仪表盘中进行排版。本次仪表盘采用“顶部总览、中部对比、底部分析”的结构。整体布局如下这样的布局可以让用户先看到整体情况再分平台观察差异最后进一步查看标题关键词和时间趋势。在排版过程中我尽量让 B站 和 CSDN 两个平台形成左右对照。这样不仅能观察各自表现也能更方便地比较不同平台的内容传播特点。配置要点1. 指标卡放在顶部方便快速建立整体认知。 2. B站 和 CSDN 图表建议左右并列形成对照。 3. 排名图放在中部突出作者和作品表现。 4. 标题关键词分析图放在底部或中下区域作为归因分析模块。 5. 趋势图适合放在下方用于观察时间变化。 6. 图表标题要统一命名避免用户理解成本过高。第三部分实验结果3.1 完成三类分析数据集构建本次实验首先在助睿 BI 中完成了三类数据集构建全平台概况数据集 重点平台内容明细数据集 标题特征分析数据集三类数据集分别服务于不同分析目标。全平台概况数据集用于总览指标重点平台内容明细数据集用于排名和趋势标题特征分析数据集用于文案策略效果分析。3.2 完成核心指标卡和排名图仪表盘顶部已经完成全平台核心指标卡包括作品总数、覆盖平台数、总浏览量、总互动量等。中部完成了 B站 和 CSDN 的作者排名、作品排名图表。通过这些排名图可以观察到不同作者和不同作品之间的表现差异。排名图能够帮助我们识别头部作品和头部作者为后续总结优秀案例提供依据。3.3 完成标题关键词效果分析基于title_feature_analysis表仪表盘中完成了标题关键词影响分析图。该图可以展示不同关键词对应作品的平均互动量也可以通过提升倍率观察关键词效果是否高于整体平均水平。这部分结果可以帮助我们判断标题文案对作品互动表现是否存在影响。例如“教程”“实战”“保姆级”等关键词是否更容易获得较高互动可以通过图表进一步分析。3.4 完成平台趋势分析仪表盘中还完成了平台每日流量趋势图用于观察浏览量随时间变化的情况。趋势图可以帮助我们观察作品流量是否呈现持续增长、阶段性波动或长尾积累。如果某些日期出现明显峰值可以结合当天作品内容进行进一步拆解。3.5 完成综合仪表盘搭建最终完成的仪表盘包含以下模块全平台核心指标卡 B站作者排名 TOP10 B站作品播放 TOP10 CSDN作者排名 TOP10 CSDN作品阅读 TOP10 标题关键词效果分析图 标题关键词提升倍率图 平台每日流量趋势图整体来看仪表盘已经能够支持从全局概况、分平台对比、个体排名、标题归因和时间趋势等多个角度观察自媒体运营数据。第四部分问题与解决4.1 排名图排序结果不符合预期问题现象配置作者排名图后图表没有按照平均浏览量从高到低展示排名结果比较混乱。问题原因一方面可能是指标聚合方式设置错误例如误用了求和而不是平均值另一方面可能是排序字段没有绑定到平均浏览量指标而是按照作者名称或默认顺序排序。解决方法将浏览量字段的聚合方式改为“平均值”并在排序设置中选择按平均浏览量降序排列。同时限制展示条数为 TOP10这样图表结果会更加清楚。4.2 指标卡数值异常偏大问题现象配置总浏览量或总互动量指标卡后数值明显偏大和数据库结果不一致。问题原因可能是数据集粒度选择错误。例如应该使用summary_all_platforms表做全平台汇总却误用了content_analysis明细表导致同一指标被重复聚合。解决方法检查指标卡使用的数据集。全平台总览类指标优先使用summary_all_platforms作者、作品和趋势类分析再使用content_analysis。不同粒度的数据表不要混用。4.3 日期趋势图无法按时间顺序显示问题现象折线图中的日期顺序混乱时间趋势无法正常观察。问题原因date字段可能被识别为文本类型导致图表按字符串顺序排序而不是按真实日期顺序排序。解决方法在数据集字段设置中将date字段调整为日期类型并在图表中按照日期升序排序。修改后重新刷新图表趋势线即可按时间顺序展示。4.4 标题关键词提升倍率计算错误问题现象标题关键词提升倍率图中的数值异常有的倍率过高或为空。问题原因可能是计算字段写法错误或者overall_avg为空。也可能是没有按平台分开计算导致 B站 和 CSDN 的平均值混在一起。解决方法检查计算字段是否为avg_interaction / overall_avg同时确认数据集中avg_interaction和overall_avg都有值。分析时要按platform区分平台不要直接把不同平台的数据混合比较。4.5 仪表盘图表布局拥挤问题现象多个图表放入仪表盘后页面显得拥挤标题和坐标轴内容重叠。问题原因图表数量较多但没有提前规划布局层级部分图表标题过长或者柱状图维度文本较多占用了较大空间。解决方法按照“顶部指标卡、中部分平台对比、底部归因和趋势”的结构重新调整布局。对于标题较长的作品排名图可以使用横向条形图对于重要性较低的图表可以适当缩小或放到下方区域。第五部分实验总结本次实验完成了自媒体运营数据从分析数据表到 BI 仪表盘的可视化探索过程。相比前两个实验中的数据清洗和特征构建本次实验更关注如何把数据结果转化为可读的图表和可解释的业务结论。在数据准备阶段我基于summary_all_platforms、content_analysis和title_feature_analysis三张表分别创建了全平台概况、重点平台明细和标题特征分析数据集。不同数据集对应不同分析场景避免了在一个数据源中混合过多分析逻辑。在图表配置阶段我使用指标卡展示全局核心数据使用排名图观察作者和作品表现使用标题关键词图分析文案策略效果使用趋势图观察流量变化。不同图表承担不同分析任务使仪表盘结构更加清晰。在仪表盘搭建阶段我采用“总览—对比—归因—趋势”的思路进行布局。顶部指标卡帮助快速建立整体认知中部分平台排名图用于观察 B站 和 CSDN 的表现差异底部标题特征和趋势图用于进一步解释数据变化原因。通过本次实验我进一步理解了 BI 可视化不是简单地把数据做成图而是要围绕分析问题组织图表。只有先明确“看什么、为什么看、看完以后能得出什么结论”仪表盘才能真正服务于后续运营分析和优化决策。