#自媒体运营 #数据分析 #数据可视化 #数据处理 #零代码实现 #可视化分析前两步我们已经完成了数据清洗和作品特征构建这一篇进入最后的可视化阶段基于summary_all_platforms、content_analysis和title_feature_analysis三张表使用助睿BI制作指标卡、排名图、标题影响分析图、趋势图并搭建一套完整的自媒体运营分析仪表盘。一、为什么要做可视化探索在实验7-1中我们使用ETL完成了自媒体作品数据的清洗与预处理输出了全平台概况表和重点平台明细表。在实验7-2中我们进一步完成了作品特征构建计算了互动总数并提取了标题关键词特征。到了实验7-3数据已经具备了分析基础。接下来要做的就是把这些数据转化成直观的图表和仪表盘。这一步的意义不只是“把数据画出来”而是通过可视化回答几个运营问题全班自媒体作品整体表现如何哪个平台的数据表现更突出哪些学生整体运营效果更好哪些作品成为了头部内容哪些标题关键词更容易带来互动数据随时间变化有什么趋势所以本次实验的核心目标是使用BI搭建一套完整的自媒体运营分析仪表盘并能够根据图表提炼运营洞察。图1 自媒体运营分析仪表盘整体效果顶部展示核心指标下方按B站和CSDN分区展示排名、标题影响和趋势分析二、本次实验使用哪些数据本次实验使用前两次实验输出的三张表。数据表来源主要用途summary_all_platforms实验7-1制作全平台概况指标卡content_analysis实验7-1、实验7-2制作学生排名、作品排名、趋势分析title_feature_analysis实验7-2制作标题关键词影响分析图这三张表对应三个BI数据集BI数据集对应数据表用途全平台概况数据集summary_all_platforms展示总作品数、平台数、总浏览数、总互动数等重点平台深度分析数据集content_analysis分析B站和CSDN的作品、作者、流量趋势标题关键词互动数据集title_feature_analysis分析不同标题关键词的互动效果图2 构建三个BI数据集全平台概况数据集、重点平台深度分析数据集、标题关键词互动数据集三、可视化分析框架在开始制作图表之前先明确本次分析框架。本次自媒体数据有几个特点第一内容主题比较接近。大家发布的内容大多围绕课程实验、平台操作、数据分析等主题展开。第二重点平台比较明确。虽然原始数据中包含多个平台但真正适合深入分析的是B站和CSDN。第三作品数量相对接近。大多数同学发布作品数量差距不算特别大因此可以进一步比较作品质量和互动效果。第四标题写法存在差异。比如有的标题使用“保姆级”有的使用“零代码”有的强调“实战”“教程”“踩坑”。这些标题差异可能会影响点击和互动。因此本次仪表盘主要围绕五个维度展开分析维度核心问题核心指标整体表现如何平台对比B站和CSDN哪个表现更突出学生排名哪些同学整体运营效果更好作品排名哪些单篇内容成为头部作品标题影响哪些标题关键词更容易带来互动趋势分析流量随时间如何变化四、仪表盘布局思路本次仪表盘采用“先总后分、左右对照”的布局。整体结构可以理解为顶部自媒体运营分析标题 第一行全平台核心指标 - 全平台作品总数 - 分发平台数 - 全平台总浏览数 - 全平台总互动数 第二行重点平台指标 - B站作品数 - B站总播放量 - CSDN作品数 - CSDN总阅读量 下方左侧B站分析区 - B站作品排名 - B站学生排名 - B站标题特征分析 - B站趋势分析 下方右侧CSDN分析区 - CSDN作品排名 - CSDN学生排名 - CSDN标题特征分析 - CSDN趋势分析这种布局的好处是 读者先看整体数据再看重点平台最后进入排名、标题和趋势等深度分析。图3 仪表盘布局采用“核心指标置顶、B站与CSDN左右对照”的结构五、步骤一进入助睿BI并检查数据源首先登录助睿在线实验平台进入助睿BI或可视化探索模块。通常在左侧菜单中可以看到数据源 数据集 工作表 仪表盘本次实验指导书中说明团队私有数据库在前面实验中已经连接过所以一般不需要重新连接。但是正式操作前建议先检查一下数据源是否正常进入助睿BI平台找到数据源或数据集入口检查是否可以访问团队私有数据库确认能看到summary_all_platforms、content_analysis、title_feature_analysis三张表。如果找不到表通常说明BI连接的数据库不是实验7-1和实验7-2写入的数据库需要重新检查数据库连接。图4 进入助睿BI平台检查团队私有数据库连接是否可用六、步骤二构建三个数据集6.1 构建全平台概况数据集点击“新建数据集”选择团队私有数据库连接找到summary_all_platforms将该表加入数据集。建议数据集命名为全平台概况数据集主要字段包括字段说明crawl_date采集日期platform平台名称content_count作品数量total_views总浏览数total_likes总点赞数total_favorites总收藏数total_shares总分享数total_coins总投币数total_recommend总推荐数total_likes_zhihu知乎喜欢数total_approvals知乎赞同数这个数据集主要用于制作顶部的全平台指标卡。图5 基于summary_all_platforms构建“全平台概况数据集”6.2 构建重点平台深度分析数据集继续新建数据集选择content_analysis建议命名为重点平台深度分析数据集主要字段包括字段说明date采集日期author_name作者名称title作品标题platform平台views播放量/阅读量likes点赞数favorites收藏数shares分享数coins投币数total_interaction互动总数has_best等标题关键词特征这个数据集用于制作B站和CSDN的学生排名、作品排名和趋势图。图6 基于content_analysis构建“重点平台深度分析数据集”6.3 构建标题关键词互动数据集继续新建第三个数据集选择title_feature_analysis建议命名为标题关键词互动数据集主要字段包括字段说明platform平台名称feature_name标题关键词名称avg_interaction含关键词作品平均互动数overall_avg平台整体平均互动数sample_count含关键词作品数量这个数据集用于制作标题特征提升倍率图和标题特征对比图。图7 基于title_feature_analysis构建“标题关键词互动数据集”6.4 创建标题特征提升倍率计算字段为了量化标题关键词效果需要创建一个计算字段标题特征提升倍率 avg_interaction / overall_avg这个字段表示含某个关键词的作品平均互动数是平台整体平均互动数的多少倍。例如标题特征提升倍率 1.5表示含该关键词的作品平均互动数比整体平均水平高出50%。图8 在“标题关键词互动数据集”中新建计算字段avg_interaction / overall_avg七、步骤三制作核心指标卡指标卡的作用是让读者快速了解整体情况。 本次实验建议制作8张核心指标卡。7.1 全平台作品总数数据集选择全平台概况数据集图表类型选择指标卡字段配置区域字段聚合方式值content_count求和标题设置为全平台作品总数这个指标表示本次采集到的全部平台作品数量。图9 制作“全平台作品总数”指标卡将content_count设置为求和7.2 分发平台数数据集选择全平台概况数据集图表类型选择指标卡字段配置区域字段聚合方式值platform去重计数标题设置为分发平台数这里建议使用“去重计数”而不是普通计数。 因为普通计数统计的是记录行数去重计数统计的才是平台数量。图10 制作“分发平台数”指标卡将platform设置为去重计数7.3 全平台总浏览数字段配置区域字段聚合方式值total_views求和标题设置为全平台总浏览数这个指标表示所有平台加总后的整体流量规模。图11 制作“全平台总浏览数”指标卡将total_views设置为求和7.4 全平台总互动数全平台总互动数可以通过计算字段得到。建议创建计算字段互动总数 total_likes total_favorites total_shares total_coins total_recommend total_likes_zhihu total_approvals然后将该字段拖入指标卡聚合方式设置为求和。标题设置为全平台总互动数这个指标反映全部平台作品获得的整体互动规模。图12 新建互动总数计算字段并制作“全平台总互动数”指标卡7.5 B站作品数与B站总播放量这两张指标卡仍然使用全平台概况数据集但需要添加过滤条件platform B站B站作品数区域字段聚合方式值content_count求和标题B站作品数B站总播放量区域字段聚合方式值total_views求和标题B站总播放量图13 添加过滤条件platform B站制作“B站作品数”和“B站总播放量”指标卡7.6 CSDN作品数与CSDN总阅读量同样使用全平台概况数据集过滤条件改为platform CSDNCSDN作品数区域字段聚合方式值content_count求和标题CSDN作品数CSDN总阅读量区域字段聚合方式值total_views求和标题CSDN总阅读量图14 添加过滤条件platform CSDN制作“CSDN作品数”和“CSDN总阅读量”指标卡八、步骤四制作排名类图表排名图表主要解决两个问题谁做得好 什么内容做得好所以排名图分为两类图表分析问题学生排名哪些同学整体运营效果更好作品排名哪些单篇作品成为爆款8.1 B站学生平均播放量排名TOP10数据集选择重点平台深度分析数据集图表类型建议选择水平条图字段配置区域字段聚合方式X轴views平均Y轴author_name维度过滤条件platform B站排序views 降序限额10标题设置为B站学生平均播放量排名TOP10这个图用于找出B站平台上整体播放表现较好的学生。图15 制作B站学生平均播放量排名按作者分组并对播放量取平均值8.2 B站作品播放量排名TOP10数据集仍然选择重点平台深度分析数据集字段配置区域字段聚合方式X轴views求和或默认聚合Y轴title维度过滤条件platform B站排序views 降序限额10标题设置为B站作品播放量排名TOP10这个图用于找出B站平台上播放量最高的单篇作品。图16 制作B站作品播放量排名按作品标题统计播放量并取TOP108.3 CSDN学生平均阅读量排名TOP10配置方式与B站学生排名类似只需要修改过滤条件。过滤条件platform CSDN字段配置区域字段聚合方式X轴views平均Y轴author_name维度排序views 降序限额10标题设置为CSDN学生平均阅读量排名TOP10图17 制作CSDN学生平均阅读量排名按作者统计平均阅读量8.4 CSDN作品阅读量排名TOP10字段配置区域字段聚合方式X轴views求和或默认聚合Y轴title维度过滤条件platform CSDN排序views 降序限额10标题设置为CSDN作品阅读量排名TOP10图18 制作CSDN作品阅读量排名按作品标题统计阅读量并取TOP10九、步骤五制作标题影响分析图表标题影响分析是本次可视化中最有价值的部分。因为在内容主题比较接近的情况下标题差异可能是影响点击和互动的重要因素。这里主要制作两类图图表作用标题特征提升倍率条形图判断哪个关键词相对整体平均水平提升更明显标题特征对比柱状图查看每个关键词作品的平均互动数9.1 B站标题特征提升倍率条形图数据集选择标题关键词互动数据集图表类型选择水平条图字段配置区域字段X轴标题特征提升倍率Y轴feature_name过滤条件platform B站标题设置为B站标题特征提升倍率条形图这个图用于判断在B站平台上哪些标题关键词能够带来更明显的互动提升。图19 使用标题特征提升倍率和feature_name制作B站标题关键词效果图9.2 B站标题特征对比柱状图数据集选择标题关键词互动数据集图表类型选择柱状图字段配置区域字段X轴feature_nameY轴avg_interaction过滤条件platform B站标题设置为B站标题特征对比柱状图可以添加平均值参考线用于判断哪些关键词高于整体平均互动水平。图20 制作B站标题特征对比柱状图并添加平均互动数参考线9.3 CSDN标题特征提升倍率条形图配置方式与B站标题特征提升倍率图相同只需要修改过滤条件。过滤条件platform CSDN字段配置区域字段X轴标题特征提升倍率Y轴feature_name标题设置为CSDN标题特征提升倍率条形图这个图用于判断在CSDN平台上哪些标题关键词更容易提升互动表现。图21 制作CSDN标题特征提升倍率条形图分析不同关键词在CSDN平台的效果9.4 CSDN标题特征对比柱状图字段配置区域字段X轴feature_nameY轴avg_interaction过滤条件platform CSDN标题设置为CSDN标题特征对比柱状图同样可以添加平均值参考线。图22 制作CSDN标题特征对比柱状图对比不同关键词的平均互动表现十、步骤六制作趋势分析图表趋势图用于观察数据随时间的变化。需要注意的是本次数据中的日期是采集日期不一定是作品发布时间。 因此趋势图展示的是不同采集日期下作品播放量或阅读量的累计变化情况。10.1 B站每日播放量趋势折线图数据集选择重点平台深度分析数据集图表类型折线图字段配置区域字段聚合方式X轴date日期维度Y轴views求和过滤条件platform B站排序date 升序标题设置为B站每日播放量趋势折线图这个图用于观察B站播放量随采集日期的变化。图23 制作B站每日播放量趋势折线图观察B站播放量随采集日期变化10.2 CSDN每日阅读量趋势折线图配置方式与B站趋势图一致只需要修改过滤条件。过滤条件platform CSDN字段配置区域字段聚合方式X轴date日期维度Y轴views求和排序date 升序标题设置为CSDN每日阅读量趋势折线图图24 制作CSDN每日阅读量趋势折线图观察CSDN阅读量随采集日期变化十一、步骤七搭建综合仪表盘所有工作表制作完成后进入“仪表盘”页面新建仪表盘。建议命名为自媒体运营分析页面主标题也设置为自媒体运营分析图25 新建仪表盘并设置标题为“自媒体运营分析”11.1 放置顶部指标卡将前面制作好的8张指标卡拖入仪表盘顶部。第一行放全平台指标全平台作品总数 分发平台数 全平台总浏览数 全平台总互动数第二行放重点平台指标B站作品数 B站总播放量 CSDN作品数 CSDN总阅读量布局时要注意指标卡高度保持一致数字字号适当放大标题命名要清楚同一行卡片间距保持一致。图26 将8张核心指标卡拖入仪表盘顶部形成全平台与重点平台概况展示区11.2 搭建B站作品分析区在指标卡下方添加分区标题B站作品然后放入以下图表B站作品播放量排名TOP10 B站学生平均播放量排名TOP10 B站标题特征提升倍率条形图 B站标题特征对比柱状图 B站每日播放量趋势折线图布局建议排名图放在上方标题特征图放在中间趋势图放在下方图表宽度保持统一避免页面杂乱。图27 搭建B站作品分析区包含作品排名、学生排名、标题影响和播放趋势11.3 搭建CSDN作品分析区添加分区标题CSDN作品然后放入以下图表CSDN作品阅读量排名TOP10 CSDN学生平均阅读量排名TOP10 CSDN标题特征提升倍率条形图 CSDN标题特征对比柱状图 CSDN每日阅读量趋势折线图CSDN区域建议与B站区域保持相同结构。 这样读者可以左右对照快速比较两个平台的差异。图28 搭建CSDN作品分析区包含作品排名、学生排名、标题影响和阅读趋势11.4 调整布局并发布图表全部拖入后需要进一步调整页面布局。建议检查以下几点指标卡是否对齐图表标题是否完整排名图是否能看清标题B站和CSDN区域是否左右对应趋势图日期顺序是否正确多余文本组件是否删除页面是否有明显空白或拥挤区域。调整完成后点击保存、预览或发布。图29 调整组件大小、图表间距和分区位置使仪表盘布局更加清晰图30 保存并发布“自媒体运营分析”仪表盘十二、如何从图表提炼分析结论完成仪表盘后还需要根据图表写分析报告。 报告不要只堆图而要围绕三个问题展开现状是什么 为什么会这样 接下来怎么优化12.1 数据概况分析可以结合顶部指标卡说明全平台作品总数是多少覆盖了多少个平台全平台总浏览量是多少全平台总互动数是多少B站和CSDN分别贡献了多少作品和流量。示例写法从整体数据看本次自媒体作品覆盖多个发布平台作品数量较多说明班级整体内容发布完成度较高。从重点平台表现看B站和CSDN是本次分析的核心平台其中CSDN阅读量规模较大说明图文内容在课程实验类主题中具有较强的累计传播优势。12.2 排名分析可以结合学生排名和作品排名说明哪些学生整体表现靠前哪些作品成为头部内容学生排名和作品排名是否一致头部作品是否具有共同特征。示例写法从作品排名图可以看出头部作品与普通作品之间存在明显差距说明同样主题下仍然会出现较强的爆款效应。从学生平均播放量或阅读量排名看部分学生整体表现更稳定可能与标题表达、内容结构、发布时间和平台适配方式有关。12.3 标题影响分析可以结合标题特征提升倍率图说明哪些关键词提升倍率更高哪些关键词互动表现一般同一个关键词在B站和CSDN上的效果是否不同。示例写法从标题特征提升倍率图可以看出部分关键词对应作品的平均互动数高于整体平均水平说明标题表达会影响用户点击和互动意愿。其中“零代码”“教程/指南”“实战”等关键词具有较强的学习导向和工具属性更容易吸引目标用户。12.4 趋势分析可以结合趋势折线图说明流量是否持续上升哪些日期出现明显增长B站和CSDN趋势是否一致流量增长可能来自新作品加入还是老作品持续传播。示例写法从每日趋势图看B站和CSDN的流量随采集日期发生变化。CSDN阅读量整体规模较高说明图文内容可能具备更强的长尾传播能力B站播放量更容易受到短期推荐、封面标题和发布时间等因素影响。12.5 优化建议报告最后可以给出3到5条优化建议。示例第一后续标题可以优先使用具有明确学习价值的关键词例如“教程”“指南”“实战”“零代码”等提高用户点击意愿。 第二B站内容应进一步优化封面、标题和视频开头节奏提升短时间内的点击率和播放完成度。 第三CSDN图文内容应加强关键词布局和步骤化表达利用搜索流量获得更稳定的长期阅读。 第四对于排名靠前的作品可以进一步复盘其标题、内容结构和发布时间总结可复制的运营方法。 第五后续分析可以继续引入评论数、收藏率、转发率等细分指标进一步判断用户真实兴趣。十三、常见问题与解决办法13.1 数据集中找不到目标表可能原因实验7-1或实验7-2没有完成数据表写入到了另一个数据库BI连接的数据源不是团队私有数据库数据库连接权限不足。解决方法先确认数据库中存在summary_all_platforms content_analysis title_feature_analysis再确认BI连接的是同一个数据库。13.2 指标卡数值不正确常见原因是聚合方式设置错误。检查方式指标正确设置全平台作品总数content_count求和分发平台数platform去重计数全平台总浏览数total_views求和全平台总互动数计算字段求和B站/CSDN指标必须添加平台过滤条件13.3 B站和CSDN数据混在一起原因通常是没有添加平台过滤条件。解决方法在图表中添加过滤器platform B站或者platform CSDN13.4 排名图不是TOP10可能原因没有设置降序排序没有设置限额聚合方式不正确。解决方法将views设置为降序设置限额为10学生排名使用平均值作品排名使用求和或默认聚合。13.5 趋势图日期顺序混乱原因是没有按日期升序排序。解决方法在date字段上设置升序排序。date 升序13.6 标题特征提升倍率没有显示可能原因没有创建计算字段公式写错overall_avg为空或为0title_feature_analysis表没有数据。正确公式为标题特征提升倍率 avg_interaction / overall_avg十四、实验小结本次实验完成了自媒体运营分析的可视化探索。整个实验可以分成五步第一步连接数据源 第二步构建三个数据集 第三步制作指标卡、排名图、标题影响图和趋势图 第四步搭建综合仪表盘 第五步根据图表输出分析报告通过本次实验我们完成了一套完整的自媒体运营分析仪表盘覆盖了全平台概况B站与CSDN重点平台对比学生平均表现排名作品流量排名标题关键词效果分析每日播放量/阅读量趋势分析。这套仪表盘的价值不只是展示数据更重要的是帮助我们从数据中发现问题、解释原因并提出优化建议。十五、完整流程回顾最后用一张流程图回顾本次实验实验7-3自媒体运营分析可视化探索 前置数据 ├── summary_all_platforms ├── content_analysis └── title_feature_analysis 构建数据集 ├── 全平台概况数据集 ├── 重点平台深度分析数据集 └── 标题关键词互动数据集 制作工作表 ├── 核心指标卡 ├── 学生排名图 ├── 作品排名图 ├── 标题影响分析图 └── 趋势折线图 搭建仪表盘 ├── 顶部核心指标区 ├── B站作品分析区 └── CSDN作品分析区 输出分析报告 ├── 现状描述 ├── 原因分析 └── 优化建议图31 实验7-3最终成果完成自媒体运营分析仪表盘并形成数据驱动的运营分析思路到这里自媒体运营分析的完整流程就串起来了。实验7-1解决的是数据能不能用 先清洗原始数据保留有效记录输出规范数据表。实验7-2解决的是数据能不能分析 计算互动总数提取标题关键词把基础字段加工成特征。实验7-3解决的是数据能不能看懂 用图表和仪表盘呈现结果从数据中总结运营洞察。所以真正完整的数据分析不是只做最后的图表而是从数据清洗、特征构建到可视化表达一步步推进。当我们能够根据图表回答“现状是什么、为什么会这样、接下来怎么做”时这套自媒体运营分析才真正有了业务价值。