数据垃圾,正在悄悄毁掉很多企业的AI计划
最近工信部发布了关于高质量行业数据建设的相关文件引起了很多关注。看到这个话题我感触很深。早在十多年前我就参与过国家大数据相关工作组的部分工作也参与过ITSS工具组标准建设。当时大家讨论最多的问题其实并不是人工智能而是数据标准化。从大模型到行业AI应用本质都是基于数据的归纳与推理。如果数据本身是杂乱的、非标准的、不可计算的那么再强的模型也难以产生可靠结果。因此未来竞争的关键不只是算法和算力还有高质量、标准化的数据体系。数据标准化从“鸡同鸭讲”到统一语言现实问题非常清晰——企业IT系统中数据来源复杂厂商不同、协议不同、格式不同如果缺乏统一标准就会变成“鸡同鸭讲”数据无法流通也无法被有效使用。以这些年无论是国家大数据建设还是ITSS标准体系建设核心目标之一都是推动数据标准化。高质量数据并不仅仅是数据量大而是数据真实、完整、统一、可计算。过去我们常说的数据清洗其实也是为了把大量非标准数据转化成统一的数据资产为后续分析、决策以及人工智能应用提供基础。运维系统高质量数据的关键入口与生产中心很多人认为运维只是保障系统稳定运行但实际上在企业数字化体系中运维平台承担着更重要的角色。这些年北塔持续深耕监控和运维管理领域我们发现企业最真实、最有价值的数据往往来自网络设备、服务器、数据库、中间件以及各种业务系统。而这些数据来源复杂不同厂商、不同设备、不同操作系统之间存在大量差异尤其是在国产化环境下这种差异更加明显。智能运维平台的价值就是把这些分散的数据统一采集、统一管理、统一标准化。通过屏蔽底层差异、完成数据清洗和标准化处理将原本零散的数据沉淀成高质量的数据资产。完成这一步数据才真正具备被分析、被利用、被AI调用的价值。运维正在从“保障系统”走向“生产数据”从我这些年参与行业标准建设以及企业数字化实践的经验来看真正有价值的不是工具本身而是工具背后持续沉淀的数据资产。运维平台未来最大的价值也不仅仅是发现故障、处理告警而是成为企业数据资产的重要生产中心和管理中心。因此工信部提出高质量行业数据建设是有着明确指向的。对于企业来说未来在选择智能运维平台时不仅要关注监控能力更要关注数据标准化能力、数据治理能力以及与人工智能应用的对接能力。因为在AI时代谁能够持续生产高质量数据谁就拥有未来智能化发展的主动权。运维管理也正在从系统保障角色逐步走向企业数据战略的核心位置。