3个经验教训:这都是关于数据,笨蛋!(第一课)

Rawpixel.com/Adobe股票

这个由三部分组成的系列文章涵盖了三个开销分析教训。我(今天)从第1课开始,这是我的个人经历,它让我认识到拥有一个健壮的流程以保证所使用数据的完整性的重要性。

第1课:数据处理简介——清理、充实和分类

近20年前,我第一次接触到我们可以远程描述为消费分析的东西——试图增强手动Excel和基于access的操作和分析消费数据。我当时是freemmarkets的一名经理,负责产品战略计划,这是一项大型采购活动的一部分,涉及数十个潜在类别、数万个产品线和数亿美元的总支出。

以前,像其他服务供应商和内部采购团队一样,我们致力于类似复杂数据集的工作,比如一次性计划,旨在展示节约或成本回收的最佳机会(例如,发票审计)。

但在听取了不同客户的需求后,我们看到了一个机会,可以建立一个解决方案,包括最初的努力,开发一个由浪潮驱动的采购战略,分成即期、中期和长期优先事项,以及一个正在进行的程序,该程序将更新和刷新相同的数据集,以显示支出执行结果和合规,以及新的机会。

执行这一计划并不容易。我们最初的解决方案更多的是功能的拼凑,而不是一个真正的集成解决方案。不久之后,一家竞争对手推出了基于规则的完整“自动分类”功能——远远优于我们当时拥有的功能。

但可惜的是,这段经历让我学到了宝贵的一课:数据比一切都重要。然而,获得准确的数据并不像看上去那么容易。

为什么数据是挑战的核心

我的团队能够构建的最初工作本质上是一个很大程度上由手工驱动的ETL(提取、转换、加载)数据管理过程,它将信息加载到关系数据库中,在关系数据库之上有一个Cognos平台(即业务智能),其中包含许多固定的报告。我们的方法,和当时的许多其他方法一样,并不优雅,但它在帮助回答一些基本问题方面起了作用,我们可以用这些问题来落实和执行成本削减策略。

获取数据只是成功分析的第一步。但不要认为这是一个简单的问题。正如我发现的,基本的应付账款系统数据(通常来自于ERP工具)以及总账信息来自于我们自己的系统这仅仅是个开始。

现实世界不是采购数据世界——至少现在还不是

我们可以获得的大部分数据来自内部系统,特别是在间接和服务支出的情况下,缺乏仅来自专业采购工具和供应商提供的发票数据的线级细节。

当然还有其他的数据来源。购买卡文件、存档的EDI信息、供应商网络、银行数据、集团采购组织信息、贸易融资档案和其他第三方通常manbet万博app也可以提供数据,尽管这些数据通常是零散的,不完整的。

正如我所发现的,将所有这些数据拼凑在一起来创建一个完整的消费图景不是在公园里散步。但在此之前,我们需要“清理”和丰富它,确保所有的标题和行级名称和细节是准确的,并符合特定的命名标准。数据经常丢失特定的字段,拼写错误和缩写也是常见的——比如错误编码的字段。

总而言之,从最初的支出分析练习中得出的最常见的主题是数据质量差——而我们的供应商拥有的关于我们的数据比我们自己的系统所能提供的更好。讽刺,不是吗?但这正是合适的技术可以发挥作用的地方,它可以帮助我们从自己的系统和供应商的数据中拼凑出碎片。

最佳实践(除了这个列表,还有很多)包括:

  • 在数据加载和标准化中创建规模效率(特别是在重复/刷新情况下)
  • 追求永久(可持续)的解决方案,而不是一次性的努力——至少每季度更新一次数据,但理想情况是每月甚至每周更新一次
  • 拥有一种自动化的清理和分类方法(机器学习/人工智能,规则等),并在其之上有人类专业知识(如果技术本身不足以达到所需的准确性水平,这是90%以上的花费分析工作的情况)。这包括能够解决命名的不一致和约定;缺失的数据;输入错误的数据(例如,“Yin”代替“Pin”);将正确的分类结构应用于底层数据集(例如,“鼠标”作为计算机外围设备vs.实验室消耗品),等等。
  • 达到行级细节
  • 提供预测编码/分析——甚至(可能)在请求点实时分类数据
  • 提供标准的数据充实选项(对于公司级别的字段—考虑“Hoovers”类型信息)
  • 提供二级/高级数据充实(针对供应风险、企业社会责任数据、供应商多样性等)

如果我们在适当的水平上执行这些活动,我们将能够生成一个及时的、核心支出主数据集,它将不断更新并可用。但是,我们必须开始用它做些什么,鼓励我们的同行也使用和询问数据,以确定机会并采取行动。这也将我带到本系列的下一篇文章中:消费信息的视觉显示。

在Procurious分享

讨论:

您的电子邮件地址将不会被公布。必填字段已标记

这个网站使用Akismet来减少垃圾邮件。了解如何处理您的评论数据