拥有的数据
根据一份被广泛引用的Gartner的研究在美国,85%的人工智能(AI)项目会产生错误的结果。Gartner断言,原因通常在于源数据的问题。这引发了几个显而易见的问题。好的数据究竟是什么?公司和组织应该如何捕捉和管理这些数据?
乔治·冯·泽德维茨·利本斯坦(George Von Zedwitz Liebenstein)是《我们的未来》第一季的最后一位嘉宾,他说,对人工智能领域顶尖专业人士的采访完全有资格提供答案。作为全球商用车制造商斯堪尼亚(Scania)金融服务部门的信息和分析主管,他处于移动革命的前沿。互联车辆的出现正在引发潜在有价值数据的海啸,人工智能是斯堪尼亚实现真正可持续交通系统愿景的核心。因此,该公司又一次生动地展示了大数据和人工智能的力量。
乍一看,用专注于为AI构建正确基础的讨论来结束第一个系列似乎有点不合逻辑。事实上,对冯·塞德维茨-利本斯坦的采访在很大程度上扩展了之前发生的事情。我们所有的客人都强调了交货的必要性,而不是野心勃勃。在所有围绕人工智能的宣传中,他们也强调了人类维度的重要性。
Von Zedwitz-Liebenstein坚持认为,对于任何新兴的人工智能和数据驱动策略来说,最重要的任务是建立一个坚实的基础。要反映高德纳研究的结果,这就意味着要提供好的数据。实现这一目标既是技术问题,也是态度问题。
他相当巧妙地将数据质量描述为一项团队运动。绝对优先的是创造明确数据所有权并确保数据产品心态渗透到整个组织。在建立一个数据驱动型公司的过程中,一个常见的陷阱就是把一个巨大的、全企业范围的数据湖当成垃圾场。这一策略通常无法实现其预期的收益,主要是因为所有权问题尚未解决。
更有效的解决方案是给数据团队端到端的责任来制作数据可用。只有创建清晰、透明的数据产品所有权,其对更广泛组织的价值才会变得明显,并且易于利用。通过在数据和所有者之间建立这些关系,解决关键问题(如围绕数据的隐私、敏感性和保护)也变得简单得多。
Von Zedwitz-Liebenstein对数据所有权的态度也反映了他对未来的期望。他相信,数据网格的出现将是这个领域的决定性趋势之一。基本上,这意味着应用微服务方法;取代缓慢、不灵活、反应迟钝的数据湖和管道,组织将寻求创建更易于管理的数据产品,这些产品可以由其终身所有者快速独立地部署。换句话说,利用数据的速度和易用性是我们最初的问题的核心:什么是好的数据?
回到2016年,IBM估计这些糟糕的数据每年给美国经济造成3万亿美元的损失。无论这一说法的真实性如何——以及它在过去五年中可能发生了多大的变化——毫无疑问,企业和组织对数据重要性的认识往往无法与它们有效利用数据的能力相匹配。正如冯·塞德维茨-利本斯坦所强调的那样,他们很可能只是没有为成功打下基础。