跳到内容

拥有的数据

据一篇被广泛引用的报道Gartner的研究在美国,85%的人工智能(AI)项目会产生错误的结果。Gartner断言,原因通常在于源数据的问题。这引发了几个显而易见的问题。好的数据究竟是什么?公司和组织应该如何捕捉和管理这些数据?

George Von Zedwitz-Liebenstein是我们“未来说”第一个系列采访人工智能领域领先专业人士的最后一位嘉宾,他很有资格提供答案。作为全球商用车制造商斯堪尼亚(Scania)金融服务部门的信息和分析主管,他走在出行革命的前沿。联网汽车的出现正在产生大量潜在有价值的数据,而人工智能是斯堪尼亚实现真正可持续交通系统愿景的核心。因此,该公司为大数据和人工智能做好事的力量提供了又一个生动的例证。

乍一看,用专注于为AI构建正确基础的讨论来结束第一个系列似乎有点不合逻辑。事实上,对冯·塞德维茨-利本斯坦的采访在很大程度上扩展了之前发生的事情。我们所有的客人都强调了交货的必要性,而不是野心勃勃。在所有围绕人工智能的宣传中,他们也强调了人类维度的重要性。

Von Zedwitz-Liebenstein坚持认为,对于任何新兴的人工智能和数据驱动策略来说,最重要的任务是建立一个坚实的基础。要反映高德纳研究的结果,这就意味着要提供好的数据。实现这一目标既是技术问题,也是态度问题。

他将数据质量描述为一项团队运动。创造是绝对的首要任务明确数据所有权确保数据产品心态渗透到整个组织。在建立一个数据驱动型公司的过程中,一个常见的陷阱就是把一个巨大的、全企业范围的数据湖当成垃圾场。这一策略通常无法实现其预期的收益,主要是因为所有权问题尚未解决。

更有效的解决方案是给数据团队端到端的责任来制作数据可用。只有建立清晰和透明的数据产品所有权,它对更广泛的组织的价值才会变得明显和容易利用。通过在数据和所有者之间建立这些关系,解决诸如隐私、敏感性和数据保护等关键问题也会变得简单得多。

Von Zedwitz-Liebenstein对数据所有权的态度也反映了他对未来的期望。他相信,数据网格的出现将是这个领域的决定性趋势之一。基本上,这意味着应用微服务方法;取代缓慢、不灵活、反应迟钝的数据湖和管道,组织将寻求创建更易于管理的数据产品,这些产品可以由其终身所有者快速独立地部署。换句话说,利用数据的速度和易用性是我们最初的问题的核心:什么是好的数据?

早在2016年,IBM估计这些糟糕的数据每年给美国经济造成3万亿美元的损失。无论这一说法的真实性如何——以及它在过去五年中可能发生了多大的变化——毫无疑问,企业和组织对数据重要性的认识往往无法与它们有效利用数据的能力相匹配。正如冯·塞德维茨-利本斯坦所强调的那样,他们很可能只是没有为成功打下基础。

看乔治的整个采访在这里并捕捉过去和未来的情节的未来说在这里