首页 » 博客 » 但我们仍然面临两个关键领域的挑战

但我们仍然面临两个关键领域的挑战

以现在或将来可用的方式存储数据是困难且昂贵的
仅在静态时存储数据会限制未来支持实时用例的灵活性
第一个挑战可以追溯到我们需要挑战自然本身。为了让数据可供商业消费者使用,数据需要结构化,这就是为什么数据仓库及其特定于业务的数据集市坚持其关键业务角色的原因。要结构化数据,我们必须对目的做出决定。没有目的的数据在结构中没有一席之地。

之前 成为 的可行替代方案中

在从源检索数据时会决定哪些数据有用途,因为只有 肯尼亚手机号码数据 有目的的数据才会被检索、转换和存储。然而,在许多情况下,基于 的数据管道的构建充其量只是很少考虑未来的可重用性,最坏的情况是临时设计以满足孤立的功能需求。由于批处理的级联效应,在许多情况下数据管道非常脆弱,一个组织中的某些数据管道完全或部分冗余、对派生值应用不同 增强联络中心运营 的转换或随着业务需求的不断发展而未经正式退役就被废弃的情况并不少见。随着来源的变化或清除一定年限的数据,未从源检索的数据会随着时间的推移而丢失。

然后,可以根据业

数据湖的兴起及其接受无结构数据的能力 线数据库 使我们能够将顺序从 切换到 ,并在进行任何转换之前直接加载到数据湖中。 务需求随意转换数据湖中的静态数据。由于可以从源中提取所有可用数据,因此理论上不会丢失任何数据。不幸的是,正如经常发生的那样,将理论转化为实践变得混乱,大量以原始形式进入数据湖的数据导致许多组织无法对数据进行合规性审计,也无法在未来需要时根据其来源和发起时间访问这些数据。这导致许多组织的数据几乎无法使用 数据沼泽。

滚动至顶部