某某机械设备有限公司欢迎您!

赢咖2平台 大数据预测:2020年将带来什么

时间:2020-02-12

  每到岁末年初,行业专家就会对未来一年的技术发展进行预测,而如今,一切始于大数据问题关键的方面:数据本身。

  Haoyuan Li说:“关于Hadoop消亡的说法很多。但是Hadoop生态系统还有后起之秀。诸如Spark和Presto之类的计算框架可从数据中获取更多价值,并已被更广泛的计算生态系统所采用。Hadoop存储(HDFS)由于其复杂性和成本以及由于与HDFS保持联系,而从根本上无法弹性扩展因此导致消亡。为了获得实时见解,用户需要云中可用的即时和灵活的计算能力。HDFS中的数据将迁移到优化和具成本效益的系统,无论是云存储还是本地对象存储。HDFS将会消亡,但是Hadoop计算将持续存在并且越来越强大。”

  Nair说:“在过去的10年中,我们看到了Hadoop的兴起、平稳发展和终结的开始。这不是因为大数据已经死亡。恰恰相反,几乎每个组织都在致力于成为大数据公司。这是在当今商业环境下运作的要求。数据已经变得如此庞大,而且对这种数据的灵活性需求如此之大,然而,很多企业或者正在构建自己的数据池或数据仓库,或者直接进入云平台。赢咖2【多彩联盟】随着2020年这一趋势的加速,我们将看到Hadoop的应用继续下降。”

  Sharp说:“数据的生成速度是许多企业无法跟上的。这不仅增加了这种复杂性,企业还从难以移动和有效利用的多个位置处理有用却不实用的数据。这给企业带来了一个数据引力问题,这将阻止数字化转型计划向前推进。在2020年,我们将看到企业通过将应用程序更靠近数据源而不是将资源传输到中央位置来解决数据引力问题。通过本地化数据流量、分析和管理,企业将更有效地控制其数据并扩展数字业务。”

  Vance说,“随着企业创建新的数据池,开发更好的技术来理解研究结果,我们将看到人工智能前所未有的真正价值。目前,企业使用的内部数据不到所有数据的20%,但通过新的人工智能功能,剩下的80%未开发的数据将是可用的,并且更容易理解。先前无法解决的问题将有显著的改善,有助于推动行业和社会的巨大变革。”

  Kleinfeld说:“到2020年,随着数字转型推动企业大规模进行实时数据分析和决策,内存技术的采用将继续飙升。假设从一架飞机上的传感器收集实时数据,以监控性能,并且希望为单台发动机开发预测性维护功能。现在必须将实时数据流中的异常读数与数据池中存储的特定引擎的历史数据进行比较。目前,一种经济有效的方法是使用内存中的数据集成中心,它基于一个内存计算平台,比如集成了Apache Spark、Apache Kafka,而像Hadoop这样的DataLake存储随着数据集成中心在企业中的不断扩展,2020年有望成为采用内存计算的关键一年。”

  Wright说,“根据世界经济论坛的预测,到2020年,人类产生的数据量将达到惊人的44ZB。大数据的前景绝不仅仅来自于拥有更多的数据以及更多的数据来源,而是通过开发分析模型来更好地洞察这些数据。所有的工作都是为了推进分析、人工智能和建模语言的工作,如果企业没有一个能够访问、集成、清理和管理所有这些数据的数据管理程序,这一切都是不可取的。”

  Fan说:“随着数据中心应用程序需求的增加以及处理速度的提高,将大力推动以内存为中心的数据中心。计算创新的发展日新月异,越来越多的计算技术从x86到GPU再到ARM。这将继续在CPU和内存单元之间开辟新的拓扑。尽管当前在计算层和存储层之间架构往往会更加分散,但我相信很快就会走向以内存为中心的数据中心。”

  Perry说:“每个组织都有数据孤岛,这些数据被收集起来,但不再(或可能永远不会)用于商业目的。虽然存储数据的成本大幅下降,但存储数据的风险溢价却大幅上升。这些暗数据可能包含必须公开和保护的个人信息。它可能包括受数据主体访问请求限制的信息和可能需要删除的信息,但如果人们不知道它在哪里,则无法满足法规的要求。尽管如此,这些数据也可以提供一些洞察力,为推动业务增长开辟新的机遇。将其置于暗数据中会增加风险,可能会掩盖机会。各组织将把新的重点放在照亮其暗数据上。”

  Ranganathan说:“十年前,开源数据库在市场上的份额为零,而现在已超过7%。很明显,其市场正在发生变化,到2020年,对真正开源的承诺将会增加。这与数据库和数据基础设施公司放弃其部分或全部核心项目的开源许可证的最新趋势背道而驰。但是,随着技术的飞速发展,切换到100%开放源代码模型将是数据库提供商的大利益,因为免费增值模型需要花费更长的时间才能使软件成熟到与真正的开放源代码相同的水平。”

  Borthakur说,“由于公共云已经完全改变了软件交付和货币化的方式,我预测,到2020年,开放式采购新的破坏性数据技术的时间将结束。现有的开源软件将继续运转,但是建设者或用户没有动力选择开源而不是开放服务来提供新的数据产品。具有讽刺意味的是,易用性推动了开源浪潮,并且易于采用开放服务,这将导致开放源代码的消亡,尤其是在数据管理等领域。就像过去十年是开放源代码基础设施的时代一样,未来十年属于云中的开放服务。”