分类
计算机

Hadoop

Hadoop怎么读

Hadoop怎么发音

[hʌˈdu:p] 或 [həˈduːp]

Hadoop是什么意思

Apache Hadoop 是一组开源软件实用程序,有助于使用由多台计算机组成的网络来解决涉及大量数据和计算的问题。它提供了一个使用 MapReduce 编程模型对大数据进行分布式存储和处理的软件框架。 Hadoop 最初是为由商品硬件构建的计算机集群而设计的,目前仍然普遍使用。此后,它也被用于高端硬件集群。 Hadoop 中的所有模块的设计都基于一个基本假设,即硬件故障是常见的,应该由框架自动处理。

Apache Hadoop 的核心由称为 Hadoop 分布式文件系统 (HDFS) 的存储部分和作为 MapReduce 编程模型的处理部分组成。 Hadoop 将文件拆分成大块并将它们分布在集群中的节点之间。然后它将打包的代码传输到节点以并行处理数据。这种方法利用了数据局部性,节点在其中操作他们有权访问的数据。与依赖并行文件系统的更传统的超级计算机架构相比,这使得数据集的处理速度更快、效率更高,在并行文件系统中,计算和数据通过高速网络分布。

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注