Hadoop教程

Hadoop是一个用Java编写的Apache开源框架，允许使用简单的编程模型跨计算机集群分布式处理大型数据集。

Hadoop框架工作的应用程序在跨计算机集群提供分布式存储和计算的环境中工作。

Hadoop旨在从单个服务器扩展到数千个机器，每个都提供本地计算和存储。

Hadoop - 简介

Hadoop可运行于一般的商用服务器上，具有高容错、高可靠性、高扩展性等特点

特别适合写一次，读多次的场景

HDFS: 分布式文件存储
YARN: 分布式资源管理
MapReduce: 分布式计算
Others: 利用YARN的资源管理功能实现其他的数据处理方式。这些是其他Hadoop模块所需的Java库和实用程序。这些库提供文件系统和操作系统级抽象，并包含启动Hadoop所需的Java文件和脚本。

内部各个节点基本都是采用Master-Woker架构

本教程面向希望使用Hadoop Framework了解大数据分析基础知识的专业人士，并成为Hadoop开发人员。软件专业人员，分析专业人员和ETL开发人员是本课程的主要受益人。

在开始执行本教程之前，我们假设您先前已经了解过Core Java，数据库概念和任何Linux操作系统版本。

转载本站内容时，请务必注明来自W3xue。
部分原创内容未经授权禁止转载，违者必究。

W3xue 的所有内容仅供测试，对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们 | 意见建议 | 捐助我们 | 报错有奖 | 广告合作、友情链接（目前9元/月）请联系QQ：27243702 沸活量
皖ICP备17017327号-2