1、是一个文件系统。相比较WinXP,它可以同时利用多台机器。
2、装WinXP,1个WinXP系统你只能装在一台机器上。而1个Hadoop系统可以装在一台机上,也可以装在很多机器上。
3、用WinXP保存一个文件,肯定就保存在一台机器上,而Hadoop就不同,一个文件可能会被拆成很多份,分别放在不同的机器上,而你通过Hadoop不需要知道他们具体存到哪里,可以象WinXP下一样访问1个文件。
4、安装WinXP只需要1台标准的个人电脑做为它的底层需求,而Hadoop还需要Linux系统+JAVA做为它的底层需求。
5、WinXP有个漂亮的操作界面,非富的其它功能,一般用户都可以很方便的使用它;而Hadoop没有这些,很多功能都要通过敲命令,甚至写代码才能使用它。

hadoop是什么?
hadoop是一个平台,是一个适合大数据的分布式存储和计算的平台。什么是分布式存储?这就是后边我们要讲的hadoop核心之一HDFS;什么是分布式计算?这是我们后边要讲的hadoop另外一个重要的核心MapReduce。

hadoop的优点一:低成本
hadoop本身是运行在普通PC服务器组成的集群中进行大数据的分发及处理工作的,这些服务器集群是可以支持数千个节点的。

hadoop优点二:高效性
这也是hadoop的核心竞争优势所在,接受到客户的数据请求后,hadoop可以在数据所在的集群节点上并发处理。

hadoop优点三:可靠性
通过分布式存储,hadoop可以自动存储多份副本,当数据处理请求失败后,会自动重新部署计算任务。

hadoop优点四:扩展性
hadoop的分布式存储和分布式计算是在集群节点完成的,这也决定了hadoop可以扩展至更多的集群节点。

hadoop安装方式|hadoop部署方式
hadoop安装方式只有三种:本地安装;伪分布安装;集群安装。后期我们会专题进行讲解。

你学hadoop的动机是什么?只是玩玩而已么。还是想从事这方面。
如果是后者,那么不学linux那就是个笑话,hadoop,直白点来说是多个主机来做一个存储或数据库,你不学习linux怎么配置各个linux的环境?怎么控制他的负载均衡?

HDFS是分布式文件系统,说通俗点就是用的存储的数据库,是hadoop的核心组件之一,其他还有mapreduce,yarn。

Hadoop核心设计:HDFS和MapReduce,我们首先要分配好这些零件。大数据时代我们面临的是以TB、PB甚至EB为单位的数据。因此,我们需要建立一个既能存的下如此大量的数据,而且还能高速高效地读写文件的文件管理系统——HDFS。HDFS也就是Hadoop分布式文件系统,将一份巨型的文件分散到多台存储设备中,并配合一个调度程序来管理这些文件。

个人理解:一个分布式文件存储系统+一个分布式计算框架,在其上还有很多的开源项目来丰富他的功能,如Hbase,hive等等