标签目录:hadoop

以下是与标签 “hadoop” 相关联的文章

实时计算,流数据处理系统简介与简单分析

一. 实时计算的概念 实时计算一般都是针对海量数据进行的,一般要求为秒级。实时计算主要分为两块:数据的实时入库、数据的实时计算。 主要应用的场景: 1) 数据源是实时的不间断的,要求用户的响应时间也是实时的(比如对于大型网站的流式数据:网站的访问PV/UV、用户访问了什么内容、搜索了什么内容等,实时的数据计算……

HDFS+MapReduce+Hive快速入门

HDFS+MapReduce+Hive十分钟快速入门 1.     前言 本文的目的是让一个从未接触Hadoop的人,在很短的时间内快速上手,掌握编译、安装和简单的使用。 2.     Hadoop家族 截止2009-8-19日,整个Hadoop家族由以下几个子项目组成: 成员名 用途 备注 Hadoop Common Hadoop体系最底层的一个模块,为Hadoop各子项目提供各种……

storm 例子 记录

Storm源码浅析之topology的提交 http://www.blogjava.net/killme2008/archive/2011/11/17/364112.html 基于storm的实时GPS数据客流特征分析系统 http://blog.sina.com.cn/s/blog_5ca749810101ceqz.html Storm实现实时feed信息处理 http://macrochen.iteye.com/blog/1389305 http://www.datasalt.com/2012/01/real-time-fe……