原创 大数据教程(一)—— Hadoop集群坏境搭建配置

关于大数据的概念或者架构一直在各方争议的背景下持续的存在着。目前,关于大数据项目可以真正被落地实施的解决方案就是:Hadoop为核心的的一些列开源分布式解决方案。

2017-04-21 10:13:10.000
原创 自己构建Hadoop大数据环境?请小心这三大陷阱

自己构建自己构建Hadoop大数据环境似乎是一个很经济实惠的选择,但是如果不注意以下三大陷阱,你可能会栽一个大跟头。

2017-03-09 16:28:18.000
原创 基于Hadoop的数据仓库Hive 基础知识

Hive是基于Hadoop的数据仓库工具,可对存储在HDFS上的文件中的数据集进行数据整理、特殊查询和分析处理,提供了类似于SQL语言的查询语言–HiveQL,可通过HQL语句实现简单的MR统计,Hive将HQL语句转换成MR任务进行执行。

2017-03-06 11:54:27.000
转帖 2017大数据十大趋势:海量数据汹涌而来,Hadoop不再一家独大

2017年大数据将不再是Hadoop一家独大,也不再是编程者们的自娱自乐,企业和终端用户的不断涌入,海量数据“堆积如山”,随之而来的储存、分析、处理成为从业者的下一挑战。

2017-02-22 09:23:58.000
转帖 专家解读:企业如何进入大数据行业?

大数据产业是中国未来的希望,是未来的朝阳行业,但各个企业不要过于冒进,进入这个产业的企业必须了解这六个问题,找到解决这六个问题的方法,以技术和数据为基础,才能够创造价值,通过大数据这个工具帮助和推动传统产业发展。

2016-11-30 09:27:13.000
原创 Hadoop生态圈以及各组成部分的简介

Hadoop是什么?适合大数据的分布式存储与计算平台;HDFS: Hadoop Distributed File System分布式文件系统;MapReduce:并行计算框架

2016-11-24 09:51:36.000
原创 关键七步,用Apache Spark构建实时分析Dashboard

本文我们将学习如何使用Apache Spark streaming,Kafka,Node.js,Socket.IO和Highcharts构建实时分析Dashboard。

2016-11-23 10:48:17.000
转帖 2017年关于数据科学的六大预言

麦肯锡2013年出版了一份特别的报告,预言全球商业界将会感觉到下一个十年数据科学专业人士的紧缺,尤其是善于从大量静态和动态(实时)数据中发现有价值的情报的数据分析师,缺口达150万。这个预言现已成真

2016-11-16 09:47:10.000
转帖 Hadoop和大数据:60款开源工具

在接下来几年,“100%的大公司”会采用Hadoop。Market Research的一份报告预测,到2011年,Hadoop市场会以58%的年复合增长率(CAGR)高速增长;到2020年,市场产值会超过10亿美元。IBM更是非常看好开源大数据工具,派出了3500名研究人员开发Apache Spark,这个工具是Hadoop生态系统的一部分。

2016-11-07 09:47:37.000
转帖 流式大数据实时处理—技术、平台及应用

CNCC 2016在山西太原盛大开幕,开幕演讲中,CCF会士、中国工程院院士、浙江大学陈纯教授做了题为“流式大数据实时处理技术、平台及应用”的报告,以下为报告内容精编。

2016-10-24 10:06:29.000
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP