转帖 Apache Spark 2.0正式版发布下载

Databricks官网的发布:自7月26日起Databricks开始提供Apache Spark 2 0的下载,这个版本是基于社区在过去两年的经验总结而成,不但加入了用户喜爱的功能,也修复了之前的痛点。

2016-08-02 09:34:33.000
转帖 大数据告诉你互联网到底有多大?完全超出你想象!

大数据告诉你互联网到底有多大?完全超出你想象!

2016-07-28 10:10:40.000
转帖 大数据在医疗卫生领域的应用:减少成本,改善效果

对医疗数据数字化及数据共享的标准化和倡导,改进并降低数据存储成本,并能够在商业硬件上运行,这些都促成了大数据在医疗行业的应用,并以更低的成本获得更好的医疗卫生服务为目标。

2016-07-27 09:39:50.000
转帖 Hadoop、Spark、HBase与Redis的适用性讨论

最近在网上又看到有关于Hadoop适用性的讨论。想想今年大数据技术开始由互联网巨头走向中小互联网和传统行业,估计不少人都在考虑各种“纷繁复杂”的大数据技术的适用性的问题。

2016-07-27 09:21:17.000
转帖 解决Hadoop和Spark本地版本库不统一的问题

就是报以下这个警告的,也不知道对运行程序究竟会产生什么样的影响,但看着就是不爽,还耽误了我几天时间,把它给解决了,这里记一下,方便以后查找。

2016-07-26 09:55:46.000
原创 SPSS Modeler决策树算法比较

SPSS Modeler包含了多种决策树算法,包括C5.0、CHAIN、QUEST、C&R和决策列表,他们都可以通过构建树来生成分类规则。那么他们在使用过程中到底有些什么样的区别呢?

2016-07-22 10:46:44.000
转帖 收藏 | “大数据”学习资源(上)

当前,整个互联网正在从IT时代向DT时代演进,大数据技术也正在助力企业和公众敲开DT世界大门。当今“大数据”一词的重点其实已经不仅在于数据规模的定义,它更代表着信息技术发展进入了一个新的时代,代表着爆炸性的数据信息给传统的计算技术和信息技术带来的技术挑战和困难,代表着大数据处理所需的新的技术和方法,也代表着大数据分析和应用所带来的新发明、新服务和新的发展机遇。

2016-07-20 09:23:09.000
原创 干货分享:SparkBench--Spark平台的基准性能测试

SparkBench的测试项目覆盖了Spark支持的四种最主流的应用类型,即机器学习、图计算、SQL查询和流数据计算。每种类型的应用又选择了最常用的几个算法或者应用进行比对测试,测试结果从系统资源消耗、时间消耗、数据流特点等各方面全面考察,总体而言是比较全面的测试。

2016-07-19 09:49:05.000
转帖 BigInsights金刚钻之首:BigSQL - SQL on Hadoop

从NoSQL到NewSQL,新技术的发展极大拓展了数据查询的应用场景:支持半结构化数据(JOSON)、非结构化数据的高效率读写和查询等。而在此过程中经典的SQL技术仍旧在发挥着无可替代的作用,在Hadoop的世界中也必将占据一席之地。

2016-07-12 10:14:35.000
原创 搭建企业级大数据分析平台也可以很简单!

对于大数据分析平台的建设,往往不是某个产品就能够满足,而是需要多种不同的产品一起搭建。例如,搭建大数据平台需要大规模数据存储平台,需要数据处理和挖掘工具,分析结果需要通过展现工具体现大数据分析的价值。所以,没有一个完善的BigData生态系统,大数据分析平台是搭建不起来的。

2016-07-12 09:41:34.000
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP