没有找到合适的产品?
联系客服协助选型:023-68661681
提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
转帖|行业资讯|编辑:郝浩|2016-06-15 10:47:32.000|阅读 170 次
概述:本文阐述了为什么比起Hadoop之类的知名技术,类似Apache Storm这样的系统更加有用。
# 界面/图表报表/文档/IDE等千款热门软控件火热销售中 >>
让我们以经典的笔记本品牌实时情感分析(SENTIMENT ANALYSIS)为例,在进行观点分析时,处理流程应当如下图所示:
现在的问题在于:是否能够通过大数据系统来解决,请使用Hadoop来执行下列处理:
如果我们运行Hive Query、Pig Script或MapReduce的话,由于必须从HDFS(从硬盘读取)中读取数据,整个处理过程需要耗费数小时才能进行处理,因此理论上来说是无法实时执行数据处理的(它们遵循静态数据原则)。
由于Hadoop设计时就是为了执行批处理,而且需要花费数小时才能生成结果,因此针对Hadoop是否能够执行实时处理的问题,答案是否定的。
总结一下,由于所使用的是基于批处理的方式,Hadoop无法解决实时问题。
有很多需要我们执行实时数据处理的用例,比如:
那么现在我们如何处理这类特殊的问题呢?我们需要使用一些实时的流数据机制(一切都在内存中完成,遵循动态数据原则)。
实时处理的典型流程如下图:
不过想要使用这种方法,需要先解决下面这些问题:
有一些类似Apache Storm之类的实时数据流机制能够帮助我们解决这些问题。现在我们试着回答上面的问题,看使用Apache Storm能否得出答案。
数据以元组的形式发送。
Storm是一个分布式平台,允许用户将更多节点添加到Storm集群运行环境中,以增加应用的吞吐量。
在Storm中,工作是通过集群中的worker来执行的。如果有一个worker宕掉,Storm就会重启该worker,而如果worker所在的节点也宕掉,则Storm就会重启集群中一些其他节点上的worker。
Storm如果该元组在处理时出现故障,Storm会重启出错的元组。
可以在任何编程语言中编写。即使Storm平台运行在JVM之上,运行在上面的应用也可以用任何编程语言编写,可以使用标准的I/O来读写。
希望本文有助于澄清:利用Apache Storm之类的工具处理大数据问题时,在实时流数据中的使用问题。
本文译者Vera,原文:Use Cases for Real Time Stream Processing Systems
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@evget.com
在企业信息化进程加速的今天,资源调度与任务管理已成为ERP系统中的关键模块。通过本案例,可以了解如何借助 DHTMLX Scheduler 实现更智能的任务分配与资源规划。
部署一套产线级MES系统,以打通生产现场“最后一公里”的数据链,实现高效生产管理与高质量交付。
HOOPS 3D Graphics System(HOOPS/3DGS)是一款高性能的三维图形工具包,专为Windows、UNIX操作系统以及互联网应用程序的开发人员设计。
随着企业级软件测试方案Parasoft C/C++test的深度引入,Stellantis的测试流程迎来了颠覆性变革——通过IDE深度集成与实时反馈机制,不仅打破了开发与测试的协作壁垒,更将测试左移接受度从30%提升至90%。这一转型如何实现?让我们一探究竟。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@evget.com
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢
慧都科技 版权所有 Copyright 2003-
2025 渝ICP备12000582号-13 渝公网安备
50010702500608号