大数据分析工具有哪些
1、hadoop
hadoop是一个开源框架,它允许在整个集群使用简单编程模型计算机的分布式环境存储并处理大数据。它的目的是从单一的服务器到上千台机器的扩展,每一个台机都可以提供本地计算和存储。
2、druid
druid是实时数据分析存储系统,java语言中好的数据库连接池。druid能够提供强大的监控和扩展功能。
3、ambari
大数据平台搭建、监控利器;类似的还有cdh
提供hadoop集群
ambari为在任意数量的主机上安装hadoop服务提供了一个逐步向导。
ambari处理集群hadoop服务的配置。
管理hadoop集群
ambari为整个集群提供启动、停止和重新配置hadoop服务的中央管理。
监视hadoop集群
ambari为监视hadoop集群的健康状况和状态提供了一个仪表板。
4、spark
大规模数据处理框架(可以应付企业中常见的三种数据处理场景:复杂的批量数据处理(batch data processing);基于历史数据的交互式查询;基于实时数据流的数据处理,ceph:linux分布式文件系统。
5、storm
storm是一个免费开源、分布式、高容错的实时计算系统。storm令持续不断的流计算变得容易,弥补了hadoop批处理所不能满足的实时要求。storm经常用于在实时分析、在线机器学习、持续计算、分布式远程调用和etl等领域。storm的部署管理非常简单,而且,在同类的流式计算工具,storm的性能也是非常出众的。
大数据分析工具可以很好的提高工作效率,让工作内容更完善,想学习大数据分析的,大数据分析工具一定要掌握好哦!<
南京兄弟连IT培训学校