当前位置:首页 > 影视动漫 >

大数据计算模式主要有几种(大数据计算模式有哪些)

来源:原点资讯(m.360kss.com)时间:2023-10-26 05:55:55作者:YD166手机阅读>>

大数据架构平台通常由多个组件构成,每个组件负责处理不同的任务和功能。

以下是大数据架构平台的常见组件架构以及各组件的功能。

1. 数据集成
  • 数据采集:负责从各种数据源(例如传感器、日志文件、数据库)中收集数据,并将其转换为可处理的格式。
  • 数据提取、转换和加载(ETL):执行数据清洗、转换和加载操作,以将数据从源系统提取到目标数据存储中。

开源日志收集系统有 Sqoop、Flume、Logstash、Filebeat、Vector 等,其中 Flume 在云原生场景用得多。

大数据分析不能直接在原始的业务数据库上直接操作,所以需要抽取想要的数据到分析数据库或者分布式存储系统(例如 HDFS),常见数据抽取工具包括:DataX、FlinkCDC、Canal、Maxwell、BitSail 等 。

2. 数据存储与计算

数据存储

  • 分布式文件系统:提供可扩展的、高容错性的存储系统,如Hadoop分布式文件系统(HDFS)。
  • 分布式数据库:用于存储和管理大规模数据集的数据库,如Apache HBase、Cassandra等。
  • 数据仓库:用于集中存储和管理结构化数据的系统,支持复杂查询和分析,如Apache Hive、Apache Doris等。
  • 内存数据库:将数据存储在内存中以加快查询和分析速度,如Apache Ignite、MemSQL等。
  • 数据湖:用于存储原始、半结构化和非结构化数据的大规模存储库,如Apache Iceberg、Apache Hudi等。

计算引擎 - 流式计算和离线批计算是大数据处理中两种常见的计算模式,它们在数据处理方式、应用场景和实时性要求上有所区别。

流式计算是指实时处理连续的数据流,即按照数据的到达顺序逐条处理数据。数据以流的形式进入系统,系统对每条数据进行即时处理和分析,并输出结果。

流式计算的常见框架和工具包括:Apache Flink、Apache Storm、Apache Spark Streaming等,大部分公司都在用 Flink。

大数据计算模式主要有几种,大数据计算模式有哪些(1)

离线批计算是指对大规模数据集进行批量处理和分析。数据按批次进行处理,即将数据集划分为固定大小的批次,批次内部并行处理,而不要求实时性。

离线批计算的常见框架和工具包括:Apache Hadoop MapReduce、Apache Spark、Apache Hive、Apache Pig等。

3. 分布式调度
  • 分布式资源管理器:管理和分配集群中的计算资源,如Apache YARN、Apache Mesos等。
  • 作业调度器:调度和协调各种作业和任务的执行,如Apache DolphinScheduler、Apache Oozie、Apache Airflow等。
4. 数据查询

OLAP(Online Analytical Processing)是一种用于查询和分析大规模数据集的技术。它提供了灵活的、交互式的数据查询和分析功能,用于支持复杂的多维分析和决策支持系统。

常见的OLAP查询分析工具和平台包括:Impala、Presto、ClickHouse、Doris等。

大数据计算模式主要有几种,大数据计算模式有哪些(2)

实时查询是指对实时数据进行即时查询和获取结果的操作。与批处理查询相比,实时查询要求查询结果能够在较短的时间内返回,并且能够满足对数据的实时性需求。

常见的实时查询工具和平台包括:HBase、Kylin、Druid、TiDB、Doris等。

大数据计算模式主要有几种,大数据计算模式有哪些(3)

以上是大数据架构平台的常见组件,每个组件都有其特定的功能和用途。这些组件协同工作,以构建一个可靠、可扩展且高性能的大数据处理平台,用于数据集成、存储、计算、调度和查询分析。具体的架构设计和组件选择会根据应用场景和需求的不同而有所差异。

栏目热文

大数据模型定理(大数据计算的四种模型)

大数据模型定理(大数据计算的四种模型)

谈起大数据技术,很多人都觉得是高大上的一门技术,学起来应该是困难重重!其实对于大数据技术而言,难的不是大数据技术本身,...

2023-10-26 05:59:08查看全文 >>

大数据的典型计算模式(大数据计算模式有哪些)

大数据的典型计算模式(大数据计算模式有哪些)

最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要...

2023-10-26 05:58:54查看全文 >>

大数据计算体系的三个基本层次(大数据计算三个基础层次)

大数据计算体系的三个基本层次(大数据计算三个基础层次)

一、大数据的三个层次和核心解读(一)三个层次和核心我们将大数据分为三个层次。一是容量很大的数据,比如两个仓库都堆满了很多...

2023-10-26 05:43:53查看全文 >>

大数据计算模式4种的用处(大数据转换操作有哪些)

大数据计算模式4种的用处(大数据转换操作有哪些)

数据与人工智能:共同推动创新与发展数据和人工智能技术的结合,是一次彻底的创新。数据作为新的生产要素,与人工智能技术的生产...

2023-10-26 05:49:15查看全文 >>

大数据计算模式总结(大数据的计算框架有哪几类)

大数据计算模式总结(大数据的计算框架有哪几类)

大数据要实现业务落地的前提,是企业需要搭建起自身的大数据平台,去实现对数据价值的挖掘和应用。根据实际的业务场景需求,不同...

2023-10-26 05:38:30查看全文 >>

什么叫大数据算法(大数据和算法有什么区别)

什么叫大数据算法(大数据和算法有什么区别)

大数据算法是指用于处理大规模数据集的算法。大数据算法通常包括分布式计算、并行计算和数据挖掘算法。一些典型的大数据算法包括...

2023-10-26 05:45:37查看全文 >>

大数据计算模式有哪些(大数据计算框架有哪些)

大数据计算模式有哪些(大数据计算框架有哪些)

本文节选自华高莱斯“技术要点”系列丛书《产业新赛道之生活性服务业》作者 | 焦星宇要想服务生活,先让数据向善1. 大数据...

2023-10-26 05:47:58查看全文 >>

大数据计算模型特点实例(大数据的五大模型)

大数据计算模型特点实例(大数据的五大模型)

一、引言在信息科技日新月异的今天,大数据已经成为了我们分析问题、做出决策的重要工具。而模型和算法,则是大数据的核心技术。...

2023-10-26 05:52:44查看全文 >>

大数据分析是通过什么(大数据分析有哪些特点)

大数据分析是通过什么(大数据分析有哪些特点)

随着生产消费领域的技术革新,一物一码进入了人们的视野范围,不管是品牌方、生产企业或者是消费者,或多或少听说过一物一码,那...

2023-10-26 05:44:43查看全文 >>

大数据计算是干什么的(计算机与大数据是干什么的)

大数据计算是干什么的(计算机与大数据是干什么的)

最近这些年关于大数据技术只可以说是一个特别火热的话题,那么到底什么是大数据呢?大数据技术是指处理、管理和分析大规模数据集...

2023-10-26 05:45:08查看全文 >>

文档排行