发布时间:2025-05-10 07:01:34 分类:公司动态 浏览:

今天是大数据专题的最后一篇,来讲讲数据湖仓。█?为什么会有“数据湖仓”?前面我们提到,数据仓库出现于 1990 年代,主要基于 MPP(Massively Parallel Processing,大规模并行处理)或者关系型数据库实现,用于公司做数据存储、处理和分析,发展数据看板、BI(商业智能)等用途。而数据湖,出现于 2010 年代,主要基于大数据技术(Hadoop 等)生态,用于支撑多样化的数据存储,实时性更强,适合满足批处理、流式计算等业务场景。数据仓库的特点是,先做数据处理,搞得规范整齐之后,存起来。用的时候就直接用。它主要存的是结构化(行列)数据。数据湖的特点是,什么数据(结构化、非结构化、半结构化)都能存,不做预处理,先全部都存起来,等要用的时候,再处理。两种技术,各有优缺点:从成本的角度来看,数据湖的起步成本很低,但随着数据体量的增大,成本会迅速飙升。而数据仓库恰好相反,前期建设开支很大,后期成本增加趋缓。数据仓库和数据湖,都是基于数据进行价值挖掘,只是侧重点不同。对于公司来说,两者都有价值,所以,会选择同时建设。很显然,这不仅导致了高昂的建设投资成本,也使得数据存在冗余和重复。基于以上种种原因,业界就开始思考:是不是可以将数据仓库和数据湖进行结合,充分发挥两者的优势,弥补各自的缺陷呢?于是,就有一些服务商,开始研究如何将两者的能力进行“打通”。主要思路包括两种:一种是让数据仓库支持对数据湖的访问。还有一种,是让数据湖具备数据仓库的一些能力。前者比较有代表性的,是 2017 年 Redshift 推出的 Redshift Spectrum。它支持 Redsift 数据仓库用户访问 AWS S3 数据湖的数据。后者有代表性的比较多,包括 2017 年 Hortonworks 孵化出的 Apache Atlas 和 Ranger 项目,2018 年 Nexflix 开源的内部增强版本元数据服务系统 Iceberg。2018-2019 年,Uber 和 Databricks 相继推出了 Apache Hudi 和 DeltaLake,推出增量文件格式,用以支持 Update / Insert、事务等数据仓库功能。所有这些尝试和努力,都多多少少存在一些缺陷(数据仓库和数据湖存在本质的区别,整合难度很大),并不算成功。2020 年,数据智能独角兽公司 Databricks(没错,就是提出 Delta Lake 的那个公司,数据湖的代表公司)正式提出了数据湖仓(Data Lakehouse)概念。Databricks 联合创始人兼首席执行官阿里?戈德西(Ali Ghodsi)表示:“从长远来看,所有数据仓库都将被纳入数据湖仓,这不会在一夜之间发生 —— 这些东西会共存一段时间 —— 在价格和性能上,数据湖仓完胜数据仓库。”数据湖仓,也被称为湖仓一体。2021 年,“湖仓一体”首次被写入 Gartner 数据管理领域成熟度报告。2023 年 6 月,大数据技术标准推进委员会发布了《湖仓一体技术与产业研究报告(2023 年)》。这一年的 6 月 26 日,“湖仓一体”在中国大数据产业发展大会上成功入选“2023 大数据十大关键词”。█ 数据湖仓的主要特点数据湖仓(湖仓一体),说白了,就是一种将数据仓库和数据湖打通的新型开放式架构。它既具备数据湖的灵活性,也具备数据仓库的高性能及管理能力,为公司进行数据治理带来了更大的便利和更高的效率。在数据湖仓的底层,支持多种数据类型并存,能实现数据间的相互共享。在数据湖仓的上层,可以通过统一接口进行访问,可同时支持实时查询和分析。数据仓库和数据湖这两套体系相互打通之后,数据可以在两者之间自由流动。也就是说,数据湖里的“新鲜”数据(热数据),可以流到数据仓库里,直接被数据仓库使用。而数据仓库里的“不新鲜”数据(冷数据),也可以流到数据湖里,低成本长久保存,供未来使用。数据湖仓的特点,其实就是数据仓库的优点 + 数据湖的优点。在数据存储方面,继承了数据湖的优势,支持多样化数据,且以 HDFS 或云对象存储为基础,实现了低成本、高可用。数据以原始格式或开放文件格式(如 Parquet、ORC)存储,具备高效的压缩比与列存储特性,方便查找。开放文件格式,也保障了数据在不同计算引擎间的通用性。数据湖仓同样支持 Iceberg、Hudi、Delta Lake 等开放表格式。它们不仅支持数据的近实时更新、高效的快照管理,还兼容 SQL 标准,使得数据既可以像传统数据库表一样进行事务性操作,又能充分利用数据湖的分布式存储与弹性计算优势。在计算引擎方面(采用存算分离架构),整合了 Spark、Flink、Presto、Doris 等多样的计算引擎。通过统一的调度与资源管理,不同引擎可以共享存储资源,协同处理复杂的数据工作流,满足公司从实时监控到深度分析的全方位计算需求。阿里云数据湖仓架构(来自阿里云官网)在数据一致性方面,提供 ACID(原子性、一致性、隔离性、持久性)保证,确保数据写入的一致性,保证了多方同时读取或写入数据时的数据准确性。在数据管理方面,数据湖仓实现了统一的元数据管理,支持全链路血缘,提供统一的命名空间、全局的数据目录。无论数据存储在何处,使用何种计算引擎,用户都能通过统一的 API 进行快速检索、理解与访问数据。数据治理,变得非常高效。在数据安全方面,数据湖仓一般还支持多租户和库表列级数据权限,能够很好地进行租户隔离和数据权限管控,确保了数据的安全性和隐私性。当然了,数据湖仓也不是没有缺点。作为一项融合的技术架构,它的复杂性比较高,需要很高的技术门槛。而且,它的早期投资比较大,对公司来说有一定的成本压力。数据湖仓的性能优化、数据治理以及安全防护,也存在一定的挑战。这些门槛和挑战,往往会让公司用户望而却步。█ 数据湖仓的参考架构数据湖仓诞生至今的时间并不是很长。从最开始的仓和湖独立建设,到后来,逐渐形成了“湖上建仓”与“仓外挂湖”两种实践路径。湖上建仓,是指基于数据湖架构,或者以数据湖作为数据存储中间层,实现多源异构数据的统一存储。然后,以统一调用接口方式调用计算引擎,最终实现上下结构的湖仓一体架构。仓外挂湖,是指以 MPP 数据库为基础,使用可插拔架构,通过开放接口对接外部存储,实现统一存储。随着时间的推移,也有公司开始推出两种架构的深入融合。目前,在数据湖仓领域比较有代表性的服务商,包括国外的 AWS(亚马逊云科技)、微软 Azure?、Databricks、Snowflake,以及国内的阿里云、腾讯云、华为云、星环科技等。各大服务商的架构有较差的差异,但基本上都包括存储层、元数据管理层、计算引擎层、服务与治理层等。以下是几个比较有代表性的架构,供参考。科杰的数据湖仓架构:图片来自网络Azure 的数据湖仓架构:图片来自网络AWS 的数据湖仓(他们叫智能湖仓)架构:图片来自“特大号”基于 Apache Doris 的湖仓一体架构:图片来自网络█ 最后的话目前来看,数据湖仓正在加速成为公司重要的战略性基础设施,用于长期的数据价值挖掘,以及发展 AI 应用。根据毕马威的报告显示,86% 的海外公司计划统一其分析数据,以支持 AI 业务的开发。国内也是如此。例如腾讯、B站、小红书等头部互联网公司,都采用了数据湖仓架构,用于不同程度的 AI 应用。数据湖仓在实时流处理与机器学习方面表现出色,能够很好地满足大模型的训练需求,相信未来几年会得到更好的发展。好啦,以上就是对于数据湖仓的介绍。鲜枣课堂大数据专题系列到此结束。感谢大家的耐心观看!参考文献:1、《数据库、数据湖、数据仓库、湖仓一体、智能湖仓,分别都是什么鬼》,特大号;2、《从数据湖到湖仓一体:统一数据架构演进之路》,Light Gao,知乎;3、《数据仓库、数据湖、湖仓一体,究竟有什么区别?》,SelectDB,知乎;4、《什么是湖仓一体?湖仓一体解决了什么问题?》,帆软;5、《2024 大数据“打假”:什么才是真湖仓一体?》,张友东;大数据在线;6、《大数据架构系列:如何理解湖仓一体?》,叶强盛,腾讯云开发者社区;7、百度百科,维基百科,各大服务商官网。本文来自微信公众号:鲜枣课堂(ID:xzclasscom),作者:小枣君

天美麻花星空视频

到底是什么是“数据湖仓”
到底是什么是“数据湖仓”

美国长期掉期利差以历史罕见速度收窄

「活动」惭补驳别测测诲蝉测颈诲颈苍驳狈产25

86.03MB
版本痴16.4.70
下载❌女人🔞露p毛视频Ww㊙️w安装你想要的应用 更方便 更快捷 发现更多
喜欢 57%好评(47251人)
评论 36
到底是什么是“数据湖仓”截图0 到底是什么是“数据湖仓”截图1 到底是什么是“数据湖仓”截图2 到底是什么是“数据湖仓”截图3 到底是什么是“数据湖仓”截图4
详细信息
  • 软件大小: 61811.81455MB
  • 最后更新: 2025-05-10 07:01:34
  • 最新版本: V5.75229.6
  • 文件格式: apk
  • 应用分类:颈辞蝉-础苍诲谤辞颈诲 三个❌男人躁我🔞奶头㊙️好舒服
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.69993以上
应用介绍
一,男❌同大尺🔞度Gay㊙️片,女班长晚上求我桶她下部
二,中国女人的隐私祼下集,妖娆➕无码➕少妇十无尽
叁,浪货今天就把你🌿到服为止的,小yoyo萝jk交精品
四,哺乳挤奶网站XXXX国产,ja❌panes🔞eXX㊙️X肉体进入
五,穿越❌三🔞国开局迎娶㊙️貂蝉的小说,学生小12清纯裸体脱内衣网站
六,被❌🍑下部🔞羞羞网站√,免费看裸体原神18禁,❌用🔞字拼爱㊙️心
七,❌刘恺威一天干🔞杨幂几次视频㊙️
【联系我们】
客服热线:134-2881-646
加载更多
版本更新
V7.8.88
一边❌亲一边脱一🔞摸一边泡妞㊙️
  • XXXX48HD免费

    白嫩❌丰满🔞人妻㊙️viesHD

    宋雨❌琦胸口受伤🔞的照㊙️片

    10093.90MB
    109好评

    脱👙让学生C🐻-网页

  • 西弗勒❌斯🔞纯㊙️车

    男受被双龙H❌尿进🔞去㊙️取精打屁股文

    宇智❌波佐🔞助哭泣的图片㊙️

    24225.30MB
    179175好评

    ❤国产精品嫩草79AVw

  • ❌みだれうち动漫在🔞线观㊙️看

    ❌xb缩写暗🔞示㊙️

    用刑具折磨动漫美女

    13.59MB
    319好评

    18大色会www

  • 高潮H玩具play失禁高H女

    动漫美❌女🔞玩奶头网站㊙️在哪

    美女露出给男生玩揉

    53.53MB
    276好评

    《她想被c❌》 作者🔞:㊙️阿肥阿

  • 他的手慢慢伸进我的下面

    FC2PPV完全颜出し20歳

    ❌体育生被强制捆绑🔞取精g㊙️v

    71.78MB
    704好评

    体育小鲜肉Gay自慰网站

  • GAy无套ⅩXXOO

    ❌Hi🔞・Me・Go・㊙️To动漫在线

    校花扒开腿讲桶爽慢画

    83.70MB
    333好评

    撕开老师的狂捏视频

  • 欧❌美🔞性做爰大㊙️片免费看办公室小说

    ❌蝴🔞蝶忍怀孕大肚子㊙️要生

    好爽好紧好深动漫日本

    23.62MB
    105好评

    在名器世界被肉到哭H

  • 大胸女被c黄㊙️❌站

    免费看影视网站

    ❌美女裸体APP下🔞载软件㊙️

    50.13MB
    921好评

    ❌竹板屁股🔞狠㊙️打臀肉乱颤bl

  • 小医仙被爆漫画羞羞视频

    ZOZ○❌ZO女人与ZOZ🔞0㊙️Z

    日本老师69XXX69护士

    83.37MB
    568好评

    惩罚往屁股眼里夹20根棉签

  • 网红憨憨倩❌卖的🔞视㊙️频

    动漫美女被❌奶头吸乳网站

    鬼灭之刃催眠❌调教🔞蝴蝶㊙️忍小说

    83.53MB
    756好评

    小舞❌露两🔞个奶头让㊙️男人揉

  • 莫妮卡经典电影

    吸❌奶🔞器吸完奶后㊙️有硬块怎么办

    美女脱一干二净,视频❌免🔞费㊙️

    31.74MB
    8829好评

    ❌女性🔞生殖㊙️高清图片

  • 女生动漫打屁股无内裤

    ❌乳胶全🔞包㊙️拘束衣

    被医生肉到失禁各种play双男

    41.19MB
    503好评

    ❌极乐神教全明星🔞改编无损音乐吧㊙️

  • 奶水人乳喂奶av网站

    小伸进9幺视频

    粗大的🐔巴再里面进进出出网站

    65.01MB
    741好评

    男子无套自慰网站✅

  • 佐❌鸣车🔞嗯~㊙️哈~啊~拔…出来~文

    火影1❌8🔞手㊙️办

    18款禁❌用🔞app绿色入㊙️口

    54.79MB
    755好评

    ❌特级婬片A片AA🔞A毛片㊙️柔术邹妓

  • ❌被C🔞到喷水嗯H厨房少㊙️妇视频

    mif❌un动漫官方🔞下载ap㊙️p

    动漫魅魔强迫裸体被❌出水视频

    57.38MB
    683好评

    鉴黄❌师🔞app免费入口㊙️在线观看

  • ch❌ina体育🔞生自慰㊙️

    别c我啊嗯上课呢男男视频

    水蜜桃❌3🔞D㊙️

    24.59MB
    352好评

    XNXXX日本16

  • 丰满的❌老师让我爽一🔞夜㊙️视频

    ❌翘🔞着奶㊙️头逛校园H调教夹震蛋小说

    男❌Ji大巴进入🔞女人免㊙️费视频

    13.82MB
    314好评

    男❌同口述同性🔞做受过㊙️程

  • 太阳西边落月亮东❌边挂打🔞一㊙️字谜

    ❌免🔞费java㊙️的网站

    ❌伊芙琳被弄到🔞高潮㊙️

    84.53MB
    219好评

    广佛一❌条🔞龙㊙️高端茶

  • 媾交❌3🔞D被㊙️怪物侵犯最新版本

    老师别穿内裤让我c了一夜

    申鹤乳❌液🔞图3㊙️d

    45.73MB
    732好评

    章若楠裸被免费视频

  • 国产午夜一级特黄A片大红米店

    JK动漫被到爽流软件

    ❌泳照🔞女头像㊙️

    10.31MB
    181好评

    男人皇宫最❌新🔞地址㊙️

  • 亚洲国产成人❌久🔞久精品大牛影㊙️视

    《女忍传·❌紫阳花🔞》㊙️动漫完整版

    1秒流鼻血的女性胸

    44.93MB
    367好评

    乳夹+口球+呜呜+挠脚心动漫

  • 演❌员与🔞导演㊙️电影

    ❌鬼灭之刃堕🔞姬战斗时的㊙️大尺度动作

    免费➕无码➕无套内谢软件麻豆

    91.49MB
    201好评

    91⭕️自慰漫画

  • 丝袜视频Xx免费观看

    洛天依❌×乐正绫🔞小黄㊙️文

    ❌51同性G🔞V㊙️片

    30.65MB
    906好评

    バラ❌ンス🔞よ㊙️く

  • 蜜桃AV㊙️入口观看

    《大奉打更人》免费全集

    边练舞便被老师揉搓花蒂

    30.01MB
    546好评

    ❌暗🔞呦丨㊙️小u女国产精品导航

  • 一本一道久久a久久综❌合🔞蜜桃㊙️

    香港三级❌全黄2🔞8㊙️部

    被性惩罚❌到哭着🔞求㊙️饶

    29.84MB
    126好评

    杨幂被桶爽到❌直🔞流㊙️白浆

  • 女の子になりたい词

    91丰满熟女

    白丝JK美女裸体❌出水视频

    70.32MB
    458好评

    午夜日❌韩成🔞人无码精品㊙️福利

  • 甘雨被扒开腿坐做同人游戏❌乖乖女作🔞文4㊙️00字 title="火影❌之🔞纲手的性㊙️监狱acg" class="0v5366j9r7414 app-list-img" src="https://t11./it/u=1040017057,165456434&fm=30&app=106&f=JPEG?w=312&h=208&s=15B07D95426079116A1494FD03009032"">

    嗯~啊~轻一点🈲🔞廣告日本

    老太君❌的丰🔞满大乳在㊙️线视频

  • 成人🔞高潮片直接看監禁・❌拘束・🔞陵辱趣㊙️味の変態小说 title="罗宾被吸乳羞羞网站" class="0v5366j9r7414 app-list-img" src="https://t10./it/u=3070224572,165461829&fm=30&app=106&f=JPEG?w=312&h=208&s=C6000AAC4838BAC8463F54AC0300A00B"">

    各❌种同🔞人小说的H改编㊙️版

    性瘾❌总🔞裁蹭㊙️桌角自慰文

  • 羞羞漫画SSS❤免费入口催眠美妇穿婚❌纱被🔞调教小㊙️说 title="怀孕❌了可🔞以坐㊙️飞机吗" class="0v5366j9r7414 app-list-img" src="https://t12./it/u=1041590673,165100299&fm=30&app=106&f=JPEG?w=312&h=208&s=D7383EC642E1D8EA0A87937F0300C078"">

    剧情很有意思的AV系列

    ❌刻晴手🔞办㊙️

国语❌对🔞白真实视频播㊙️放 类似软件

猜你喜欢

包含 饿了么 的应用集
评论
  • 自慰疯狂揉小核❌到🔞失禁㊙️喷水 3天前
    女同被调教🔞黄㊙️❌
  • ❌亚洲人女同志🔞按摩㊙️在线观看 7天前
    国产精品㊙️AV入口KTV
  • 3D动漫同人18动漫 3天前
    动漫JK美女被爆❌羞羞软件
  • 关之琳三级露全乳... 3天前
    ❌被🔞cao到双腿㊙️颤抖女攻系统
  • ❌唐柔H改编成🔞人㊙️版 6天前
    性XX❌XXX🔞护士㊙️第一次
  • 一眼美人18k白金满钻 7天前
    被绑到刑床强扒开腿狂虐的视频
  • 免费成人黄动漫画 0天前
    ❌精灵梦叶罗丽x光浮🔞尘 剧情㊙️简介
  • 3d❌动漫软件入🔞口㊙️ 1天前
    十❌二🔞星座可㊙️爱公主头像
  • 秩为❌1的矩阵的n🔞次㊙️方的计算公式 4天前
    妲己被狂❌无码流出小说
  • ❌杨晨晨🔞喷血福利㊙️ 7天前
    七个美女被脱鞋挠脚心