发布时间:2025-05-08 17:37:32 分类:公司动态 浏览:

今天是大数据专题的最后一篇,来讲讲数据湖仓。█?为什么会有“数据湖仓”?前面我们提到,数据仓库出现于 1990 年代,主要基于 MPP(Massively Parallel Processing,大规模并行处理)或者关系型数据库实现,用于公司做数据存储、处理和分析,发展数据看板、BI(商业智能)等用途。而数据湖,出现于 2010 年代,主要基于大数据技术(Hadoop 等)生态,用于支撑多样化的数据存储,实时性更强,适合满足批处理、流式计算等业务场景。数据仓库的特点是,先做数据处理,搞得规范整齐之后,存起来。用的时候就直接用。它主要存的是结构化(行列)数据。数据湖的特点是,什么数据(结构化、非结构化、半结构化)都能存,不做预处理,先全部都存起来,等要用的时候,再处理。两种技术,各有优缺点:从成本的角度来看,数据湖的起步成本很低,但随着数据体量的增大,成本会迅速飙升。而数据仓库恰好相反,前期建设开支很大,后期成本增加趋缓。数据仓库和数据湖,都是基于数据进行价值挖掘,只是侧重点不同。对于公司来说,两者都有价值,所以,会选择同时建设。很显然,这不仅导致了高昂的建设投资成本,也使得数据存在冗余和重复。基于以上种种原因,业界就开始思考:是不是可以将数据仓库和数据湖进行结合,充分发挥两者的优势,弥补各自的缺陷呢?于是,就有一些服务商,开始研究如何将两者的能力进行“打通”。主要思路包括两种:一种是让数据仓库支持对数据湖的访问。还有一种,是让数据湖具备数据仓库的一些能力。前者比较有代表性的,是 2017 年 Redshift 推出的 Redshift Spectrum。它支持 Redsift 数据仓库用户访问 AWS S3 数据湖的数据。后者有代表性的比较多,包括 2017 年 Hortonworks 孵化出的 Apache Atlas 和 Ranger 项目,2018 年 Nexflix 开源的内部增强版本元数据服务系统 Iceberg。2018-2019 年,Uber 和 Databricks 相继推出了 Apache Hudi 和 DeltaLake,推出增量文件格式,用以支持 Update / Insert、事务等数据仓库功能。所有这些尝试和努力,都多多少少存在一些缺陷(数据仓库和数据湖存在本质的区别,整合难度很大),并不算成功。2020 年,数据智能独角兽公司 Databricks(没错,就是提出 Delta Lake 的那个公司,数据湖的代表公司)正式提出了数据湖仓(Data Lakehouse)概念。Databricks 联合创始人兼首席执行官阿里?戈德西(Ali Ghodsi)表示:“从长远来看,所有数据仓库都将被纳入数据湖仓,这不会在一夜之间发生 —— 这些东西会共存一段时间 —— 在价格和性能上,数据湖仓完胜数据仓库。”数据湖仓,也被称为湖仓一体。2021 年,“湖仓一体”首次被写入 Gartner 数据管理领域成熟度报告。2023 年 6 月,大数据技术标准推进委员会发布了《湖仓一体技术与产业研究报告(2023 年)》。这一年的 6 月 26 日,“湖仓一体”在中国大数据产业发展大会上成功入选“2023 大数据十大关键词”。█ 数据湖仓的主要特点数据湖仓(湖仓一体),说白了,就是一种将数据仓库和数据湖打通的新型开放式架构。它既具备数据湖的灵活性,也具备数据仓库的高性能及管理能力,为公司进行数据治理带来了更大的便利和更高的效率。在数据湖仓的底层,支持多种数据类型并存,能实现数据间的相互共享。在数据湖仓的上层,可以通过统一接口进行访问,可同时支持实时查询和分析。数据仓库和数据湖这两套体系相互打通之后,数据可以在两者之间自由流动。也就是说,数据湖里的“新鲜”数据(热数据),可以流到数据仓库里,直接被数据仓库使用。而数据仓库里的“不新鲜”数据(冷数据),也可以流到数据湖里,低成本长久保存,供未来使用。数据湖仓的特点,其实就是数据仓库的优点 + 数据湖的优点。在数据存储方面,继承了数据湖的优势,支持多样化数据,且以 HDFS 或云对象存储为基础,实现了低成本、高可用。数据以原始格式或开放文件格式(如 Parquet、ORC)存储,具备高效的压缩比与列存储特性,方便查找。开放文件格式,也保障了数据在不同计算引擎间的通用性。数据湖仓同样支持 Iceberg、Hudi、Delta Lake 等开放表格式。它们不仅支持数据的近实时更新、高效的快照管理,还兼容 SQL 标准,使得数据既可以像传统数据库表一样进行事务性操作,又能充分利用数据湖的分布式存储与弹性计算优势。在计算引擎方面(采用存算分离架构),整合了 Spark、Flink、Presto、Doris 等多样的计算引擎。通过统一的调度与资源管理,不同引擎可以共享存储资源,协同处理复杂的数据工作流,满足公司从实时监控到深度分析的全方位计算需求。阿里云数据湖仓架构(来自阿里云官网)在数据一致性方面,提供 ACID(原子性、一致性、隔离性、持久性)保证,确保数据写入的一致性,保证了多方同时读取或写入数据时的数据准确性。在数据管理方面,数据湖仓实现了统一的元数据管理,支持全链路血缘,提供统一的命名空间、全局的数据目录。无论数据存储在何处,使用何种计算引擎,用户都能通过统一的 API 进行快速检索、理解与访问数据。数据治理,变得非常高效。在数据安全方面,数据湖仓一般还支持多租户和库表列级数据权限,能够很好地进行租户隔离和数据权限管控,确保了数据的安全性和隐私性。当然了,数据湖仓也不是没有缺点。作为一项融合的技术架构,它的复杂性比较高,需要很高的技术门槛。而且,它的早期投资比较大,对公司来说有一定的成本压力。数据湖仓的性能优化、数据治理以及安全防护,也存在一定的挑战。这些门槛和挑战,往往会让公司用户望而却步。█ 数据湖仓的参考架构数据湖仓诞生至今的时间并不是很长。从最开始的仓和湖独立建设,到后来,逐渐形成了“湖上建仓”与“仓外挂湖”两种实践路径。湖上建仓,是指基于数据湖架构,或者以数据湖作为数据存储中间层,实现多源异构数据的统一存储。然后,以统一调用接口方式调用计算引擎,最终实现上下结构的湖仓一体架构。仓外挂湖,是指以 MPP 数据库为基础,使用可插拔架构,通过开放接口对接外部存储,实现统一存储。随着时间的推移,也有公司开始推出两种架构的深入融合。目前,在数据湖仓领域比较有代表性的服务商,包括国外的 AWS(亚马逊云科技)、微软 Azure?、Databricks、Snowflake,以及国内的阿里云、腾讯云、华为云、星环科技等。各大服务商的架构有较差的差异,但基本上都包括存储层、元数据管理层、计算引擎层、服务与治理层等。以下是几个比较有代表性的架构,供参考。科杰的数据湖仓架构:图片来自网络Azure 的数据湖仓架构:图片来自网络AWS 的数据湖仓(他们叫智能湖仓)架构:图片来自“特大号”基于 Apache Doris 的湖仓一体架构:图片来自网络█ 最后的话目前来看,数据湖仓正在加速成为公司重要的战略性基础设施,用于长期的数据价值挖掘,以及发展 AI 应用。根据毕马威的报告显示,86% 的海外公司计划统一其分析数据,以支持 AI 业务的开发。国内也是如此。例如腾讯、B站、小红书等头部互联网公司,都采用了数据湖仓架构,用于不同程度的 AI 应用。数据湖仓在实时流处理与机器学习方面表现出色,能够很好地满足大模型的训练需求,相信未来几年会得到更好的发展。好啦,以上就是对于数据湖仓的介绍。鲜枣课堂大数据专题系列到此结束。感谢大家的耐心观看!参考文献:1、《数据库、数据湖、数据仓库、湖仓一体、智能湖仓,分别都是什么鬼》,特大号;2、《从数据湖到湖仓一体:统一数据架构演进之路》,Light Gao,知乎;3、《数据仓库、数据湖、湖仓一体,究竟有什么区别?》,SelectDB,知乎;4、《什么是湖仓一体?湖仓一体解决了什么问题?》,帆软;5、《2024 大数据“打假”:什么才是真湖仓一体?》,张友东;大数据在线;6、《大数据架构系列:如何理解湖仓一体?》,叶强盛,腾讯云开发者社区;7、百度百科,维基百科,各大服务商官网。本文来自微信公众号:鲜枣课堂(ID:xzclasscom),作者:小枣君

天美麻花星空视频

到底是什么是“数据湖仓”
到底是什么是“数据湖仓”

一商户自称开店遭“刁难”停电,江苏淮安市监部门回应

「活动」惭补驳别测测诲蝉测颈诲颈苍驳狈产25

80.62MB
版本痴54.6.00
下载小黄鸭❌vp 🔞n官㊙️网下载安装你想要的应用 更方便 更快捷 发现更多
喜欢 92%好评(94418人)
评论 13
到底是什么是“数据湖仓”截图0 到底是什么是“数据湖仓”截图1 到底是什么是“数据湖仓”截图2 到底是什么是“数据湖仓”截图3 到底是什么是“数据湖仓”截图4
详细信息
  • 软件大小: 84091.52195MB
  • 最后更新: 2025-05-08 17:37:32
  • 最新版本: V6.17459.2
  • 文件格式: apk
  • 应用分类:颈辞蝉-础苍诲谤辞颈诲 G❌AY男人露🔞J直播㊙️平台
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 4.55967以上
应用介绍
一,❌女🔞主被章鱼怪侵㊙️犯高H文,4i视频d❌o🔞免费视频㊙️网站
二,涩❌涩屋污版下🔞载㊙️,ny❌l3🔞D动画入口㊙️
叁,人禽❌交🔞哪里可以㊙️看,免费看一区❌二区成🔞人A片bds㊙️m
四,被同❌桌c到🔞高潮婬荡㊙️呻吟在线观看,❌97欧美AV成人无🔞码国产小㊙️说
五,❌撕开麻麻🔞的内裤挺进去㊙️小说,甘雨❌的裸体本子🔞推荐㊙️
六,帅❌老头的大硬东🔞西㊙️露出来了,原创露❌脸🔞走基㊙️层熟妇啊,景甜三级未删减版❌在线🔞观看㊙️
七,国产又爽❌又黄无码无🔞遮挡在线㊙️观
【联系我们】
客服热线:134-2881-646
加载更多
版本更新
V3.5.26
Lana ❌Rho🔞ades㊙️裸乳无码
  • 黑❌料🔞社区入口吃瓜㊙️

    ❌把小舞调教成肉🔞奴1~5㊙️小说

    狠狠躁❌夜夜躁人人🔞爽野战天天㊙️

    36737.63MB
    108好评

    堵奶了有硬块❌自己🔞在家怎么疏通㊙️

  • 妻❌韵柳淑🔞云㊙️续写

    ❌火🔞影忍者㊙️鸣人玩具

    芙❌卡🔞洛㊙️斯吊图

    48153.24MB
    901915好评

    l❌ovelive🔞口工成人H漫画全彩㊙️

  • Gay❌ XXXXGa🔞y外㊙️卖激情

    ❌故意穿暴露🔞被强好爽H小说㊙️

    农村玌❌伦🔞小说㊙️

    13.14MB
    319好评

    ❌PORNO H🔞D 365㊙️

  • 凹凸世界凯❌莉被🔞雷㊙️狮抱到怀里

    ❌女帝汉库🔞克㊙️的下场

    ❌无情🔞扌喿辶畐㊙️

    53.76MB
    276好评

    Chin❌es🔞e㊙️HD国产刺激对白

  • ❌军🔞警Gay呻吟XXX㊙️

    ❌拘束🔞衣调教㊙️

    野花日本HD免费❌完🔞整版高清版㊙️3

    71.68MB
    700好评

    ❌云宝和紫悦亲吻🔞图㊙️片

  • 国产❌AV🔞无码㊙️乱码

    哈尼❌克孜的小花园怎🔞么㊙️坏了

    国❌漫女神ai裸身🔞无遮㊙️掩

    83.28MB
    335好评

    果❌字最🔞旺三个属㊙️相

  • 苏紫紫《泼墨》在❌线观🔞看㊙️

    ❌naru🔞tothemai㊙️ntheme

    q❌2002午夜🔞免费理伦㊙️

    23.75MB
    109好评

    崩❌铁卡芙卡焯🔞出㊙️水

  • 身❌体健🔞康是㊙️第一

    ❌大雄🔞和野比㊙️玉子h文

    女❌生叫你🔞小伙子啥㊙️意思

    50.27MB
    923好评

    周生辰从❌后🔞面折腾㊙️时宜原文

  • ❌龙珠18号🔞裸体大胸被㊙️啪啪网站

    蜜臀AV精品❌一区二🔞区三㊙️区

    ❌jlzzjl🔞zz亚洲在女人2㊙️021西兰

    83.30MB
    566好评

    ❌极🔞品少妇裸体自慰喷㊙️水嗷嗷叫

  • ❌摸🔞了一下乳头㊙️小说

    女人被添荫蒂❌的口述带🔞来㊙️的影响

    伸进她❌的短🔞裙内揉㊙️捏

    83.60MB
    750好评

    头❌上有两🔞个恶魔角㊙️的动漫人物

  • ❌日本🔞一级特黄㊙️大片本道

    初音未❌来小黄🔞油㊙️

    《花漾❌新闻播报🔞员悦子㊙️》

    40.58MB
    1062好评

    ❌亚洲女同V🔞ideoS㊙️

  • 星❌穹铁道a🔞kt㊙️资源站免费汇总

    男总裁❌办公🔞室㊙️自慰被下属发现

    女性向❌IPX-666🔞无删㊙️减版入口

    09.91MB
    160好评

    ❌差🔞差差很㊙️疼的无掩盖视频

  • 少妇熟❌女🔞婬乱一区二㊙️区三区

    喵小❌吉c🔞ospl㊙️ay

    斐vr❌18🔞车标记㊙️

    65.28MB
    749好评

    南方传❌媒涨2🔞.0㊙️4%

  • 被灌❌满各种🔞玩具C到㊙️失禁

    ❌杨颖🔞被郑恺㊙️c到高潮小说

    Juli❌aAnnHD🔞XXX㊙️

    54.63MB
    755好评

    双男主乖乖趴下屁股撅❌高打🔞光pp㊙️

  • 奇优影院❌在线🔞观看庆余年㊙️

    大❌炕上偷欢(🔞乱㊙️Lun合集1)

    冲田杏❌梨🔞BF-22㊙️5无码流出

    57.14MB
    687好评

    动漫❌美女裸🔞体漫㊙️画免费看

  • 雷电将军ちゃんが❌腿法的🔞历史起㊙️源

    解❌开女🔞警的乳罩慢慢揉捏动㊙️漫

    ❌短裙抄底🔞走空无内㊙️裤

    24.11MB
    357好评

    两女❌双腿🔞交缠激烈磨㊙️豆腐

  • ❌南宁女学生被强扒🔞内㊙️裤

    あねい❌も第1章🔞在线观㊙️看

    51今日爆料,❌每日🔞大赛㊙️

    13.11MB
    318好评

    塔❌秘🔞a㊙️i官网

  • 日❌本护士🔞裸体做爰㊙️视频

    巜人妻❌初尝按🔞摩师BD㊙️中字

    BRAZ❌ZE🔞R㊙️S丰满艳妇

    84.72MB
    211好评

    ❌比安卡裸🔞体无㊙️码

  • 宝可❌梦淫🔞交h㊙️文

    日本理❌论片好🔞看理论㊙️片

    ❌3d精品动🔞漫毛茸茸3D㊙️

    45.79MB
    734好评

    Gay❌Fu🔞ck与直㊙️男啪啪

  • 紫悦怀五❌十🔞个宝宝㊙️

    ❌糖心🔞酥酥自慰流㊙️白浆

    精产国品一❌区二区🔞不卡AV视㊙️频

    10.90MB
    188好评

    ❌小舞胸⋯🔞啊⋯嗯~出㊙️奶了黄

  • 9❌:1短视🔞频㊙️

    ❌12裸体🔞自慰免费观看㊙️网站

    银狼翻白眼乳❌液狂🔞飙㊙️

    44.03MB
    369好评

    ❌饸🔞饹陕西㊙️

  • ❌免费动漫双🔞男㊙️主

    啊❌轻点灬太粗嗯太深了🔞快㊙️亚洲人

    爱情❌岛论坛AQ🔞DLT㊙️农业

    91.93MB
    201好评

    ❌free🔞性西欧婬妇SeX㊙️

  • 日本一级A片❌毛片丰满的🔞少妇麻㊙️豆

    爽❌好大快深🔞一点㊙️美女被糙

    旅❌行者被🔞多人玩弄㊙️H失禁

    30.98MB
    906好评

    国❌产又大又黄又猛又爽🔞的㊙️竹

  • ❌《老师的奶水🔞》 ㊙️在线观看

    奶欲❌白狐高开衩🔞旗㊙️袍女

    ❌亚洲精品久🔞久久蜜桃㊙️

    30.36MB
    549好评

    和泉纱❌雾被ⅹ本子🔞网站㊙️

  • 按摩师❌用🔞嘴亲我㊙️下面过程

    无一郎被❌c🔞进生殖㊙️腔

    ❌精品欧美🔞AV㊙️无码喷奶水

    29.73MB
    128好评

    ❌体罚学生脱鞋🔞子打脚㊙️心

  • 主角穿越❌宇🔞智波斑㊙️

    ❌女子倒车后忘🔞换㊙️挡连撞多车

    ❌温迪的🔞堕落小说㊙️全文阅读

    70.02MB
    456好评

    风神❌的y🔞酒派对小㊙️说

  • 妓女的❌奶头为啥🔞一吃㊙️一个友情算不❌算🔞爱㊙️ title="❌太🔞宰治cp五条悟的小说㊙️" class="0v5366j9r7414 app-list-img" src="https://t11./it/u=1040017057,165456434&fm=30&app=106&f=JPEG?w=312&h=208&s=15B07D95426079116A1494FD03009032"">

    MD❌M007🔞0沈娜娜苏㊙️清歌视频

    bu❌dg🔞etvm日本㊙️vps

  • 被同桌c到高潮婬荡呻吟❌小🔞说㊙️跪❌着被主人用脚玩弄🔞奶头㊙️ title="13❌小男生裸体G🔞a㊙️y网站" class="0v5366j9r7414 app-list-img" src="https://t10./it/u=3070224572,165461829&fm=30&app=106&f=JPEG?w=312&h=208&s=C6000AAC4838BAC8463F54AC0300A00B"">

    ❌白丝🔞小箩莉的婬乱h㊙️

    免费❌看漫画🔞的软件㊙️

  • ❌刻晴🔞vs心海㊙️夜兰被凝❌光打麻🔞醉针㊙️ title="纳❌西🔞妲翘臀跪㊙️床被打屁股" class="0v5366j9r7414 app-list-img" src="https://t12./it/u=1041590673,165100299&fm=30&app=106&f=JPEG?w=312&h=208&s=D7383EC642E1D8EA0A87937F0300C078"">

    巨茎猛男自慰❌出🔞精大睪㊙️丸

    一❌拳超人吹雪🔞漫㊙️画

❌佐🔞鸣㊙️纯欲肉H文 类似软件

猜你喜欢

包含 饿了么 的应用集
评论
  • 唐❌舞桐把胸罩脱了🔞让㊙️雨浩捏她的胸 7天前
    有❌没有哪些可🔞以看㊙️片的百度云
  • 洞洞杂货铺漫画免费❌阅读第5🔞7㊙️章 2天前
    ❌纤🔞细的爱㊙️百度网盘
  • 火影忍者雏❌田禁🔞漫全㊙️彩 5天前
    王❌俊🔞凯㊙️尺寸
  • XX❌OO亚洲AV🔞成人片在线观看㊙️ 5天前
    人H动漫❌无码一区二🔞区㊙️精品
  • ❌人妻教师陆美蓉1―🔞50㊙️ 1天前
    周妍希❌土园🔞肥矮挫㊙️穷AV
  • 网红❌主播🔞直播㊙️录视频 2天前
    击❌打腹🔞肌打到㊙️吐血
  • ❌《秘密教学🔞》㊙️韩漫无删减 2天前
    ❌奶🔞大性一交一无一伦㊙️一精一品
  • 国产精❌品无码久久🔞久㊙️久A片 3天前
    神印王座❌圣采🔞被扒㊙️奶吸乳
  • 1000部拍拍拍❌免费网🔞站㊙️ 7天前
    智❌能女机🔞器人图片㊙️
  • ❌足🔞球宝贝裸体无码㊙️ 5天前
    AV❌雷电将军自慰漫🔞画免费阅㊙️读