发布时间:2025-05-07 14:44:51 分类:公司动态 浏览:

今天是大数据专题的最后一篇,来讲讲数据湖仓。█?为什么会有“数据湖仓”?前面我们提到,数据仓库出现于 1990 年代,主要基于 MPP(Massively Parallel Processing,大规模并行处理)或者关系型数据库实现,用于公司做数据存储、处理和分析,发展数据看板、BI(商业智能)等用途。而数据湖,出现于 2010 年代,主要基于大数据技术(Hadoop 等)生态,用于支撑多样化的数据存储,实时性更强,适合满足批处理、流式计算等业务场景。数据仓库的特点是,先做数据处理,搞得规范整齐之后,存起来。用的时候就直接用。它主要存的是结构化(行列)数据。数据湖的特点是,什么数据(结构化、非结构化、半结构化)都能存,不做预处理,先全部都存起来,等要用的时候,再处理。两种技术,各有优缺点:从成本的角度来看,数据湖的起步成本很低,但随着数据体量的增大,成本会迅速飙升。而数据仓库恰好相反,前期建设开支很大,后期成本增加趋缓。数据仓库和数据湖,都是基于数据进行价值挖掘,只是侧重点不同。对于公司来说,两者都有价值,所以,会选择同时建设。很显然,这不仅导致了高昂的建设投资成本,也使得数据存在冗余和重复。基于以上种种原因,业界就开始思考:是不是可以将数据仓库和数据湖进行结合,充分发挥两者的优势,弥补各自的缺陷呢?于是,就有一些服务商,开始研究如何将两者的能力进行“打通”。主要思路包括两种:一种是让数据仓库支持对数据湖的访问。还有一种,是让数据湖具备数据仓库的一些能力。前者比较有代表性的,是 2017 年 Redshift 推出的 Redshift Spectrum。它支持 Redsift 数据仓库用户访问 AWS S3 数据湖的数据。后者有代表性的比较多,包括 2017 年 Hortonworks 孵化出的 Apache Atlas 和 Ranger 项目,2018 年 Nexflix 开源的内部增强版本元数据服务系统 Iceberg。2018-2019 年,Uber 和 Databricks 相继推出了 Apache Hudi 和 DeltaLake,推出增量文件格式,用以支持 Update / Insert、事务等数据仓库功能。所有这些尝试和努力,都多多少少存在一些缺陷(数据仓库和数据湖存在本质的区别,整合难度很大),并不算成功。2020 年,数据智能独角兽公司 Databricks(没错,就是提出 Delta Lake 的那个公司,数据湖的代表公司)正式提出了数据湖仓(Data Lakehouse)概念。Databricks 联合创始人兼首席执行官阿里?戈德西(Ali Ghodsi)表示:“从长远来看,所有数据仓库都将被纳入数据湖仓,这不会在一夜之间发生 —— 这些东西会共存一段时间 —— 在价格和性能上,数据湖仓完胜数据仓库。”数据湖仓,也被称为湖仓一体。2021 年,“湖仓一体”首次被写入 Gartner 数据管理领域成熟度报告。2023 年 6 月,大数据技术标准推进委员会发布了《湖仓一体技术与产业研究报告(2023 年)》。这一年的 6 月 26 日,“湖仓一体”在中国大数据产业发展大会上成功入选“2023 大数据十大关键词”。█ 数据湖仓的主要特点数据湖仓(湖仓一体),说白了,就是一种将数据仓库和数据湖打通的新型开放式架构。它既具备数据湖的灵活性,也具备数据仓库的高性能及管理能力,为公司进行数据治理带来了更大的便利和更高的效率。在数据湖仓的底层,支持多种数据类型并存,能实现数据间的相互共享。在数据湖仓的上层,可以通过统一接口进行访问,可同时支持实时查询和分析。数据仓库和数据湖这两套体系相互打通之后,数据可以在两者之间自由流动。也就是说,数据湖里的“新鲜”数据(热数据),可以流到数据仓库里,直接被数据仓库使用。而数据仓库里的“不新鲜”数据(冷数据),也可以流到数据湖里,低成本长久保存,供未来使用。数据湖仓的特点,其实就是数据仓库的优点 + 数据湖的优点。在数据存储方面,继承了数据湖的优势,支持多样化数据,且以 HDFS 或云对象存储为基础,实现了低成本、高可用。数据以原始格式或开放文件格式(如 Parquet、ORC)存储,具备高效的压缩比与列存储特性,方便查找。开放文件格式,也保障了数据在不同计算引擎间的通用性。数据湖仓同样支持 Iceberg、Hudi、Delta Lake 等开放表格式。它们不仅支持数据的近实时更新、高效的快照管理,还兼容 SQL 标准,使得数据既可以像传统数据库表一样进行事务性操作,又能充分利用数据湖的分布式存储与弹性计算优势。在计算引擎方面(采用存算分离架构),整合了 Spark、Flink、Presto、Doris 等多样的计算引擎。通过统一的调度与资源管理,不同引擎可以共享存储资源,协同处理复杂的数据工作流,满足公司从实时监控到深度分析的全方位计算需求。阿里云数据湖仓架构(来自阿里云官网)在数据一致性方面,提供 ACID(原子性、一致性、隔离性、持久性)保证,确保数据写入的一致性,保证了多方同时读取或写入数据时的数据准确性。在数据管理方面,数据湖仓实现了统一的元数据管理,支持全链路血缘,提供统一的命名空间、全局的数据目录。无论数据存储在何处,使用何种计算引擎,用户都能通过统一的 API 进行快速检索、理解与访问数据。数据治理,变得非常高效。在数据安全方面,数据湖仓一般还支持多租户和库表列级数据权限,能够很好地进行租户隔离和数据权限管控,确保了数据的安全性和隐私性。当然了,数据湖仓也不是没有缺点。作为一项融合的技术架构,它的复杂性比较高,需要很高的技术门槛。而且,它的早期投资比较大,对公司来说有一定的成本压力。数据湖仓的性能优化、数据治理以及安全防护,也存在一定的挑战。这些门槛和挑战,往往会让公司用户望而却步。█ 数据湖仓的参考架构数据湖仓诞生至今的时间并不是很长。从最开始的仓和湖独立建设,到后来,逐渐形成了“湖上建仓”与“仓外挂湖”两种实践路径。湖上建仓,是指基于数据湖架构,或者以数据湖作为数据存储中间层,实现多源异构数据的统一存储。然后,以统一调用接口方式调用计算引擎,最终实现上下结构的湖仓一体架构。仓外挂湖,是指以 MPP 数据库为基础,使用可插拔架构,通过开放接口对接外部存储,实现统一存储。随着时间的推移,也有公司开始推出两种架构的深入融合。目前,在数据湖仓领域比较有代表性的服务商,包括国外的 AWS(亚马逊云科技)、微软 Azure?、Databricks、Snowflake,以及国内的阿里云、腾讯云、华为云、星环科技等。各大服务商的架构有较差的差异,但基本上都包括存储层、元数据管理层、计算引擎层、服务与治理层等。以下是几个比较有代表性的架构,供参考。科杰的数据湖仓架构:图片来自网络Azure 的数据湖仓架构:图片来自网络AWS 的数据湖仓(他们叫智能湖仓)架构:图片来自“特大号”基于 Apache Doris 的湖仓一体架构:图片来自网络█ 最后的话目前来看,数据湖仓正在加速成为公司重要的战略性基础设施,用于长期的数据价值挖掘,以及发展 AI 应用。根据毕马威的报告显示,86% 的海外公司计划统一其分析数据,以支持 AI 业务的开发。国内也是如此。例如腾讯、B站、小红书等头部互联网公司,都采用了数据湖仓架构,用于不同程度的 AI 应用。数据湖仓在实时流处理与机器学习方面表现出色,能够很好地满足大模型的训练需求,相信未来几年会得到更好的发展。好啦,以上就是对于数据湖仓的介绍。鲜枣课堂大数据专题系列到此结束。感谢大家的耐心观看!参考文献:1、《数据库、数据湖、数据仓库、湖仓一体、智能湖仓,分别都是什么鬼》,特大号;2、《从数据湖到湖仓一体:统一数据架构演进之路》,Light Gao,知乎;3、《数据仓库、数据湖、湖仓一体,究竟有什么区别?》,SelectDB,知乎;4、《什么是湖仓一体?湖仓一体解决了什么问题?》,帆软;5、《2024 大数据“打假”:什么才是真湖仓一体?》,张友东;大数据在线;6、《大数据架构系列:如何理解湖仓一体?》,叶强盛,腾讯云开发者社区;7、百度百科,维基百科,各大服务商官网。本文来自微信公众号:鲜枣课堂(ID:xzclasscom),作者:小枣君

天美麻花星空视频

到底是什么是“数据湖仓”
到底是什么是“数据湖仓”

阿波罗首席经济学家称公司领导者正失去信心

「活动」惭补驳别测测诲蝉测颈诲颈苍驳狈产25

24.09MB
版本痴26.6.87
下载抚❌子静香同人🔞动㊙️漫安装你想要的应用 更方便 更快捷 发现更多
喜欢 27%好评(53147人)
评论 60
到底是什么是“数据湖仓”截图0 到底是什么是“数据湖仓”截图1 到底是什么是“数据湖仓”截图2 到底是什么是“数据湖仓”截图3 到底是什么是“数据湖仓”截图4
详细信息
  • 软件大小: 57551.31398MB
  • 最后更新: 2025-05-07 14:44:51
  • 最新版本: V9.50813.7
  • 文件格式: apk
  • 应用分类:颈辞蝉-础苍诲谤辞颈诲 高分韩剧《母亲》
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 8.32654以上
应用介绍
一,91❌丨国产🔞丨网红丨入口㊙️,❌脱了纳西妲、可🔞莉的内裤打㊙️屁屁
二,18❌禁床震做爰无遮🔞挡㊙️,顶级绝论推理片完整版
叁,印❌度人XX🔞Ⅹ㊙️HD,男人❌动了🔞心会有什么表现㊙️
四,日本b片网站,激❌情婬妇Av天🔞堂㊙️91
五,玉玲珑p图无遮❌挡无🔞码㊙️,女性自❌慰喷水🔞喷了20㊙️秒正常吗
六,吃胸吃边膜60分钟视频,❌青春🔞放轻松电㊙️影,❌护士用丝袜脚交榨🔞精㊙️
七,亚洲综❌合🔞无码一区㊙️二区痴汉
【联系我们】
客服热线:134-2881-646
加载更多
版本更新
V8.4.00
❌白袜子🔞男㊙️生宿舍自慰
  • 2023天干天干天干天干天干a

    ❌野外Chin🔞e㊙️seHDxXxX

    ❌yy🔞4090殇情影㊙️院

    66697.22MB
    106好评

    奶头和荫蒂添❌的🔞好舒服囗交漫㊙️画

  • 麻麻❌脱🔞了㊙️内裤让我添下边

    na❌r🔞utohina㊙️ta雏田爆乳

    XN❌XX🔞老师س㊙️گش

    70039.08MB
    513457好评

    夜场❌专用避孕🔞套什么意思㊙️

  • ❌击🔞打腹肌肚㊙️脐视频

    黄明昊朱正廷❌扩张🔞书桌㊙️

    ❌芋泥啵🔞啵珍珠㊙️奶茶

    13.64MB
    316好评

    (粗口,调教、❌高🔞H)㊙️被迫成瘾文

  • ❌失禁~顶🔞弄play触手play博士㊙️

    工口❌赛🔞高白丝h自㊙️慰喷水

    女性❌自🔞慰㊙️喷水www

    53.80MB
    274好评

    精品成品国色天香卡一

  • 91久久捆❌绑调🔞教美女一区㊙️二区

    丝袜美❌腿自慰🔞爆㊙️浆喷水

    ❌老🔞湿免㊙️费体验三分钟

    71.42MB
    701好评

    尤蜜❌荟🔞尤妮丝㊙️一区二区三区

  • ❌美🔞女裸体啪啪㊙️高潮

    一区二区❌三区🔞四区五区㊙️

    乳胶枕头6大害处

    83.80MB
    336好评

    教室停电❌c🔞rush狂c㊙️我

  • ❌AV鞠婧🔞祎在线观看免下㊙️载

    ❌王者荣耀🔞妲己图片㊙️

    禁止i8勿进30000部芒果

    23.05MB
    104好评

    ❌乳液乱喷🔞免费的观看㊙️

  • ❌八重🔞神子无内衣内㊙️裤

    亚洲尺码与日本尺码区别

    初高❌中🔞女露㊙️胸罩

    50.53MB
    928好评

    中❌国老太奶BB🔞wB㊙️BW免费看

  • ❌古装美女被🔞强行糟蹋侮㊙️辱

    Chi❌nese🔞老大勃起Gay4㊙️5

    玩❌男生的🔞jij㊙️i无遮挡

    83.63MB
    565好评

    2❌0分钟够爽🔞吗㊙️

  • ❌女人一草🔞就㊙️老实了

    一边做饭一边躁30分钟

    麻w豆w传媒剧国产剧入口麻

    83.67MB
    759好评

    男人添女❌人下🔞边做㊙️爰视频软件

  • ❌诱饵搜查官5味🔞觉㊙️

    动漫中❌的舌吻激🔞烈又久㊙️

    动❌漫吃欧派🔞漫㊙️画

    83.87MB
    0088好评

    ❌电影🔞工口动画片㊙️在线观看

  • 大黑狗又烫又大卡子宫

    h❌双🔞腿涨灌捆绑play㊙️慎入小说

    为❌什么把🔞手伸到b里会疼㊙️

    75.97MB
    679好评

    吃奶玩❌奶🔞头㊙️

  • 91成年人网页版入口免费

    猛男被❌猛男🔞cao尿㊙️

    小❌樱斑🔞佐助鼬㊙️雏田

    65.23MB
    745好评

    ❌杨六🔞郎尝㊙️遍少妇十大名器

  • ❌FreeHD🔞 XXXⅩ 19-22HD㊙️

    ❌各种🔞异物虐女㊙️人下身小说

    一男一女做爰高❌潮A🔞片野㊙️外

    54.21MB
    751好评

    ❌肉園第1巻🔞[㊙️えだ]在线观看

  • 国产粉嫩嫩0❌0在🔞线㊙️正在播放免费

    王者荣❌耀大🔞乔被躁㊙️

    10个妙招❌帮你🔞自然流产㊙️

    57.21MB
    683好评

    主人用线把❌我🔞奶头捆起㊙️来

  • ❌虞书欣ai换🔞脸无删㊙️减版观看

    特种兵男朋❌友一🔞晚上六次㊙️

    成❌人🔞性做爰有声mp3㊙️

    24.18MB
    359好评

    叉逼视频免费软件

  • ❌欧美成人🔞丝袜㊙️视频二区

    Al生成敖❌闰🔞视㊙️频

    高清mv无字幕视频素材窗口

    13.03MB
    316好评

    哈昂哈昂动图❌无数mb🔞a智库㊙️

  • 情人很❌会玩🔞我,㊙️特别舒服

    夜晚做运动30分钟

    ❌日🔞本少㊙️妇BBw高潮喷水三个老头

    84.92MB
    213好评

    《The❌ Cursed Prin🔞ce》㊙️

  • 欧美产品的生产日期怎么看

    ❌韩国三🔞级HD在线㊙️播放

    18禁免费无遮❌挡🔞网站视㊙️频日本

    45.93MB
    732好评

    国产成❌人精品🔞久久㊙️久久漫画

  • Fre❌e性🔞开放小少㊙️妇SexⅠ8

    ❌调🔞教打屁股网站㊙️

    没带套子让他c了一整天

    10.65MB
    188好评

    女尊❌女打男屁股f🔞m㊙️

  • 教室❌摸🔞湿娇喘㊙️闷哼H

    亚洲❌女人户🔞外小便㊙️pP

    《女老师4》中文语字

    44.97MB
    363好评

    很黄❌很🔞细的自慰㊙️小说女

  • 《蜜桃成❌熟🔞时33㊙️D》国语

    ❌胸大🔞美女又黄的漫画㊙️

    在线观看曰逼视频下载

    91.95MB
    202好评

    ❌老人XXXXXXX🔞XX20㊙️23

  • 被同❌桌c到🔞高潮婬荡㊙️呻吟在线观看

    国产麦片

    免费又❌黄又爽🔞A片㊙️免费看软件

    30.94MB
    903好评

    逼丰满日起爽

  • 深夜18款黄app免费入口

    日❌本D🔞J㊙️油舞

    纱仓真菜SSI❌S🔞-2475在㊙️线观看

    30.04MB
    549好评

    触手灌❌满🔞到腿抽搐合不拢㊙️视频

  • ❌国产区🔞中文区欧美区㊙️

    国产A❌V🔞无码精品一区二区㊙️

    ❌申🔞鹤奖励旅行者㊙️

    29.70MB
    127好评

    虞书欣身❌材深🔞v㊙️抹胸裙

  • 魅惑❌のマン🔞ジ动漫第二㊙️集

    怏猫短视频3秒入口跳

    ❌还逃🔞吗乖张㊙️腿

    70.21MB
    450好评

    蜜中蜜❌在线观🔞看视㊙️频

  • ❌张行长将🔞她双腿分得㊙️更开卡5卡6卡7国产高清 title="❌男女乱婬视频在🔞线㊙️观看" class="0v5366j9r7414 app-list-img" src="https://t11./it/u=1040017057,165456434&fm=30&app=106&f=JPEG?w=312&h=208&s=15B07D95426079116A1494FD03009032"">

    Z0Z0马与Z0❌Z🔞0人马区㊙️别

    国产动❌漫美女裸🔞体视频㊙️

  • 男人的天❌堂9🔞787504㊙️344ysl水蜜桃86在线视频 title="女士❌罩🔞衣㊙️" class="0v5366j9r7414 app-list-img" src="https://t10./it/u=3070224572,165461829&fm=30&app=106&f=JPEG?w=312&h=208&s=C6000AAC4838BAC8463F54AC0300A00B"">

    最大❌荫🔞蒂㊙️

    ❌再深点灬舒服灬受不🔞了了㊙️小说

  • Ga❌yFuCK激情体育🔞生㊙️镜子前窗喷(❌高H🔞,㊙️NP) title="12❌岁🔞女孩偷偷手婬会㊙️得白血病吗" class="0v5366j9r7414 app-list-img" src="https://t12./it/u=1041590673,165100299&fm=30&app=106&f=JPEG?w=312&h=208&s=D7383EC642E1D8EA0A87937F0300C078"">

    日k线b

    一❌肖🔞一码100㊙️-准资料2025

小❌蛇钻🔞入秘㊙️密花园 类似软件

猜你喜欢

包含 饿了么 的应用集
评论
  • 戍❌人🔞视㊙️频 7天前
    纱❌布摩🔞擦g㊙️ui头调教
  • 在线观看免费 9天前
    免费的逼视频
  • 黄金网站❌app🔞观看大全代㊙️码 3天前
    朋友的沣满的姨妈
  • 香蕉文❌化漫画书🔞阅读下拉式㊙️ 5天前
    国产男❌女猛进猛出精品🔞91㊙️
  • 动漫美女❌和男生一🔞起㊙️努力生孩子网站 3天前
    高清免费观看电视网站
  • 女❌生在你面🔞前挺酥㊙️胸 4天前
    伸❌进丁字🔞裤揉到高潮嗯啊㊙️视频
  • 麻❌豆精🔞品自慰喷㊙️水 7天前
    ❌丁🔞丁环切手㊙️术过程视频
  • ❌许老汉🔞的春天许㊙️静陈婷小说 5天前
    法国❌女星🔞vanessa㊙️
  • 男人女人日皮 4天前
    ❌又黄🔞又湿视㊙️频
  • 9❌9🔞re在线精品国产㊙️欧美 7天前
    曰本一超爽免费试看视频