发布时间:2025-05-14 02:08:00 分类:公司动态 浏览:

今天是大数据专题的最后一篇,来讲讲数据湖仓。█?为什么会有“数据湖仓”?前面我们提到,数据仓库出现于 1990 年代,主要基于 MPP(Massively Parallel Processing,大规模并行处理)或者关系型数据库实现,用于公司做数据存储、处理和分析,发展数据看板、BI(商业智能)等用途。而数据湖,出现于 2010 年代,主要基于大数据技术(Hadoop 等)生态,用于支撑多样化的数据存储,实时性更强,适合满足批处理、流式计算等业务场景。数据仓库的特点是,先做数据处理,搞得规范整齐之后,存起来。用的时候就直接用。它主要存的是结构化(行列)数据。数据湖的特点是,什么数据(结构化、非结构化、半结构化)都能存,不做预处理,先全部都存起来,等要用的时候,再处理。两种技术,各有优缺点:从成本的角度来看,数据湖的起步成本很低,但随着数据体量的增大,成本会迅速飙升。而数据仓库恰好相反,前期建设开支很大,后期成本增加趋缓。数据仓库和数据湖,都是基于数据进行价值挖掘,只是侧重点不同。对于公司来说,两者都有价值,所以,会选择同时建设。很显然,这不仅导致了高昂的建设投资成本,也使得数据存在冗余和重复。基于以上种种原因,业界就开始思考:是不是可以将数据仓库和数据湖进行结合,充分发挥两者的优势,弥补各自的缺陷呢?于是,就有一些服务商,开始研究如何将两者的能力进行“打通”。主要思路包括两种:一种是让数据仓库支持对数据湖的访问。还有一种,是让数据湖具备数据仓库的一些能力。前者比较有代表性的,是 2017 年 Redshift 推出的 Redshift Spectrum。它支持 Redsift 数据仓库用户访问 AWS S3 数据湖的数据。后者有代表性的比较多,包括 2017 年 Hortonworks 孵化出的 Apache Atlas 和 Ranger 项目,2018 年 Nexflix 开源的内部增强版本元数据服务系统 Iceberg。2018-2019 年,Uber 和 Databricks 相继推出了 Apache Hudi 和 DeltaLake,推出增量文件格式,用以支持 Update / Insert、事务等数据仓库功能。所有这些尝试和努力,都多多少少存在一些缺陷(数据仓库和数据湖存在本质的区别,整合难度很大),并不算成功。2020 年,数据智能独角兽公司 Databricks(没错,就是提出 Delta Lake 的那个公司,数据湖的代表公司)正式提出了数据湖仓(Data Lakehouse)概念。Databricks 联合创始人兼首席执行官阿里?戈德西(Ali Ghodsi)表示:“从长远来看,所有数据仓库都将被纳入数据湖仓,这不会在一夜之间发生 —— 这些东西会共存一段时间 —— 在价格和性能上,数据湖仓完胜数据仓库。”数据湖仓,也被称为湖仓一体。2021 年,“湖仓一体”首次被写入 Gartner 数据管理领域成熟度报告。2023 年 6 月,大数据技术标准推进委员会发布了《湖仓一体技术与产业研究报告(2023 年)》。这一年的 6 月 26 日,“湖仓一体”在中国大数据产业发展大会上成功入选“2023 大数据十大关键词”。█ 数据湖仓的主要特点数据湖仓(湖仓一体),说白了,就是一种将数据仓库和数据湖打通的新型开放式架构。它既具备数据湖的灵活性,也具备数据仓库的高性能及管理能力,为公司进行数据治理带来了更大的便利和更高的效率。在数据湖仓的底层,支持多种数据类型并存,能实现数据间的相互共享。在数据湖仓的上层,可以通过统一接口进行访问,可同时支持实时查询和分析。数据仓库和数据湖这两套体系相互打通之后,数据可以在两者之间自由流动。也就是说,数据湖里的“新鲜”数据(热数据),可以流到数据仓库里,直接被数据仓库使用。而数据仓库里的“不新鲜”数据(冷数据),也可以流到数据湖里,低成本长久保存,供未来使用。数据湖仓的特点,其实就是数据仓库的优点 + 数据湖的优点。在数据存储方面,继承了数据湖的优势,支持多样化数据,且以 HDFS 或云对象存储为基础,实现了低成本、高可用。数据以原始格式或开放文件格式(如 Parquet、ORC)存储,具备高效的压缩比与列存储特性,方便查找。开放文件格式,也保障了数据在不同计算引擎间的通用性。数据湖仓同样支持 Iceberg、Hudi、Delta Lake 等开放表格式。它们不仅支持数据的近实时更新、高效的快照管理,还兼容 SQL 标准,使得数据既可以像传统数据库表一样进行事务性操作,又能充分利用数据湖的分布式存储与弹性计算优势。在计算引擎方面(采用存算分离架构),整合了 Spark、Flink、Presto、Doris 等多样的计算引擎。通过统一的调度与资源管理,不同引擎可以共享存储资源,协同处理复杂的数据工作流,满足公司从实时监控到深度分析的全方位计算需求。阿里云数据湖仓架构(来自阿里云官网)在数据一致性方面,提供 ACID(原子性、一致性、隔离性、持久性)保证,确保数据写入的一致性,保证了多方同时读取或写入数据时的数据准确性。在数据管理方面,数据湖仓实现了统一的元数据管理,支持全链路血缘,提供统一的命名空间、全局的数据目录。无论数据存储在何处,使用何种计算引擎,用户都能通过统一的 API 进行快速检索、理解与访问数据。数据治理,变得非常高效。在数据安全方面,数据湖仓一般还支持多租户和库表列级数据权限,能够很好地进行租户隔离和数据权限管控,确保了数据的安全性和隐私性。当然了,数据湖仓也不是没有缺点。作为一项融合的技术架构,它的复杂性比较高,需要很高的技术门槛。而且,它的早期投资比较大,对公司来说有一定的成本压力。数据湖仓的性能优化、数据治理以及安全防护,也存在一定的挑战。这些门槛和挑战,往往会让公司用户望而却步。█ 数据湖仓的参考架构数据湖仓诞生至今的时间并不是很长。从最开始的仓和湖独立建设,到后来,逐渐形成了“湖上建仓”与“仓外挂湖”两种实践路径。湖上建仓,是指基于数据湖架构,或者以数据湖作为数据存储中间层,实现多源异构数据的统一存储。然后,以统一调用接口方式调用计算引擎,最终实现上下结构的湖仓一体架构。仓外挂湖,是指以 MPP 数据库为基础,使用可插拔架构,通过开放接口对接外部存储,实现统一存储。随着时间的推移,也有公司开始推出两种架构的深入融合。目前,在数据湖仓领域比较有代表性的服务商,包括国外的 AWS(亚马逊云科技)、微软 Azure?、Databricks、Snowflake,以及国内的阿里云、腾讯云、华为云、星环科技等。各大服务商的架构有较差的差异,但基本上都包括存储层、元数据管理层、计算引擎层、服务与治理层等。以下是几个比较有代表性的架构,供参考。科杰的数据湖仓架构:图片来自网络Azure 的数据湖仓架构:图片来自网络AWS 的数据湖仓(他们叫智能湖仓)架构:图片来自“特大号”基于 Apache Doris 的湖仓一体架构:图片来自网络█ 最后的话目前来看,数据湖仓正在加速成为公司重要的战略性基础设施,用于长期的数据价值挖掘,以及发展 AI 应用。根据毕马威的报告显示,86% 的海外公司计划统一其分析数据,以支持 AI 业务的开发。国内也是如此。例如腾讯、B站、小红书等头部互联网公司,都采用了数据湖仓架构,用于不同程度的 AI 应用。数据湖仓在实时流处理与机器学习方面表现出色,能够很好地满足大模型的训练需求,相信未来几年会得到更好的发展。好啦,以上就是对于数据湖仓的介绍。鲜枣课堂大数据专题系列到此结束。感谢大家的耐心观看!参考文献:1、《数据库、数据湖、数据仓库、湖仓一体、智能湖仓,分别都是什么鬼》,特大号;2、《从数据湖到湖仓一体:统一数据架构演进之路》,Light Gao,知乎;3、《数据仓库、数据湖、湖仓一体,究竟有什么区别?》,SelectDB,知乎;4、《什么是湖仓一体?湖仓一体解决了什么问题?》,帆软;5、《2024 大数据“打假”:什么才是真湖仓一体?》,张友东;大数据在线;6、《大数据架构系列:如何理解湖仓一体?》,叶强盛,腾讯云开发者社区;7、百度百科,维基百科,各大服务商官网。本文来自微信公众号:鲜枣课堂(ID:xzclasscom),作者:小枣君

天美麻花星空视频

到底是什么是“数据湖仓”
到底是什么是“数据湖仓”

致公党贵州省委副主任委员、贵州省算力科技有限责任公司总经理杨云勇接受监察调查

「活动」惭补驳别测测诲蝉测颈诲颈苍驳狈产25

87.35MB
版本痴81.3.47
下载亚洲综合久久久久久爽安装你想要的应用 更方便 更快捷 发现更多
喜欢 72%好评(21626人)
评论 13
到底是什么是“数据湖仓”截图0 到底是什么是“数据湖仓”截图1 到底是什么是“数据湖仓”截图2 到底是什么是“数据湖仓”截图3 到底是什么是“数据湖仓”截图4
详细信息
  • 软件大小: 61602.72076MB
  • 最后更新: 2025-05-14 02:08:00
  • 最新版本: V8.33123.9
  • 文件格式: apk
  • 应用分类:颈辞蝉-础苍诲谤辞颈诲 ❌《年轻🔞朋友的妻子3㊙️》
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 3.41450以上
应用介绍
一,丝袜老师办公室里❌做好紧🔞好㊙️爽视频,❌人🔞工授精㊙️视频
二,性奴❌撅着光屁🔞股让客人玩弄㊙️,午久久淫射夜久久逼
叁,map❌lestory动🔞画网站㊙️进入,从小调教❌亲妺妺成奴🔞的小㊙️说
四,❌唐舞桐胸🔞前被霍㊙️雨浩揉,❌王女美🔞柑㊙️3D未删减
五,《老❌师喂我🔞乳㊙️我掀奶罩》,乳❌夹+口🔞球+呜呜+挠脚㊙️心文章
六,久久久久97综合网,❌少年骇🔞客变㊙️身女版在线观看,1❌0_10_梨斗美柑h本全彩里🔞番㊙️
七,91成人插爽射逼热辣
【联系我们】
客服热线:134-2881-646
加载更多
版本更新
V1.2.15
❌斗鱼🔞美女主㊙️播软妹小九直播间
  • 拳皇女性裸体❌无🔞遮挡图㊙️片

    日产麻无矿码直接进入

    护士❌美女手套🔞榨精视频㊙️

    84683.51MB
    102好评

    ❌五个不🔞存在的奥特㊙️曼

  • 男❌女无🔞遮㊙️挡激烈啪啪裸交

    ❌51大豆行情网仙踪林老狼🔞广告介㊙️绍

    gb四❌77🔞77777㊙️

    68283.07MB
    408819好评

    n❌ai🔞mi奶咪㊙️福利最全合集

  • 鸣佐囚❌禁强迫h🔞文头条㊙️文章

    无码❌av炮机自🔞慰喷水性色㊙️

    亚洲尺码与日本尺码区别大全

    13.05MB
    318好评

    大鸡把进搔b了射精

  • ❌羽锡的Ggy2🔞022最新消㊙️息

    c❌hainaHDX🔞X㊙️XX天美传媒麻豆HD

    ❌9个🔞月孕妇猛烈在线播㊙️放

    53.78MB
    276好评

    少妇❌半推半就🔞A片视频㊙️

  • 曰我b射一b射一b射

    妮可基德曼❌R🔞级无删减电影㊙️

    ❌春丽里番AC🔞G☆里番本子全彩㊙️

    71.13MB
    701好评

    流黄❌白色分泌🔞物㊙️

  • 校花❌班长用玉足🔞玩我jij㊙️i巴

    人妻に媚薬❌を🔞盛られて乳首㊙️

    尺八快乐❌巡🔞り动漫㊙️免费观看

    83.11MB
    330好评

    吴艳妮❌自🔞慰写㊙️真集

  • 穿❌越🔞火线灵㊙️狐同人在线观看

    高清在线观看免费版ppt

    菠萝蜜一区1688进入

    23.07MB
    102好评

    被❌C哭还🔞流着尿㊙️高H视频

  • 久久舔人人爽爽爽日

    ❌樱花🔞校园正版下载入㊙️口中文版

    手机必备❌十大🔞黄㊙️油

    50.51MB
    920好评

    ❌黑🔞猴子官网㊙️black monkey

  • brazzersвине❌т🔞d202㊙️0ph

    他的舌头好灵活

    一本三道a无线v一区v黄色

    83.01MB
    565好评

    www.9ncc.cn免费网站浏览器

  • ❌女追男🔞的恋爱动漫㊙️

    国精产品厕所自偷入口

    ❌吴宣仪单女🔞主的同人㊙️小说

    83.59MB
    754好评

    爽 躁多水 快 深点叫

  • 久久久久爽射久久久久

    久久久插爽射精视频

    插快点插的深射的爽

    28.22MB
    4739好评

    久久久久久爽色888

  • ❌蜜桃🔞最新㊙️网名是多少

    草帽❌一🔞伙路飞罗宾㊙️

    第五❌人格🔞古董商㊙️本子

    16.18MB
    297好评

    ❌七八个月孕妇做🔞爰㊙️免费视频

  • 哥哥~慢一点~啊~高潮了

    sp打❌女生🔞屁股灌肠漫画㊙️

    4❌8首🔞动态㊙️表情包

    65.44MB
    749好评

    蜜桃w传w媒w少w妇入口

  • ❌鼬被大🔞蛇丸肉到失禁潮喷㊙️

    三玖❌堕🔞落小㊙️说

    ❌60🔞80yy伦理最新㊙️伦理观看

    54.93MB
    754好评

    宝宝❌~腿往🔞上抬㊙️老公来c你

  • 69.tv成人入口

    欧美天堂色淫干v

    拼多多上买❌片的🔞暗㊙️语

    57.25MB
    686好评

    朵朵女❌王在线榨🔞精㊙️

  • 校❌园暴🔞力扒衣无㊙️遮拦视频

    徐伦❌焕🔞判㊙️决

    爽爽爽射射射欧洲色淫

    24.08MB
    359好评

    ❌偷吃(🔞出轨)h㊙️护士

  • ❌科莱🔞特拔萝卜㊙️

    OVA❌催●性指🔞导5宫岛㊙️椿の

    ❌策驰🔞影㊙️视

    13.05MB
    317好评

    ❌泄密🔞A㊙️v视频导航

  • 啊~舔我b射进去吧~哈c

    久久舔人人爽爽人人片k

    原神女性失去尊❌严🔞的5种解㊙️决方法

    84.13MB
    211好评

    日韩❌精品无🔞码观看视㊙️频免费

  • 巨大な❌ヒロイン🔞在线观㊙️看

    百❌里玄🔞策怀孕的样㊙️子

    灵狐❌者被潜伏者俘虏的故🔞事㊙️情节

    45.13MB
    734好评

    ❌无套内谢大学处破🔞女福利㊙️

  • 欧美色❌少妇🔞高潮4444㊙️

    ❌朴妮🔞唛1一㊙️26集福利

    雷电❌将军美图微🔞黄㊙️

    10.74MB
    186好评

    Japese日本❌护士X🔞XXX18—1㊙️9

  • 8x8ⅹ拔擦❌拔擦永久免费🔞影㊙️库

    ❌希岛爱理ip🔞x955中㊙️文字幕

    成❌人亚洲🔞一区二区三㊙️区四区

    44.79MB
    365好评

    ❌卖小电影的🔞一天赚钱㊙️吗

  • 爽...插你逼...爽...插逼

    调❌教小鲜肉🔞捆㊙️绑男男gv视频

    扒开❌老🔞师双腿凶猛㊙️进入

    91.78MB
    208好评

    亚洲色淫干v天堂鸟穴

  • 欧美❌成🔞人3D㊙️动漫片h版

    杨洋嗯...❌舒服...🔞快...㊙️好大

    原❌神火🔞神㊙️裸体

    30.51MB
    904好评

    亚欧色妇a淫

  • ❌皇后含精🔞肉㊙️臀迎合娇吟H

    贞子被❌强行扒开🔞双腿㊙️玩弄小说

    ❌彭丹三级🔞奶头㊙️全乳

    30.13MB
    541好评

    9pro官方入口

  • 裸体女❌人🔞高潮A片裸交张柏㊙️芝

    九九草莓甜品完整视频

    ❌肥什🔞么㊙️意思?

    29.76MB
    128好评

    太敏感了怎么办

  • 各种露出羞辱❌的小🔞任务㊙️

    女侠裆部被各种❌刑具🔞折㊙️磨

    喷水了❌太爽了⋯高🔞潮小说㊙️

    70.46MB
    459好评

    97久久久久噜噜噜噜高潮

  • 韩漫Blood❌漫🔞画在哪可以看㊙️两❌个男🔞的做酿酿酱酱㊙️网页 title="久久久❌香蕉电影🔞院㊙️" class="0v5366j9r7414 app-list-img" src="https://t11./it/u=1040017057,165456434&fm=30&app=106&f=JPEG?w=312&h=208&s=15B07D95426079116A1494FD03009032"">

    林心如❌婬片A片🔞在线观㊙️看

    干逼片91

  • 奶头mjⅠ❌KbO🔞O㊙️bS奶水首页丨❌美脚社区|脚奴🔞调教㊙️视频 title="抬起妺妺❌的翘臀猛烈进🔞入㊙️软件" class="0v5366j9r7414 app-list-img" src="https://t10./it/u=3070224572,165461829&fm=30&app=106&f=JPEG?w=312&h=208&s=C6000AAC4838BAC8463F54AC0300A00B"">

    ti❌cklin🔞g欧美裸乳㊙️ 丨VK

    ❌九玄免费🔞版下载安装高风险㊙️

  • 天上人间电视剧全集❌人与🔞野鲁交XXXⅩ㊙️机器人 title="扒开腿挺❌进肉蒂抽🔞搐喷㊙️潮总" class="0v5366j9r7414 app-list-img" src="https://t12./it/u=1041590673,165100299&fm=30&app=106&f=JPEG?w=312&h=208&s=D7383EC642E1D8EA0A87937F0300C078"">

    正在❌播放F🔞C㊙️2PPV JUQ157

    op❌po202🔞5年最新㊙️款

旧里番-故に人妻は寝❌取ら🔞れ㊙️た 类似软件

猜你喜欢

包含 饿了么 的应用集
评论
  • ❌n🔞c18嫩㊙️草入口网页 1天前
    朴妮唛全部42集❌未删减🔞视㊙️频
  • ❌Asianspa🔞nk调㊙️教打屁股 8天前
    成年人必看3000部国产电视剧
  • 扒开嫩腿内侧插到高潮 5天前
    看男人日爽爽爽爽
  • oppo手机最新❌款🔞202㊙️5新上市 4天前
    久久淫逼噜噜噜
  • ❌3DH🔞enta㊙️ikiriko 0天前
    久久❌久久久精品无🔞码㊙️7777
  • 啊~舔我b~好爽~射精了 1天前
    chin❌es🔞e go to toil㊙️et 2
  • 完❌美世界清漪的堕落小说免费🔞阅㊙️读 1天前
    ❌被男人🔞在公车摸到高㊙️潮
  • 女❌追男的🔞漫画有哪㊙️些 5天前
    啊高潮了❌⋯嗯~🔞喷水㊙️了啊~
  • 小❌正太穿三🔞角裤的图㊙️片 2天前
    짱❌짱걸蹭门把🔞手㊙️视频来了
  • 莫妮❌卡被爆🔞�7㊙️�4羞羞视频最新 4天前
    电车❌上的侵🔞犯㊙️h文