<delect id="j97xz"></delect>
    <b id="j97xz"><del id="j97xz"><em id="j97xz"></em></del></b>

    <ol id="j97xz"></ol>

      <ins id="j97xz"></ins>
        <output id="j97xz"><menuitem id="j97xz"><video id="j97xz"></video></menuitem></output>
        <noframes id="j97xz"><delect id="j97xz"></delect>

          <output id="j97xz"></output>
          <mark id="j97xz"></mark>
              <output id="j97xz"><cite id="j97xz"><noframes id="j97xz">
                数据分析技术不断发展,从传统数据仓库到云原生数据仓库,从数据仓库与数据湖两套架构到湖仓一体(Lakehouse)架构融合。多源异构的数据环境,多元且需实时分析的复杂场景,我们需要怎样的数据分析技术?

                数据仓库的性能问题及解决之道

                有了这些机制以后,esProc SPL 就可以充分利用硬件资源,将单机性能发挥到极致,不仅原来很多单机性能问题可以得到有效解决,甚至很多原来使用集群的计算现在也可以用单机搞定(可能更快),达到单机全能的效果。

                danny_2018
                数据分析
                2023-03-09 11:43

                StreamPark 2.0.0 重磅发布,首个 Apache 版本终于来了!

                StreamPark 2.0.0 正式发布!这是 StreamPark 加入 Apache 孵化器以来发布的第一个版本,也是一个重大功能更新的版本。

                danny_2018
                数据分析
                2023-02-22 11:01

                Apache Hudi 背后商业公司Onehouse宣布2500万美元A轮融资

                就在一年前,我们发布了 Onehouse——一种开放的、完全托管的、云原生的lakehouse服务——以从根本上缩短最先进的数据湖的价值实现时间。

                danny_2018
                数据治理
                2023-02-06 09:52

                哔哩哔哩?数据建设之路——实时DQC篇

                数据质量是基于大数据衍生的应用有效与否的重要的前提和保障之一。B站现在高速发展的业务需求以及未来能够依靠大数据孵化出更有深度和竞争力应用的愿景,都要求我们数据平台能够提供实时的、准确的、可以被各个业务方所信赖的数据。可以说,可信赖的数据,是大数据平台核心竞争力的体现。

                陶然陶然
                服务器/存储
                2023-02-01 15:48

                字节跳动数据湖在实时数仓中的实践

                本节我们讨论的是字节实时数仓场景的初探以及遇到的问题和解决方案。坦白地讲,在最初落地时大家对数据湖能支持线上生产的态度都是存疑的,我们开始的方案也就比较保守。我们首先挑选一些对比现有解决方案,数据湖具有凸显的优势的场景,针对其中的一些痛点问题尝试小规模的落地。  

                陶然陶然
                服务器/存储
                2023-02-01 15:47

                从 ClickHouse 到 ByteHouse:实时数据分析场景下的优化实践

                作为国内规模最大的 ClickHouse 用户,目前字节跳动内部的 ClickHouse 节点总数超过 1.8W 个。综合来说,字节跳动广泛的业务增长分析很多都建立在 ClickHouse 为基础的查询引擎上。

                danny_2018
                数据挖掘
                2023-02-01 10:04

                现在的湖仓一体像是个伪命题?

                数据湖和数据仓库一直以来都有十分密切的联系但同时存在显著的差异。数据湖更注重原始信息的保留,将原始数据“原汁原味”地保存下来是数据湖的首要目标。

                danny_2018
                数据治理
                2023-01-13 09:36

                一个理想的数据湖应具备哪些功能?

                从数据库到数据仓库,最后到数据湖,随着数据量和数据源的增加,数据格局正在迅速变化。

                danny_2018
                数据治理
                2023-01-06 09:36

                腾讯云DLC(数据湖计算)重磅支持Apache Hudi

                腾讯云数据湖计算 DLC(Data Lake Compute,DLC)提供了敏捷高效的数据湖分析与计算服务。该服务采用无服务器架构(Serverless)设计,用户无需关注底层架构或维护计算资源,使用标准 SQL 即可完成对象存储服务(COS)及其他云端数据设施的联合分析计算。

                danny_2018
                虚拟化
                2023-01-03 11:23

                解构现代数据栈

                现代数据栈或数据栈是作为企业数据基础架构基础的云原生应用程序的集合。现代数据栈的概念已迅速普及,并已成为各种规模的组织从数据中提取价值的事实上的方式。与工业价值链一样,现代数据栈遵循摄取、转换、存储和产品化数据的逻辑。

                danny_2018
                数据挖掘
                2022-12-26 16:07
                点击加载更多
                • 微信

                亚洲三级理论