<delect id="j97xz"></delect>
    <b id="j97xz"><del id="j97xz"><em id="j97xz"></em></del></b>

    <ol id="j97xz"></ol>

      <ins id="j97xz"></ins>
        <output id="j97xz"><menuitem id="j97xz"><video id="j97xz"></video></menuitem></output>
        <noframes id="j97xz"><delect id="j97xz"></delect>

          <output id="j97xz"></output>
          <mark id="j97xz"></mark>
              <output id="j97xz"><cite id="j97xz"><noframes id="j97xz">
                大数据

                一文了解主流大数据ETL工具

                ETL是数仓库中的非常重要的一环,是承前启后的必要的一步。ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。

                danny_2018
                可视化
                2022-11-14 14:25

                TDengine的实践场景

                    前几日我们在讨论一个物联网场景时候,负责该项目的博士提出了一个他的想法--将各个采集的数据关联用以发现问题。我觉得这个思路不错,至于能不能做呢?我下来模拟了一下。我们这里使用的是Tdengine,我这里有d1表和d2表两个表。d1和d2是两个物联网的检测器对应的数据表。 那么我按照车牌号码去关联,数据库提示我不支持。这个结果其实也在我意料之中,毕竟时序数据库不属于RDB

                xuexiaogang
                数据挖掘
                2022-11-10 21:29

                谈谈基于事件驱动的数据架构

                在数字化时代,我们一直在处理数据,我相信大家已经看到了数据领域的一些结构性变化。不仅与架构相关,如今其大部分基于云而且还与团队和实施中涉及的某些角色相关。

                qing_yun
                数据分析
                2022-11-07 09:29

                如何做到用数据说话(一)

                本文内容受众不只限于数据分析师,因为事实上,不管是金融分析师、产品经理、项目经理、运营专员、市场营销专员或是销售经理,在工作中都或多或少需要向同事、老板、高管、或者客户用数据来展示自己的业绩/项目成果、公司的运行现状或者客户的需求满足。

                qing_yun
                数据分析
                2022-11-04 13:42

                Kyligence秋季线上论坛

                Kyligence秋季线上论坛

                服务器频道
                可视化
                2022-11-04 11:28

                看场景、重实操,实时数仓不是“纸上谈兵”

                企业 IT 领域掀起实时数仓热潮。然而,只要稍做梳理就会发现,实时数仓格局未定,各种流派群雄逐鹿,还有很多需要进一步探讨的话题方向。

                danny_2018
                数据分析
                2022-11-04 11:07

                谈谈企业数据价值计量的一个可行方法【航空公司案例】

                “数据”和“信息”这两个词有时混用是很常见的。信息是指对人类有意义的经过处理的数据。数据是信息的组成部分。

                qing_yun
                数据分析
                2022-11-01 16:13

                透过数据看本质,企业数字化转型离成功还有多远?

                数据管理团队是数据驱动的原动力,他们必须尝试采用不用的方式对数据进行管理,并培养企业的数据文化,以确保数据管理和数据团队能够有效的分析数据,并且让企业各部门直接协同利用数据。

                danny_2018
                可视化
                2022-10-31 11:01

                查看Spark任务的详细信息

                在学习Spark的过程中,查看任务的DAG、stage、task等详细信息是学习的重要手段,在此做个小结

                程序员欣宸
                Spark
                2022-10-31 07:38

                大数据时代,且看Flink如何叱咤风云

                大数据计算引擎的发展经历了几个过程,从第1代的MapReduce,到第2代基于有向无环图的Tez,第3代基于内存计算的Spark,再到第4代的Flink。因为Flink可以基于Hadoop进行开发和使用,所以Flink并不会取代Hadoop,而是和Hadoop紧密结合。

                danny_2018
                数据分析
                2022-10-27 16:11

                Spark千亿级数据去重,性能优化踩坑之路

                如果你的业务让你计算几个维度(广告位置、小时、广告类型等等吧,我就随便举个例子),每个维度的数据uv量级,方便业务评估和市场决策,数据精准度不要求完全精准,误差在1%以内就行了,你该如何做?

                qing_yun
                数据分析
                2022-10-27 14:39

                数据仓库与大数据有哪些区别?

                数据仓库发展了这么多年,技术与产品相对较为成熟,且有完整的建设方法论。技术上大多以大规模并行处理(MPP)、内存计算、列式存储为核心,产品上以 Teradata, Oracle, Vertica, Greenplum, SAP BW 等为代表。

                danny_2018
                数据挖掘
                2022-10-26 14:38

                干货 | 疫情背景下的中长期月度预测方案

                本文将分享一个基于疫情情况下的中长期月度间夜数据预测方法。传统的时间序列模型通过学习历史数据中趋势性和季节性的特征,能对月度数据做出相对有效的预测。而自从2020年以来,不时发生的疫情影响了历史数据相对规律的趋势性和季节性特征,也给基于传统时间序列模型的预测带来了难度。

                qing_yun
                数据分析
                2022-10-26 14:09

                如何处理缓存导致的无效曝光

                用户在App上的行为都通过埋点记录了下来,那在统计部分行为相关指标时,比如曝光人数、点击率等相关指标,就会因为缓存的影响导致统计的结果并没有真实反应用户的情况。就会导致曝光人数偏高、点击率偏低,在进行分析对比时就有可能得出错误的结论,进而导致决策的失败。因此需要一个方案来解决缓存对埋点数据的干扰。

                qing_yun
                数据分析
                2022-10-26 13:52

                企业运营:从信息化到数字化发展历程

                首先给本篇划定一个边界,不谈战略,也不谈商业模式,只谈企业运营。本文只是谈信息和数字化技术在过去、现在乃至未来的价值。

                qing_yun
                数据分析
                2022-10-24 13:56

                一文读懂选择数据湖还是数据仓库

                随着数据量、速度和种类的增加,选择合适的数据平台来管理数据从未像现在这样重要。

                qing_yun
                数据分析
                2022-10-20 13:48

                不可忽视的大数据分析技术十大趋势

                随着数字世界的不断发展,越来越多的企业组织开始实施数据驱动型(data-driven)发展模型,来增强客户体验、降低生产成本、优化运营流程,以及覆盖更广泛的客户群。

                danny_2018
                数据分析
                2022-10-19 10:01

                基于大数据模型的数字孪生建模方法

                所谓数据可视化是对大型数据库或数据仓库中的数据的可视化,它是可视化技术在非空间数据领域的应用,使人们不再局限于通过关系数据表来观察和分析数据信息,还能以更直观的方式看到数据及其结构关系。

                danny_2018
                可视化
                2022-10-17 10:45

                数据价值有效发挥的障碍:高级数据分析常见的五种挑战

                高级分析并不都是成功的。对于每一个令人印象深刻的案例研究或令人兴奋的头条新闻,都有几十个项目未能发挥其潜力。高级分析项目的探索性、反直觉性和技术性通常是每个项目面临挑战的原因。这些失败的背后还有什么原因呢?

                qing_yun
                数据分析
                2022-10-11 10:41

                公民数据科学家的局限性

                虽然公民数据科学家可能能够帮助完成一些数据准备和数据分析任务,但应该在真正的数据科学家的监督下完成,他们有必要的数学和统计学培训,以避免不良结果。

                qing_yun
                数据分析
                2022-10-10 14:17
                联系我们

                商务合作:

                Tel: +86-15801238530

                Email:sales@itpub.net

                媒体合作:

                Email:edit@it168.com

                亚洲三级理论