• <sup id="my82s"><source id="my82s"></source></sup>
  • <legend id="my82s"><div id="my82s"></div></legend>
    <li id="my82s"><tt id="my82s"></tt></li>
    <bdo id="my82s"><rt id="my82s"></rt></bdo>
  • 查看: 5027|回复: 0

    《Hive数据仓库实践》互联网一线讲师亲自授课,引领学员从实践中收获知识

    [复制链接]
    招聘 : 数据库管理员
    论坛徽章:
    83
    IT宝贝
日期:2013-11-15 18:40:242015年新春福章
日期:2015-03-06 11:57:31美羊羊
日期:2015-03-04 14:48:58马上加薪
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有车
日期:2014-02-19 11:55:14马上有车
日期:2014-02-18 16:41:112014年新春福章
日期:2014-02-18 16:41:11
    跳转到指定楼层
    1#
    发表于 2016-10-25 10:49 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
          互联网时代下,数据量的急剧增长,传统的数据仓库已经无法满足。Hive作为Hadoop生态圈中的数据仓库解决方案随着开源社区的快速发展而逐步成熟,慢慢的在某些场景下替代企业级数据仓库,成为各大互联网公司数据仓库建设的必选方案,可以这么说,Hive已经成为大数据数据仓库的事实标准。

           本课程将从Hive的基本概念入手,深入解析Hive的使用方式、HQL语法以及常用的仓库模式设计和Hive优化方法,并对未来Hive的发展和高级特性做一些简单介绍,并通过最后的案例实践巩固学习内容。通过本课程的学习,将能够胜任大多数互联网场景下的大数据分析和数据开发任务。

    课程大纲
    第一课 Hadoop与MapReduce
       1) Hive在Hadoop Ecosystem中的地位
       2) Hive的版本演进与目前现状
       3) 课程实践环境说明
       4) 实操: Hive/Hadoop预备环境安装
    第二课 Hive的基本概念与QuickStart
       1) Hive的安装部署
       2) Hive的基本架构
       3) 启动Hive
       4) Hive命令行
       5) HiveServer与JDBC/ODBC
       6) 实操: Hive命令行和ThriftServer基本使用
    第三课 数据类型与文件格式
       1) Hive支持的基本数据类型
       2) Hive支持的集合数据类型
       3) Hive支持的文件格式与优劣对比
    第四课 HiveQL:数据定义
       1) Hive数据模型
       2) Database
       3) Table
       4) Partition
       5) 自定义存储格式
       6) 自定义表属性
       7) 常用创建/删除/修改表语法
       8) 实操: HQL 创建/删除/修改操作练习
    第五课 HiveQL:数据操作
       1) 加载数据(LoadData)
       2) 从查询计算结果加载数据(Insert Table  Select)
       3) 动态分区(DynamicPartitioning)
       4) CTAS(CreateTableAsSelect)
       5) 导出数据
       6) 实操: 练习以上数据加载计算和导出操作
    第六课 HiveQL:数据查询
       1) 从最简单的开始
       2) Select … From
       3) Where条件
       4) Group By条件
       5) Join
       6) 排序(OrderBy/SortBy)
       7) ClusterBy/DistributeBy
       8) 抽样(Sampling)
       9) Union
       10) 实操: 练习以上各种查询语法
    第七课 Hive函数与自定义函数
       1) 查看与调用函数
       2) 常用标准函数(UDF)
       3) UDAF
       4) UDTF
       5) UDF/UDAF/UDTF开发
       6) 实操: 练习并完成UDF Java开发的作业
    第八课 Hive常用模式设计
       1) 按天做Partition
       2) 分桶(Bucket)
       3) 压缩
       4) 表Schema变更
       5) 实操: 练习以上几种仓库设计模式
    第九课 Hive调优
       1) Hive参数说明
       2) Explain查看执行计划
       3) 控制Map/Reduce数
       4) 并行执行
       5) 推测执行
       6) Join优化
       7) 数据倾斜问题
       8) 动态分区优化
       9) 实操: 练习并理解不同优化参数下的执行逻辑
    第十课  Hive新特性与其他
       1) Hive on Tez
       2) Hive on Spark
       3) Hive与HBase集成
       4) HCatalog
    第十一课  案例
       1) 广告用户行为分析场景预备
       2) 构建Hive表与数据处理
       3) 常用分析案例
       4) 实操: 完成以上案例作业

    授课对象
    面向数据分析和数据开发,希望从事和进一步了解互联网数据仓库以及数据分析的学员。

    课程必备
    对Hadoop有一定的基础和认识
    了解SQL, 有使用MySQL/MSSQLServer/Oracle等数据分析基础
    有基本的Linux命令操作经验和Java开发经验

    收获预期
    掌握Hive的基本原理,掌握Hive的基本使用,掌握HiveQL的基本语法和常用优化措施,了解Hive数据仓库设计的方法,能够胜任数据仓库分析和数据开发的角色

    授课讲师
    朱广彬,5年以上大数据架构经验,关注大数据底层架构相关技术,致力于大数据处理技术在计算广告的应用,对Hadoop/Hive/HBase/Spark/Kafka等有深入的认识和实践经验,负责千台Hadoop集群、百亿流量的数据平台架构,Hadoop Contributor。
    github: https://github.com/zhuguangbin

    新颖的课程收费形式:“逆向收费”约等于免费学习,仅收取100元固定收费+300元暂存学费,学习圆满则全额奖励返还给学员!

    本门课程本来打算完全免费,某位大神曾经说过“成功就是正确的方向再加上适度的压力”。考虑到讲师本身要付出巨大的劳动,为了防止一些朋友在学习途中半途而废,浪费了讲师的付出,为此我们计划模仿某些健身课程,使用“逆向收费”的方法。
    在报名时每位报名者收取400元,其中100元为固定 收费,另外300是暂存学费,即如果学员能完成全部课程要求,包括完成全部的书面和互动作业,则300元全款退回,优秀的学员还可以获得礼品 奖励。如果学员未能坚持到完全所有的学习计划任务,则会被扣款。期望这种方式可以转化为大家强烈的学习愿望和驱动力!

    课程授课方式:
    1、 学习方式:老师发布教学资料、教材,幻灯片和视频,学员通过网络下载学习。同时通过论坛互动中老师对学员进行指导及学员之间相互交流。
    2、 学习作业:老师每周布置书面及互动作业,学员需按时按质完成作业。
    3、 老师辅导:根据作业批改中发现的问题,针对性给予辅导,帮助大家掌握知识。
    4、 结业测验:通过测验,完成学业。

    您是否对此课程还有疑问,那么请 点击进入 FAQ,您的问题将基本得到解答
    全国统一咨询热线 4008-010-006

    课程现开始接受报名,报名方式
    网上报名 请点击:HIVE数据仓库实践
    咨询Email :edu01@dataguru.cnedu02@dataguru.cn
    课程入门讨论咨询群:
    485625800(群内有培训公开课视频供大家免费观看)
    咨询QQ: 2222010006 (上班时间在线)

    您需要登录后才可以回帖 登录 | 注册

    本版积分规则 发表回复

    TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
      ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
      ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
    CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
    京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
      
    快速回复 返回顶部 返回列表
    亚洲三级理论
  • <sup id="my82s"><source id="my82s"></source></sup>
  • <legend id="my82s"><div id="my82s"></div></legend>
    <li id="my82s"><tt id="my82s"></tt></li>
    <bdo id="my82s"><rt id="my82s"></rt></bdo>