请联系主办方进行认证,即可解锁访问限制。
为了不影响召集报名,请您进行认证,即可解锁访问限制。
珠海-大数据Spark高级实战培训班
该主办方未认证,请注意风险防范!
{{list.startDate}} ~ {{list.overDate}}
{{list.overDate}}结束
{{list.startDate}}开始
票种
-
免费 ¥{{toDecimal2(item.price)}} {{item.name}} ¥{{ toDecimal2(item.plusPrice) }} 优惠码减免¥{{item.discountMoney}} 优惠码折扣{{item.discountRate}}%
-
免费 ¥{{toDecimal2(item.price)}} {{item.name}} ¥{{ toDecimal2(item.plusPrice) }} 优惠码减免¥{{item.discountMoney}} 优惠码折扣{{item.discountRate}}%
{{item_time_note}} {{ticketText != ''&&item_time_note!=''?'(':''}} 说明:{{ticketText}} {{ticketText != ''&&item_time_note!=''?')':''}}
数量
领券
-
立减{{coupon.couponDiscountMoney}}元
满{{coupon.couponLimitMoney}}减{{coupon.couponDiscountMoney}}
该主办方未认证,请注意风险防范!
互动吧
{{pub_count}}
活动{{fansCount}}
粉丝{{shopDesc|html}}进店 >
Ta组织活动太忙,还没腾出空写简介进店 >
一、 培训时间
2019年1月18日-12月20日 (珠海) (17日中午12点至19点报到)
二、课程费用
培训费5800元/人(含培训、教材、专家、场地、证书、学习用品费等),需要住宿学员请提前通知,可统一安排,费用自理。
注:参加相关培训并通过考试的学员,可以获得:
1.工业和信息化部颁发的《Spark大数据处理高级工程师证书》该证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。
注:请学员带一寸彩照2张(背面注明姓名)、身份证复印件一张。
三、课程简述
本课程基于最新的spark 2讲解,内容涵盖了企业中大数据处理的四大场景:
离线批处理、流式计算、SQL处理、机器学习。Spark是一个广泛应用的分布式内存计算模型,旨在大幅提升的迭代算法和交互低延迟数据挖掘的性能。Spark更适合于迭代运算比较多的ML和DM运算,one stack rule them all!Spark号称一个平台可以适合所有的应用,如SparkSql可以处理结构化数据,SparkStreaming旨在提供实时的计算能力,而SparkMllib则提供了丰富机器学习算法库。Spark三天课程注重原理、丰富的案例和大型互联网实战详解。
四、课程目的
1) 深入理解Spark计算原理和编程模型,掌握Spark Core和SparkSql、SparkStreaming等上层系统的结合方式
2) 深入掌握SparkCore、SparkSql使用调优技巧
3) 深入掌握SparkStreaming和SparkMllib使用和调优技巧
4) 深入掌握Spark和其他组件的结合使用
5) 了解Spark与MapReduce分布式计算模型的区别和各自适合的使用场景。
6) 能够使用java、python和scala进行spark应用开发(如果要讲解三种语言开发spark,工作量会非常大,建议只讲解一种(可以根据企业的要求来定,)
7) 熟练使用spark、spark streaming、spark SQL、spark mllib
8) 深入了解spark在大型互联网的架构和使用场景
五、培训对象
1)已经熟练掌握Sparkapi并希望深入掌握性能调优方法的开发人员
2)希望使用SparkSql进行高效结构化数据处理的开发人员
3)希望使用SparkStreaming提高数据处理实效性的开发人员
4)技术经理、架构师、产品经理
六、培训大纲(3天课程)
日程 | 课程主题 | 主要内容(内容可以根据学员的要求现场定制化和调整) |
第一天 | Spark 2.1概述 | 1、Spark产生背景,包括mapreduce缺陷,多计算框架并存等 2、Spark 基本特点 3、Spark版本演化 4、Spark核心概念,包括RDD, transformation, action, cache等 5、Spark生态系统,包括Spark生态系统构成,以及与Hadoop生态系统关系 6、Spark在互联网公司中的地位与应用 7、介绍当前互联网公司的Spark应用案例 8、Spark集群搭建,包括测试集群搭建和生产环境中集群搭建方法,并亲手演示整个过程 9、背景知识补充介绍 |
第一天
| Spark Core | Spark 程序设计与企业级应用案例 1、Spark运行模式介绍 Spark运行组件构成,spark运行模式(local、standalone、mesos/yarn等) 2、Spark开发环境构建 集成开发环境选择,亲手演示spark程序开发与调试,spark运行 3、常见transformation与action用法 介绍常见transformation与action使用方法,以及代码片段剖析 4、常见控制函数介绍 包括cache、broadcast、accumulator等 5、Spark 应用案例:点击流日志分析 包括:背景介绍,数据导入,数据分析,常见Spark transformation和action用法在线演示 |
第一天 | Spark 内部原理剖析与源码阅读 | 1、Spark运行模式剖析 深入分析spark运行模式,包括local,standalone以及spark on yarn 2、Spark运行流程剖析 包括spark逻辑查询计划,物理查询计划以及分布式执行 3、Spark shuffle剖析 深入介绍spark shuffle的实现,主要介绍hash-based和sort-based两种实现 4、Spark 源码阅读 Spark源码构成以及阅读方法 |
第二天 | Spark 程序调优技巧 | 1、数据存储格式调优 数据存储格式选择,数据压缩算法选择等
2、资源调优 如何设置合理的executor、cpu和内存数目,YARN多租户调度器合理设置,启用YARN的标签调度策略等
3、程序参数调优 介绍常见的调优参数,包括避免不必要的文件分发,调整任务并发度,提高数据本地性,JVM参数调优,序列化等
4、程序实现调优 如何选择最合适的transformation与action函数
5、调优案例分享与演示 演示一个调优案例,如何将一个spark程序的性能逐步优化20倍以上。
|
第二天 | Spark sql 2.1 | Spark SQL基本原理 1、Spark SQL是什么 2、Spark SQL基本原理 3、Spark Dataframe与DataSet 4、Spark SQL与Spark Core的关系
|
第二天 | Spark SQL 程序设计与企业级应用案例 | 1、Spark SQL程序设计 a. 如何访问MySQL、HDFS等数据源,如何处理parquet格式数据 b. 常用的DSL语法有哪些,如何使用 c. Spark SQL调优技巧 d. 数据倾斜解决方案 |
第三天 | Spark Streaming 程序设计及应用案例 | 1、Spark Streaming基本原理 a. Spark Streaming是什么 b. Spark Streaming基本原理 c. Structured Streaming d. Spark Streaming 编程接口介绍 e. Spark Streaming应用案例 2、Spark Streaming程序设计与企业级应用案例 a. 常见流式数据处理模式 b. Spark Streaming与Kafka 交互 c. Spark Streaming与Redis交互 d. Spark Streaming部署与运行 e. Spark Streaming企业级案例:用户行为实时分析系统 |
第三天 | Spark Mllib Spark MLlib及企业级案例(用户画像案例) | 1. Spark MLlib简介 2. 数据表示方式 3. MLlib中的聚类、分类和推荐算法 4. 如何使用MLlib的算法 5. Spark MLLib企业级案例:用户画像之性别预测 |
第三天 | Spark综合案例 信用评分实时分析系统 | 1. 背景介绍 2. 什么是Lambda architecture 3. 利用Spark Core+MLlib+构建离线处理 4. 利用flume+Spark Streaming+Redis构建实时处理线 5. 整合批处理和实时处理线 |
讲师介绍
周老师:基地金牌讲师:腾讯大数据资深专家,6年以上大数据开发经验,熟悉hadoop 以及spark 生态系统,负责大数据平台及机器学习平台的研发及运营工作,对自然语言处理、机器学习、用户画像建模、个性化推荐等技术有深厚的积累。2011年在移动互联网公司做大数据开发,负责hadoop、spark的基础平台开发。2015年加入前3的手机厂商,负责hadoop、spark运维以及相关和个性化推荐的工作。实现spark 和hbase 从无到有的过程。2016至今在腾讯从事大数据开发工作,负责平台的大数据平台研发,主导了内部核心画像系统,以及自助分析平台。
李老师:一线技术大咖,曾任职华为、腾讯大数据高级工程师,现就职于阿里巴巴,从事分布式sql技术研究和开发,具有6年以上大数据平台组件开发和调优经验,对Hadoop、Hive、Spark、Presto、Hbase、Kafka等开源系统有深度研究和开发。2010年毕业于北京航空航天大学,获信息系统专业硕士学位,随后加入华为,从事nosql技术研究,带领团队开发优化Nosql数据库内核,并从事行列混合存储的MPP系统研究和开发,并对spark内核进行优化,减少shuffle开销,随后主持华为终端数据平台部运营大数据平台建设。2016年加入腾讯数据平台部,从事基于HDFS的实时多维分析引擎开发。2018年加入阿里巴巴。
企业内训
聆听您的需求,定制属于您的专属课程
由企业客户培训负责人与我公司课程负责人对接联系
1、 需求调研——了解企业培训需求
2、 培训项目确认阶段——确定培训项目具体条款、培训交付、签订内训协议书
3、 培训需求分析阶段——制定培训计划、定制培训内容
4、 培训课程准备阶段——确认培训大纲、培训方式,安排培训相关行政事务
5、 培训课程进行阶段——与培训组织者共同对培训现场进行监督、填写培训评估表
6、 培训评估跟进阶段——课程反馈:1、参加者测试结果 2、培训效果评估报告
【关于本次主办方】
数环云创(北京)科技有限公司是一家致力于大数据行业一体化解决方案研究和行业应用平台开发的高科技公司,也是国内IT领域最具专业的信息化培训与项目咨询、解决方案服务提供商。数环云创旨在为各行业客户提供标准化、通用化的大数据解决方案。也是国内首家IT新技术领域的领航者。专注于云计算、大数据、物网、移动互联网的培训,也是国内第一家开展Hadoop、云计算的培训机构。
数环云创长期致力于企业信息化培训与项目咨询、解决方案服务。为客户量身定做培训计划,提供满足企业整体培训的解决方案。目前已成功举办300多次企业公开课培训,50多次企业内训。现已成为国内最大的云计算、大数据人才培养基地。
数环云创拥有一批来自一线互联网行业(包括阿里、百度、腾讯、IBM、微软、Teradata等)知名的技术专家和管理人员组成的培训讲师团队,分别在高校、金融银行业、电信业、互联网行业、医疗、电商、**交通等领域有丰富的实战经验。是工信部权威机构的合作单位,是Hadoop、云计算大会特邀合作伙伴。
温馨提示:
在付费报名之前请仔细甄别主办方的资质及服务能力。部分主办方会私下与报名者沟通承诺参与活动后的权益,并夸大参与后的收益效果等,以此来收取高额的报名费。这类活动通常有基于抖音、淘宝等平台的推广、代理加盟、引流变现等相关内容。
为保障您的权益,避免相关的经济损失,互动吧平台特此说明,平台仅提供相关的技术支持,不承担参与者与主办方在活动过程中的相关纠纷,若出现相关纠纷,平台会积极协助处理。
- 为你推荐
-
{{hot.infoStartTime}}
{{hot.infoStartTime}}
{{hot.infoStartTime.substr(0,16).replace(new Date().getFullYear()+'-','')}}
Live{{hot.plusDiscountPriceRange}}{{hot.priceWithSign}} {{hot.highlight|html}}
加载中
该主办方未认证,请注意风险防范!
{{pub_count}}
活动{{fansCount}}
粉丝{{shopDesc|html}}进店>
Ta组织活动太忙,还没腾出空写简介进店>
一对一为您答疑解惑
-
{{selectlist.title}}
{{selectlist.infoDate}}{{selectlist.priceWithSign}} {{selectlist.plusDiscountPriceRange}} {{selectlist.highlight}}
-
{{list.shortName}}天{{list.desc1}}{{list.desc2}}
成为银牌会员
{{infoText}}
-
高端模板免费用
提升活动人气
-
活动排名加权
提升活动排名
-
去除报名页广告
提升活动报名效果
-
高端邀请海报
全场无限使用
-
活动优先审核
快人一步上架曝光
-
大额提现
限额提升4倍
-
报名渠道监测
掌握各渠道业绩
-
发布多场次活动
发布一次一劳永逸
-
免认证服务
免99元审核服务费
-
更多特权
敬请期待
马上开通
-
{{item.type}}
¥{{item.price}}/{{item.viewType}}
¥{{item.oriPrice}}/{{item.viewType}}
季卡、半年卡、年卡均已包含认证审核服务费,支持开具发票
使用微信或支付宝扫码完成支付
支付金额:¥{{selectGrItem.price}}/{{selectGrItem.viewType}}(已省¥{{selectGrItem.oriPrice - selectGrItem.price}})
购买成功
已购买{{orderName}}
支付金额:¥{{payMoney}}
购买商品:{{orderName}}
扫码支付更轻松
购买成功
已购买{{orderName}}
{{curMemberData.title}}
{{curMemberData.tip}}
-
{{item.name}}
查看更多权益>
{{curMemberData.tags[0].name}}
查看更多权益>
{{item.imgText}}
- {{temp.text}}
购买成功
您已成功购买{{checkMemberData.name}}
扫码