课程介绍
张富刚老师,5年大数据、人工智能开发经验,曾经任职于HPE、国家生物研究院等多家企业,负责过HPE国内基地海量数据的共享与存储平台、医疗大数据存储解决方案、基于基因信息诊断模型(借助TensorFlow、Keras)的优化、华数TV视频推荐等项目,精通Hadoop、Storm/Jstorm、Spark,Flink,kafka等技术,尤其对于Spark、Flink有着独特的见解
课程简介
Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
课程目录
尚学堂科技_张富刚_01_Spark初始
尚学堂科技_张富刚_02_RDD+Spark部分算子
尚学堂科技_张富刚_03_Spark部分算子1
尚学堂科技_张富刚_04_WordCount
尚学堂科技_张富刚_05_持久化
尚学堂科技_张富刚_06_Spark集群搭建
尚学堂科技_张富刚_01_Spark on Standalone,Yarn
尚学堂科技_张富刚_02_资源调度源码
尚学堂科技_张富刚_03_RDD的宽窄依赖
尚学堂科技_张富刚_04_Spark任务调度
尚学堂科技_张富刚_05_Spark任务调度源码分析+ yarn
尚学堂科技_张富刚_01_广播变量
尚学堂科技_张富刚_02_累加器、分组取TOPN、 二次排序
尚学堂科技_张富刚_03_Spark HA
尚学堂科技_张富刚_04_Spark shuffle
尚学堂科技_张富刚_05_Spark案例PV UV
尚学堂科技_张富刚_06_Spark总结
尚学堂科技_张富刚_01_自定义分区
尚学堂科技_张富刚_02_Spark Demo
尚学堂科技_张富刚_03_SparkSQL
尚学堂科技_张富刚_04_Spark SQL连接MySQL
尚学堂科技_张富刚_05_Spark on Hive整合
尚学堂科技_张富刚_06_UDF UDAF开窗函数
尚学堂科技_张富刚_01_SparkStreaming初始
尚学堂科技_张富刚_02_Driver HA
尚学堂科技_张富刚_03_SparkStraming有状态算子
尚学堂科技_张富刚_04_Kafka
尚学堂科技_张富刚_05_SparkStreaing 整合kafka
尚学堂科技_张富刚_06_SparkStreaming动态改变广播变量的值
评论0