主流工具与技术实践
课程介绍
0课时
初级难度
工具实践是能力提升的关键环节。Hadoop生态部分需掌握YARN资源调度机制,通过WordCount案例理解MapReduce编程模型,并对比Hive数据仓库与传统数据库的差异。Spark模块要重点讲解RDD弹性数据集特性,完成用户画像标签计算的实践项目,对比批处理与流处理的应用场景。数据库方面需区分HBase列式存储与MongoDB文档数据库的适用领域,完成电商评论数据的存储检索实验。可视化工具教学应包含Tableau仪表板制作与ECharts动态图表开发,通过疫情数据可视化案例展现数据叙事技巧。建议学员在AWS EMR或阿里云MaxCompute平台完成云端实验。
课程大纲
学习统计
学员评价