《分布式课程培训.docx》由会员分享,可在线阅读,更多相关《分布式课程培训.docx(2页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、分布式课程培训课程简介:本培训课程针对有一定编程基础的学员:了解Linux,熟悉Java编程。通过本次课程,学员能够了解主流的分布式处理方案以及实际的实用案例,并能够根据自己的业务需要采 用相应的方案解决实际的问题。【主办单位】中国电子标准协会【协办单位】深圳市威硕企业管理咨询有限公司Dayl内容Hadoop Ecosystem与实际应用案例分布式存储系统:HDFS- 分布式计算系统:MapReduce海量数据分析系统:Hive- 分布式协调系统:Zooke即er分布式实时读写数据存储系统:HBase- 工作流调度系统:OoizeAM分布式解决方案介绍NoSQL与实际应用案例NoSQL与SQL
2、的关系- NoSQL适合的场景面向列的存储:Cassandra- 文档数据库:MongoDB优点- 不足图数据库:Neo4jMap Reduce编程详解map函数- reduce 函数排序与分区跨语言MR框架:StreamingPM海量数据分析技术-MAPREDUCE- 原理-实际应用Hadoop文件压缩 -gzip-bz2 -IzoHadoop文件格式-TextFile-SequenceFile-RCFile输入格式-TextlnputFormat-SequenceFilelnputFormat-RCFilelnputFormat输出格式-TextOutputFormat-SequenceFileOutputFormat-RCFileOutputFormat-Multipleoutputs海里网站日志分析系统示例网站日志介绍- 业务分析内容内容- 系统实现Day2am生产环境部署AMHadoop的架设与维参数配置护运维操作监控策略数据模型 编程接口- 一致性模型与数据容错CAP- ReadRepairHint- AntiPointPM底层文件存储格式Cassandra的原理与Map Reduce的整合与实际应用实际应用案例HBase数据模型编程接口底层文件格式集群管理数据容错与Map Reduce的整合