现在大数据概念被时常提起,社会各界对其关注度越来越高。往往越是火热的东西,人们越容易忽略它的本质。在 slides 中,我首先按照自己的理解,简单的理顺数据处理领域的发展历程。之后,落脚点是两个比较有代表性的混合的分布式系统: 和微软的 。由于缺乏实战经验,很多东西由各方论文和博文中得到,有不恰当的地方,欢迎大家拍砖讨论;)
slides 的提纲如下:
提纲
背景
- RDBMS 的出现
- 大数据时代到来
- NoSQL 技术
- 新时代的挑战
HadoopDB
- PB 级数据分析
- HadoopDB 是什么
- 框架和组件介绍
- 示例
- 总结
Polybase
- Polybase 总览
- PDW 结构
- Polybase 的实现
- 性能分析
slides 在线展示:
slides 下载:
版权声明:自由转载-非商用-非衍生-保持署名|