玩转大数据-简书的文章

大数据

Spark SQL之 Dataframe/Dataset

玩转大数据-简书阅读(28)评论(0)

该文章所有内容截选自实验楼教程【Spark2.x 快速入门教程】第二节内容~ 一、实验介绍 1.1 实验内容 从 Spark 2.0 始支持了SQL 2003 准语法。当我们使用某种编程语言开发的 Spark 作业来执行 SQL 时,返回的...

大数据

说说“算命”的那些事儿

玩转大数据-简书阅读(30)评论(0)

每当有人问我是做什么工作的时候,很难和人解释清楚数据分析是做什么的,用专业词汇吧大多数人听不懂,解释成卖软件吧感觉很low。现在很多新型名词的发明让信息社会更复杂。不擅长过度包装自己,不擅长不要脸的说自己是数据科学家,有充足的自知之明知道自...

大数据

浅谈数据仓库

玩转大数据-简书阅读(25)评论(0)

首先说说BI,我的理解BI包括DW,ETL和相应的可视化软件,现在一般的公司说要上个BI系统其实都是要从DW建模开始做,然后ETL,最后做对应的前端报表工具,虽然最终领导们只看到了自己想要的报表,但是这一套系统是需要DW和ETL支持才能更好...

大数据

深入理解HBase的系统架构

玩转大数据-简书阅读(26)评论(0)

初次接触HBase的读者,建议先阅读浅析HBase:为高效的可扩展大规模分布式系统而生 HBase的构成 物理上来说,HBase是由三种类型的服务器以主从模式构成的。这三种服务器分别是:Region server, HBase HMaste...