北海电脑维修站

北海电脑维修站

选择Visualize北海进入切片绘图模式电脑

直接出来了数据库的数据预览电脑连查询平台的颜值都那么高电脑大家的SQL技能应该都很不错北海有兴趣可以在这里练习一下北海语法和MySQL一致电脑其他数据库则是其他数据库的语法电脑



执行一段SQL语句北海它支持下载为CSV北海我没试过支持最大文件的大小北海但作为日常的查询平台是绰绰有余了电脑


选择Visualize北海进入切片绘图模式电脑



这里自动匹配支持的图表选项北海包括Bar Chart条形图北海Pir Chart饼图等电脑下面的选项是定义维度北海我们将city北海education北海postitionName北海salary北海workYear都勾选为维度电脑agg_func是聚合功能北海这里将职位ID求和北海改成count()北海点击生成图表电脑



这里按城市生成了各职位ID求和获得的条形图北海也就是不同城市的分析师人数电脑


左边Chart Options可以调整分析需要的维度电脑Metrics是分析的度量北海这里是count(positionId)北海Series是条形图中的类别北海Breakdowns可以认为是分组或者分桶电脑这里将Series改成workYear北海Breakdowns改成city北海点击Query执行电脑



条形图变更为按工作年限和城市细分的多维条形图电脑点击Stacked Bars北海则切换成堆积柱形图电脑操作不难电脑


左侧的选项栏还有其他功能北海这里就不多做介绍了北海和市面上常见的BI没有多大区别北海琢磨一下也就会了电脑

Superset支持的图表很丰富北海如果具备开发能力北海也能以D3和Flask为基础做二次开发电脑Airbnb官方也会不断加入新的图表电脑不同图表北海其左侧的操作选项也不同电脑


上图是以数据分析师职位名称为基础绘制的词云图北海生成的速度会比较慢电脑我们选择save保存电脑完成的图表均存放在切片下电脑


Dashboard通过多个切片组合完成北海每个切片连接不同的数据源北海这是BI的基本逻辑电脑进入看板界面北海新建一个Dashboard电脑

设置看板相应的配置选项北海因为我偷懒了北海所以只做了两个切片北海大家有兴趣可以继续增加电脑其他选项忽略北海都是自动生成的电脑点击save北海到这一步北海BI最重要的Dashboard就完成了电脑


最终的成果编辑本段回目录



关于Superset的新手教学结束了北海要是部署到公司北海账号和权限多研究下电脑它和市面上的其他BI没有太多区别北海不过它是我们用Python从零到有一手建立北海这个感觉可比用Excel爽不少电脑虽然我的演示以单机版为主北海将其建立在linux服务器上大同小异电脑


从零开始搭建到现在北海排除掉下载花费的时间北海大家可以计算是不是真的只用一个小时就搭建好一个数据分析平台?没骗你们吧电脑


通过搭建Superset北海数据分析新手对BI应该也有一个大概的了解北海市面上的BI大同小异北海只是侧重点不同电脑在Superset的基础上北海往底层完成埋点采集和数据ETL北海往上拓展报表监控北海CRM等北海这些也有不少开源软件可用电脑至于机器学习北海以及Hadoop和Spark更是一个大生态北海把这些都算上北海则是真正完整的大数据分析平台了电脑


Superset也有缺陷北海它使用的是ORM框架北海虽然它能连接众多的数据库北海但是它有一个关系映射过程北海将SQL数据转化为Python中的对象北海这也造成它在大数据量的处理效率不如专业的BI软件电脑在使用SQL工具箱时北海应该尽量避免超大表之间的关联北海以及复杂的group by电脑


我个人的建议是北海它只是一款轻量级的BI北海复杂的数据关联北海应该在ETL过程中完成北海Superset只需要执行最终结果表的读取即可电脑它足够支撑TB级别的数据源读取电脑技术比较成熟的团队北海也能尝试将Superset和Kylin整合北海这样OLAP的能力又能上一个台阶电脑

另外北海Superset中的表都是独立的北海所以多图表间的复杂联动并不支持北海仅支持过滤北海这点比较可惜电脑不知道Airbnb后续会不会支持电脑

好消息是北海这个开源项目一直在更新北海github什么也有很多新的功能特性待开发北海比如dashboard上加入tab切换栏等电脑可以star一下关注电脑


cache
Processed in 0.005007 Second.