Tableau中文入门手册
本文是可视化神器Tableau快速入门的第一版,主要内容包含:
Tableau简介
Tableau是美国一家交互式商业智能数据可视化软件公司。用户可以通过Tableau的产品查询关系数据库和电子试算表以及可视化数据。
tableau是一个非常强大的数据分析与可视化工具,它支持连接本地或云端数据,不管是电子表格,还是数据库元数据,都能进行无缝连接。拖拽式操作,实时生成各种炫酷的图表与趋势线。交互式操作,动态呈现数据变化趋势。
安装方法
首先在官网上下载对应的安装包,如果你能力够强,可以找到破解方法;否则的话,就在某宝上买个注册激活码,20块一年的有限期,然后傻瓜式安装。
- 下载安装包
- 网上寻找破解方法,或者某宝购买注册码
- 傻瓜式安装
常用操作
下面会介绍各种tableau中的基本操作:
连接文件
在tableau中可以连接各种文件,比如内置的Excel文件、文本文件、json文件、PDF文件等,甚至还可以连接各种服务器的数据
连接文件
连接到本地的Excel文件(tableau内置的数据集)
数据预处理
Tableau在数据处理分析时候的4大界面区域:
介绍不同区域的功能:
左侧窗格:连接到不同的数据源;关联(类似SQL的join功能)、并集(合并多个sheet进行联结)
画布:将左侧窗格中的【订单】【退货】【销售人员】3个表拖到画布中
数据网格:显示当前的数据信息
数据更新与筛选
筛选器的使用:
字段操作
所有字段的名字不能重复,否则报错
数据类型更改
特别是地理位置的信息,要改成地理角色信息
取别名
字段拆分
1、默认是自动拆分
2、拆分生成的新字段可以进行删除
自定义拆分,使用自定义的符号来进行拆分:
看下最终的具体效果,优点类似python的split函数切割之后取出第一个元素:
创建新字段
创建利润非空字段,空值用0代替
创建利润率字段
隐藏和显示字段
绘制柱状图
先记住一张图:如何绘制图形。这张图的作用是告诉你每种图适合于什么样的情形
创建工作表
基础柱状图
绘制不同子类别下产品的利润,我们使用拖拽的方式
使用右侧的自动创建图表:【智能推荐】
分类柱状图
同个维度下的不同指标
不同的子列别(列属性)下面有两个不同的度量值(利润和销售额,在行方向上)
多维度多指标柱状图
水平柱状图
显示数据的柱状图
将销售额这个度量值拖到标签中,柱子上面就会显示数据
将需要显示的数据放在标签中:
水平柱状图
选择多个维度下的数据:
绘制折线图
本节介绍的是利用tableau来绘制折线图
- 基础折线图
- 离散型折线图
- 连续型折线图
- 双折线图
基础折线图
随着时间变化的销售额:单折线图
离散型折线图
下钻到季度,表示的是不同年份不同季度下的数据:
在下面这个图形中:最上面有年份变化,下面是4个季度,数据是离散的
连续型折线图
在下面这个图形中,单击右侧【连续型折线图】的图案,年份和季度合并成一个信息,整个图形中的数据是连续的
双折线图
选择时间作为x轴(列),两个度量值作为y轴(行)
销售额和利润的高低应该是不同的,我们把y轴设置成相同的高度(数值):
在y轴的右侧,我们点击同步轴。数值大的表示销售额(上面),数值小的表示成本(下面)
显示数据折线图
将需要显示的数据,比如【销售额】拖入【标签】中:
绘制饼图
本节介绍的是如何利用tableau绘制各种不同需求下的饼图
基础饼图
先选中【地区】和【利润】,再选择右侧只能推荐中的【饼图】样式
也可以自己进行创建:
1、现在标记中选中饼图
2、设置角度大小(利润)和颜色(地区)
3、地区放入【标签】中,外围才会显示
带标记饼图
带数据饼图
不同分类饼图
针对不同【类别】下的【地区】绘制饼图
带百分比的饼图
绘制散点图
本节介绍的是如何利用tableau绘制各种散点图
散点图要求
【智能推荐】中显示:至少需要2个度量值才能进行显示散点图
基础散点图
下面创建的是不同订单id下利润和折扣的关系(散点图表示)
如果是我们自己创建散点图,订单id需要放在【详细信息】中。
在看一个例子:不同客户ID下利润和折扣的关系:
改变形状的散点图
设置不同的形状
带有颜色的散点图
将【利润】放在颜色信息中:
绘制词云图
词云图也叫做文字云,用来突出表示文本中出现次数较多的文字信息。
基础词云图
改变词云图颜色
将【销售额】拖到【颜色】
编辑改变不同的颜色样式:
改变词云图文本样式
绘制气泡图
本节介绍的是如何利用tableau绘制气泡图
基础气泡图
1、通过【智能推荐】的方式生成气泡图
设置气泡图颜色
气泡图变词云图
3、将圆变成文本,气泡图就会变成词云图
自定义气泡图
不使用自带的【智能推荐】方式,我们来自己做一个气泡图,先选择3个参数:
排序气泡图
进行升序和降序之后的排列情况:
改变气泡图颜色
多气泡图
在不同类别下的气泡图:
改变下每组的颜色:
绘制热图和突出显示图
热图,特殊情况下的突出显示图,是使用颜色比较分类数据,我们可以通过设置单元格的大小和形状来增强这种基本热图。
需要注意的是:颜色反映出连续的数据范围
基础热图
1、将【子类别】作为行的数据
2、将【颜色】和【大小】都设置成销售额的信息
通过右侧的【智能推荐】制图如下:
选择【子类别】和【销售额】,右侧直接选择【热图】即可。
突出显示图
通过文字和颜色来进行突出显示设置
文字:销售额
颜色:销售额
2、选择颜色和文本
3、选择【方形】
4、查看效果如下
如果是使用【智能推荐】:
绘制密度图
密度图表示的是数据分布的一种情况。
基础密度图
1、双击【国家/地区】和【城市和省/自治区】,上面会自动生成行和列的具体信息:
2、生成两张地图
3、选择双轴
散点密度图
1、将【客户名称】放在详细信息中
2、列:利润;行:销售额
3、改变颜色
绘制树状图
本节介绍的是如何使用Tableau来绘制树状图
基础树状图
我们查看的是不同类别下的不同子类别下的销售额情况:
1、设置不同的信息、包含:颜色、大小、标签、详细信息等
2、改变图形颜色
百分比树状图
采用【百分比】的形式表示数据情况
参考线
有时需要在视图中标出特定的点或者区域,以便突出显示预期点值或者相应的范围。在Tableau中使用【参考线】可以轻松实现这个功能。参考线有助于我们及时分析数据和观察、对比数据之间的差异。
本文中涉及到的几个概念需要理解下:
- 参考线:常量或者计算值,每根线一个值
- 参考区间:两个值之间标记背后的区域,值可以是常量或者计算值
- 参考分布:增减渐变阴影,适合于靶心图之类的图表
- 盒须图:显示四分位数和须状线
参考指标位置
不同参考指标的位置所在:【分析】里面
基础参考线
1、原图展示
选择【子类别】和【利润】分别作为列和行
2、拖拽产生参考线
3、选择参考线的参数和设置
最下面的一段话:为突出显示或选定的数据点显示重新计算的线,表示的意义是:我们重新选择某个区间,Tableau会自动更新均值(聚合值)
通过纵轴添加参考线
1、单击纵轴
2、选择参考线并设置信息
参考区间
1、原始图形
2、参数设置
3、生成图形
4、通过轴设置参考区间
参考分布
1、原始图形
2、参数设置
3、默认是60%到80%的参考区间
4、我们可以添加一根新的参考线:10%
5、我们通过渐变的颜色来进行填充:
6、通过轴的方式添加参考分布
标记线
如何设置标记线
计算字段和参数
本文主要介绍的Tableau中的计算字段和参数的使用,以及少量的筛选器知识点介绍。
计算字段
现有数据中的字段不能完全解决我们的问题,可以通过在Tableau中创建新的字段,然后将其保存成数据的一部分,这些字段称之为:计算字段。
需要注意的是:创建的新计算字段,前面是带有“=”的
如何创建计算字段
更改字段类型
比如将本身为【日期】类型的发货日期改成【字符串】类型,可以按照如下类型步骤操作:
创建新字段
创建一个基于字符串类型的【发货日期】字段:
前面的等号=表示创建的字段,能够删除;原数据中的字段是不能删除的
字段删除
字段聚合
比如查看【利润】的平均值,使用AVG函数
比如,我们查看【类别】下不同【子类别】的【利润平均值】:
基于sum求和的聚合字段:利润率
利润率 = sum(利润) / sum(销售额)
不同【子类别】下的【利润平均值】和【利润率】
基于if语句创建字段
1 | IF [利润率] > 0.1 THEN '高' |
参数
根据用户输入的参数来和视图发生交互。
1、基于【利润率】来创建参数
2、设置各项参数
3、将参数放入表达式中
4、显示控件:
筛选器的使用
Tableau中筛选器主要是用于选择或者排除视图中的维度或者度量值,主要介绍7种筛选器的使用:
- 常规筛选器
- 通配符筛选器
- 条件筛选器
- 顶部筛选器
- 度量筛选器
- 排除或只保留筛选器
- 上下文筛选器
Tableau字段分层整理
当我们原数据中的字段非常多的时候,可以对字段进行分类整理:分层
为了方便介绍各种筛选器,我们先创建一个不同【类别】下的散点分布图:
常规筛选器
使用方法:筛选器窗口选择【常规】,单独或者多个指标离散选择,然后将【维度】拖到筛选器窗口
- 可以选择一个或者多个
- 右下角还有【排除】按钮,功能是排除选择的内容
通配符筛选器
使用方法:筛选器窗口选择【通配符】,相同字段指标选择,然后将【维度】拖到筛选器窗口
原图形为:
通配符匹配的时候有4种不同的形式:
- 包含:只要包含指定的信息即可
- 开头为:以指定的信息开头
- 结尾为:以指定的信息结束
- 精确匹配:和指定的信息完全相同
地区中有东北、华北、华东、西北等地区,我们想筛选包含有“北”的地区的数据:
条件筛选器
使用方法:筛选器窗口选择【条件】,满足字段条件,然后将【维度】拖到筛选器窗口
可以看到筛选之后的数据明显少了很多的
顶部筛选器
使用方法:筛选器窗口选择【顶部】,满足指标顶部需求,然后将【维度】拖到筛选器窗口
原始图形为:
我们选择排名前3的数据:
度量筛选器
使用方法:度量筛选器窗口,根据聚合方式选择,然后将【度量】拖拽到筛选器窗口
1、原始图形为:
2、选择聚合方式:总和
3、选择利润的区间范围
4、筛选后的效果图
排除与只保留筛选器
使用方法:使用鼠标圈选排除或保留内容,然后在【视图】中选择
1、原始图形
2、选择某些特殊的数据点
3、排除之后的效果
上下文筛选器
已添加的筛选器添加到上下文,提高筛选器的优先级,然后将【维度】拖到筛选器窗口
1、原图如下
2、目的:筛选【华东】地区【销售额】排名前3的省份
第一步:选择排名前3的省份
第二步:选择【华东】地区
3、结果展示:取出华东地区,前全国排名前3的地区,只有山东省
如何实现上下文的筛选器?
4、结果展示
结论:上下文筛选器的优先级高于普通筛选器