Tableau下载地址
学生版认证–获取密钥
完成了,好激动!准备开始学习(Fighting)
数据库连接
连接
有多种连接的来源,可以供选择
当选择两个数据进行连接后,需要选择字段
提取方式
实时:每一次更新都需要导入数据
数据提取:存储到Tableau的数据库里面
筛选器:当数据较多,且已经明确了所要的数据时,可以提前在这筛选掉
保存方式
twb:不带数据,需要连接
twbx:内置数据
数据查看
性能和数据响应程度做取舍,都是需要成本的。
数据可视化
数据变成图表的过程,就是数据映射到视觉图形的过程
数据:维度和度量
数值型【度量】:一般由数字组成,表示为图表的面积大小、条形长短、颜色深浅等可以量化的视觉元素
类别型【维度】:有限的类别数或可区分组数,表示为图表的颜色种类、图形位置、分类方式等视觉元素
【度量】映射图形,【维度】负责区分
数据可映射的数据类型:
位置
散点图主要有四种数据规律
长度
角度,例如饼状图
方向,例如折线图
形状
面积和体积
颜色和深浅
可视化字典
视觉图形的暗示排序清单
数据可视化领域的四大金刚:...
Excel
基础概念
对数据进行备份
右键——移动或复制——移到最后——创建副本——隐藏
需要显现的时候,右键任意sheet,取消隐藏
数据理解
ctrl + shift + L /* 全部筛选 */
UV与PV:去重与不去重
CPC:单次广告的成本
数据透视表
筛选
插入切片器
透视表内的筛选
都可以进行筛选,区别是:切片器不只应用于透视表。
双击可以更改名称:
插入字段
函数
sum函数
新建窗口
冻结窗口
sum特殊
win + 上下左右 /* 任意分屏 */
中间加逗号可以分开来选。
sumif函数
锁定
sumif
sumif( 比对的数据行,标准,要的数据行)
sumifs
sumifs( 要的数据行,对比的数据行1,标准1,对比数据行2,标准2,...)
环比与同比
同比:上一年或者上一月
环比:上一个相邻的
拆解日期
组合日期
如果前一个月没有那一天,就会返回第一天。跨年算的结果是正确的。
不要用Excel的日期格式去存储日期,要用字符串格式。
...
《深入浅出数据分析》
坦白来说,也不是崇洋媚外,只是外国笔者的书籍有时确实比中国学者有趣得多。可能看起来讲的并不深入,但是作为启蒙书,会给你一步步启迪。
为防止后续遗忘,能不断巩固,写下此篇读书笔记。
数据分析引言:分解数据
四个流程:确定–分解–评估–决策
确定
首先,首席执行官或是客户(包括你自己)会给出一个浅薄的目标,比如提高销量。
此时,应该提出问题做深一步的确定问题。
分解
接下来对数据进行分解,确定基准假设。客户确定无疑的信息和你对数据的想法。
评估
加入本人的介入:做出自己的明确假设,以信用为自己的结论负责。写最终报告要提到自己,明确结论出处。
决策
粗略版本:
背景:来自于得到的材料,写下自己和客户的假设
数据解说:数据支持,图表辅助
建议:得出的结论
不是每一次分析结果都是理想的,当决策后出现偏差时候,考虑错误或不完整的信息。
从背景切入,某个客户确信的观点可能只是心智模型。
需要根据数据,对原本确定的目标,进行重新的确定。
可以向客户询问其不知道的事情。例如:
索要更多数据,进行分析和深入挖掘更多数据。
回顾整个模拟流程:
实验,检验你的...
2024.7.22 最终版本(安装软件+数据采集)
收发硬件配置就到这里完成了,这篇不会再改动和新增。
2024.7.15 19:46
想起我之前和朋友留下的誓言,昨天开完会确定了一些东西后,我也开始认真去做了(不过这点不能让老师知道,我是现在才开始想好好认真对待emm哈哈)。估计是个人性格和思想,总有些莫名的叛逆哈哈,只想做自己想做的,不想的都很拖拉,也就难以开始。但是不管是项目组还是这学期的javaweb,我都能感觉到逃避不是一个很好的解决方式,特别是对于你之后一定会要去做的事情上面,这样累积起来的疲惫会成倍,不如踏实好好做完,再毫无负担地开始些新的东西。所以呢,咳咳,我的总结就是:对于不想且之后一定不做的,一丁点心思也不花;对于不想但之后还是要做的(这种事嘛,多半是还蛮重要的)就去按部就班做完。
ok,不想说这么多了,开始正文。主要讲kernel的配置和安装。
搭建硬件平台
搭建的是Ubuntu version of Atheros CSI tool,主要用于收发CSI信号,用于后续实验收集数据做支撑来使用。
购买网卡
安装网卡和Ubuntu
由于这步的内容是组...
数据分析思维
数据分析过程
观测
(1)采集数据
解析系统日志
埋点获取新数据
通过传感器采集
爬虫解析网站
API获取数据
(2)存储数据
数据库
连接数据库取数
(3)展示数据
可视化高效传达信息
测量
设定标准
发现异常
应用数据创造价值
数据不断迭代产品和业务策略
明确目标
拆解目标
得到标准值
MECE:满足相互独立、且能够穷尽。
比较常见的拆解方法:
时间流程法
漏斗模型:AARRR,用户的流程
PDCA:质量管理,先规划再进行,定期检查过程问题
精益创业:根据想法快速建产品,并根据数据快速更改想法
模型框架法
优劣势比较
投入产出比
SWOT
量化公式法
穷尽要素法
整体分为各部分
是什么-为什么-怎么做-做什么
拆解方法的记录
拆解方法:
首先,需要符合MECE(无重复,无遗漏)
流程拆解法:流程分析进行拆解,适用于流程较长,环节较多,随着环节的进行,留存率越来越少的场景。
二分法:把事物分成A和非A两个部分。
象限拆解法:
(1)可用于找到问题的共性原因,将有...
写在这里
今天是2024年7月11日,准备继续开始学习数据分析的必要知识。
未接触的时候,我以为Python处理就算可以了甚至加分项,后来发现市面上更多使用Excel和MySql,看似很简单很枯燥是不是,但是当我前几天尝试学习Excel高级知识时候发现它的潜力远不止平常所用的功能。
该暑假学习完整个内容,如果能花时间做几个项目就更好了。
总路线
接下来将根据该学习路线,先试着进行:戴师兄数据分析自学路线
2024/7/28 修改路线
① 处理数据:Excel、Python、SQL
② BI工具:Tableau、PowerBI
③ 分析思维
④ 大数据知识
⑤ Python进阶
⑥ 数学知识
决定根据个人的学习情况,适当修改学习路线和进度:
已完成:
Excel
Tableau
SQL
改为先学FinBI,然后就先不用学习更多BI工具的使用,而是就Tableau和FinBI来更熟练掌握。
特此鸣谢!
建立数据分析思维
Excel 功能学习
BI 工具
SQL
其他了解:数仓、统计学知识、高数等
实操做项目
制作专属博客
用到的
hexo
Twikoo
MongoDB Atlas
vscode
由于最近一直在值班,没太多时间学些东西,第一篇就写写这篇博客的制作。
这里,主要是讲hexo的使用和后续基于Twikoo论坛的使用,由于前期所需工具大部分还未做博客之前就已经下载好了,具体如何安装已不太记得,大家自行网上查找相关教程。前期工具安装不在本节博客范围内。
需要的前期工具
PowerShell
其实就类似电脑终端,忘记是电脑自带的还是需要自己下载的。
Node.js
中文官网
大家网上自行搜素安装教程即可
检查是否安装完成
打开powershell
输入指令
显示如上,则已经按照完成。
安装目录下(即Node.js安装在的地方)
建立图上所框取的两个文件夹
Powershell里输入指令
环境变量配置
这一步一定不可缺少,否则将造成后续一些ERROR(亲测结果qwq)
我的电脑—右键属性—高级系统设置–环境变量
系统变量
(1)先新建一个Nodepath,如下图
(2)添加到path中
注意:有些路径需要改为自己的
...
欢迎大家来到我的博客
序言
首先,十分感谢大家点进我的博客。这是最近制作的个人博客,采用hexo的方式,本身是没有包含太多个人技术含量之说。但我很高兴,这样的开源时代,让一切都有迹可循和可以star、folk。
初心
这个博客主要是用于记录我的个人学习历程,包括但不限于:课程学习、项目研究、个人爱好琢磨。大部分是和编程计算机相关的学习内容。以及记录一些日常生活。
欢迎给我留言,如果你们也想创建个人的博客,十分乐意与你们进行交流,也期待你们将博客与我分享。期待一起进步!
互勉
成为天才的方法是什么?一以贯之的努力,不敢懈怠的人生,每天的微小积累会决定最终结果。这就是答案。
世界上大多数事情都没有太大的意义,真理与热爱除外。
如果你想要什么,就应该努力争取,不管用说的也好,用做的也罢,一定要努力争取才对。因为畏惧成人或者害怕失败,而把真实愿望藏在心里,直至腐败,成为一个自欺欺人的人,是非常不正确的做法。