数据分析新手小白入门学习指南,这五大知识清单值得收藏
根据我从业这么多年的经验,假如为了尽快找到一份数据分析的工作,需要掌握三个核心的点:
数据分析基础(肯定的数据思维、统计学基础和sql能力)——能做最基本的取数工作
数据分析能力(使用各种分析工具、套用数据模型、做可视化报表等)——能做简单的分析工作
业务分析经验(熟习各种业务逻辑和指标体系)——能做复杂的业务拆解
因而对新人来说,强烈建议按照下面的学习路径进行学习:
1、数据分析常用的思维
判断一个人做数据分析的水平,不是看他学习了几种工具,最核心的差距在于思考问题的思维能,这是数据分析的本质,也是最容易被人忽视的点
常用的思维有很多种,下面简单举几个例子:
(1)细分思维:
比方某次考试小明的名次很低,假如他的父母不懂细分,肯定会不由分说地训斥小明,根本找不到小明成绩差的真实起因。
而假如他们懂得细分分析,应该怎样做呢?应该将名次的维度转化为科目,而后分析每个科目的成绩,也许会发现小明只有某个科目没有考好,再针对这个短板采取相应的策略,这就是细分分析的思想。
(2)趋势思维
你可以简单地把趋势分析定义为比照分析的一种,一般来说是按照时间的维度,对某一数据或者者不同数据变化趋势进行差异化研究,以及对数据的下一步变化进行预测。
趋势分析一般而言,适用于产品核心指标的长期跟踪,比方点击率,GMV,活跃客户数等。做出简单的数据趋势图,并不算是趋势分析,趋势分析更多的是需要明确数据的变化,以及对变化起因进行分析。
(3)目标思维
我们在接到业务的需求之后,需要先想一下这个需求的真正核心目的是什么?
假如知道了业务目标,那么即可以把这样一个取数需求变成一个分析类需求,最终的交付形式就成了一份PPT,这样,就能避免成为取数机器。
(4)结构化思维
在面对这么一个问题时,结构化思维方法首先做的并不是立刻着手清洗数据。而是根据对业务的了解,先为数据分析画一个思维导图,它的作用相当于你来到一个陌生的城市拿出百度地图查询乘坐交通工具到入住的酒店的路线图。
事实上,结构化思维就是由麦肯锡提出的著名的“金字塔思维”,如下图就是典型的结构化:
(5)演绎思维、归纳思维
很显然,归纳是从个体属性出发,寻觅因子之间的共性,总结出一个一般的特性;而演绎则相反,是从一般整体出发,寻觅事物之间的逻辑,从而得到某个个体的特性。
2、统计学相关的理论与基础
(1)形容型统计
形容统计是我们做数据分析的主要基础,比方说销售人员说今年我们的销售情况很好,比去年要好很多。这不叫做形容统计,由于“比去年好”这个特点不是定量的数据。
形容性统计里大概有三个分类:集中趋势、离散趋势、分布。集中趋势包含平均数、中位数、众数、分位数等,离散趋势包含极差、平均差、方差、标准差、分位差等,分布主要包含峰态分布和偏态分布。
(2)推理型统计
也叫作推理性统计,他的目的是研究如何利用样本数据去推断总体数据的方法。他跟形容统计不一样,形容统计是用整体的数据来形容整体特征,推理统计是用部分数据来推理整体特征。我们经常说的假设检验、采样与过采样、回归预测模型、贝叶斯模型都是推理型统计。
二项分布:如抛硬币n次,不同正面朝上的次数对应的概率;
几何分布:如抛硬币n次,到第k次才获得第一次成功的概率服从的分布。
泊松分布:在肯定时间范围内发生概率相同,给定其发生的平均发生的次数μ,则事件在该事件范围内发生k次的概率服从泊松分布。
(3)假设检验
假设检验就是通过抽取样本数据,通过小概率反证法去验证整体假设。
(4)回归
回归分析的任务就是,通过研究X和Y的相关关系,尝试去解释Y的形成机制,进而达到通过X去预测Y的目的。
(5)聚类
聚类是根据数据本身的特性研究分类方法,并遵循这个分类方法对数据进行正当的分类,最终将类似数据分位一组,也就是”同类相同、异类相异”
3、快速套用的分析模型
(1)帕累托模型:
帕累托分析依据的原理是20/80定律,80%的效益常常来自于20%的投入,而其余80%的投入却只产生了20%的效益,这说明,同样的投入在不同的地方会产生不同的效益。
(2)波士顿模型
这个模型尽管是市场模型,但是其背后的逻辑却是数据分析,也就是矩阵模型。矩阵模型是双维度模型,你可以从两个维度出发对不同的指标进行定位,比方波士顿矩阵,即从两个维度对产品或者者业务进行定位,也就是产品本身和销售的维度。
(3)购物篮分析
购物篮模型的本质是关联,关联大家应该都很好了解,就是反映某个事物与其余事物之间相互依存关系的,在商品关联分析的定义是,通过对顾客的购买记录数据库进行某种规则的挖掘,最终发现顾客群体的购买习惯的内在共性。
(4)客户流失模型
主要应用在两个方面:流失客户召回、现有活跃客户防流失,最常见的就是AARRR模型、漏斗模型等等。
(5)客户价值模型
业务分析,很多情况下都是要在资源有限情况下,去最大化的撬动效益,如何挖掘能创造最大价值的用户就是客户价值模型的工作。最常见的就是RFM模型、CLV模型、顾客社交价值模型。
(6)5W2H模型
所谓的5w2h其实就是针对5个W以及2个H提出的7个关键词进行数据指标的选取,根据选取的数据进行分析。
(7)SWOT模型
分析法也叫态势分析法,S是优势、W是劣势,O是机会、T是威胁或者风险。
5、常见业务场景
(1)运营类数据分析
对收入、销量等与企业运营活动相关分析,监控企业的运行情况,是为了发现企业经营中的问题,关注点是销量/销售额总体的时序变化、地区分布、变化起因。
(2)客户数据分析
对购买额、购买频次、购买偏好等相关分析,目标是深入了解用户,关注点是客户画像分层、RFM模型衡量客户价值分层。
(3)销售数据分析
定义是指销售收入、销售额、单价等与销售情况直接相关的分析,目标是完成销售任务,监控销售销量低的起因,提出处理方法,关注点是时序进度、落后起因、销售单产情况。
(4)营销/市场分析
对企业营销/市场活动的投放、反馈、效果相关分析,目标是理解活动结果、优化活动计划、提升活动效率关注点主要集中在ROI相关指标。
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是摆设,本站源码仅提供给会员学习使用!
7. 如遇到加密压缩包,请使用360解压,如遇到无法解压的请联系管理员
开心源码网 » 数据分析新手小白入门学习指南,这五大知识清单值得收藏