作者:Jenny.Zhang
发布时间:2022.11.1
浏览次数:1,597 次浏览
前几天我面向粉丝,尝试着做了两节数据分析的入门视频,效果还不错,很多粉丝都给我提出了宝贵的意见,为此我也在加紧为大家制作后面的视频,以期帮助大家学习。
但是为了解大家对数据分析的真正需求,我特意列出了第一节关于数据分析入门流程的内容,希望大家能够多提建议!
无论你是刚接触数据分析,还是一位分析大神,我想很多人都不知道,数据分析究竟是什么,或者说数据分析的本质是什么。
其实很多公司和企业,也不明白数据分析是什么,很多人从网上看到公司招数据分析师,进入了之后发现是做什么的呢?就是天天用sql取数给业务用,十分机械而且也没成就感。
这叫做数据分析吗?当然不叫!所以我们要先对数据分析有个整体的认知。
先看一下教科书上的定义:
数据分析是用恰当的统计分析方法对收集来的大量数据进行分析,然后加以处理和加工,以开发数据的功能、挖掘数据的价值,主要目的是为了清洗出有用的信息并形成结论。
这个定义过于繁琐,很多刚刚接触数据分析的人都不一定能看得懂,因此我自己给数据分析下了个定义:
数据分析,就是针对某个问题将获取后的数据用分析手段加以处理,并发现业务价值的过程。
大家可以看到我把五个关键词给标红了,这一句话基本上可以包含数据分析所必须的流程点,我们一个个讲。
首先第一个关键词是“问题”,我们可以把这个词解释为“发现问题”或者是“目标”。
数据分析一定要有目标。哪怕业务人员给你提出的问题或者需求,根本不是那么明确和清晰,你也要找到自己要分析的目标!
举个最简单的例子,业务方最近新上线了一个功能想让你分析一下目前这个功能的使用情况。这时候你该怎么做?
你会觉得“分析业务功能情况”是目标,然后根据这个模糊的目标你只能做一些描述性的统计分析,告诉业务方每天UV的最大值,最小值,中位数,平均数,方差,标准差……看起来很厉害的样子,但这些数据有啥意义呢。
这样子的目标就是在做样子,应该怎么做呢?我们要明确业务方的需求是什么,然后分析业务最终的目的,把这个目的进行拆解。
比如刚才的例子,业务真正想要了解的是什么,是这个新功能的目的,是为了提升客户的留存率?还是为了提升客户的转化率?还是其他的?然后再把这个目的给拆解,确定我们的指标,然后再进行分析。
这才是真正的目标思维。
第二个关键词是“获取”,叫做“数据获取”或者“数据采集”
数据采集就是将原始数据从数据库中取出来,主要工作是:搞清楚数据放在哪里+怎么把数据取出来。
1、数据存放在哪里?
很简单的答案,很多人都知道公司的业务数据一般都是放在数据库里的,但是相同的数据库数据源可能不一样相同,我们所取的数据一定保证数据源的一致,否则会造成数据混乱。
比如说,不同的数据存储系统,mysol、oracle、sqlserver等等,数据仓库结构以及各库表之间的关联方式也可能有所不同,星型?雪花型?数据指标是否相同,名称、含义、字段类型、约束条件等等?是否经过了ETL处理,清洗规则是什么样的?这些都是我们在进行数据提取之前所必需了解的。
2、那么怎么把数据取出来呢?
其实只要搞清楚了数据放在哪里,取出来就是水到渠成的事情。
一般来说SQL是进行数据采集的必备技能,目前也是数据分析实际业务场景中最常使用的取数方式。
当然了,能取出什么样的数据,也要看你是否精通sql,比如单张数据库表的提取很容易就做到了,但是跨表查询提取的时候很多人就不行了。
再比如更为复杂一点的复杂查询、联机处理等等,这些做数仓的人用的很多,我们数据分析师不必设计这么深,我们只要熟练掌握就行了。
第三个关键词是“数据”,这里说的数据是广义上的数据,包括数据库中的数据,也可以概括为数据场景,也可以理解为经过清洗后的数据。
总之,这个数据指的是我们可以直接拿来分析的信息,而不是一堆脏乱差的原始数据。
1、数据库数据
数据库数据这里就不细讲了,我们只要知道数据库中的数据都有哪些就行了,比如业务数据、日志数据之类的。
2、数据场景
很多人都问我为什么看资料看的好好的,一到实际业务场景中都歇菜了?
这是因为在实际业务分析中,我们分析的不是数据,而是场景。那我们怎么根据场景找数据呢?最重要的方法是建立分析指标体系。指标体系搭建一般都是要放在数据提取之前做的工作,方便我们这一步的数据清洗。
简单来说就是在整个业务分析体系中,确保先分析什么,后分析什么,从体及线,从线及点,有了点,我们就知道该需要什么数据了。
3、清洗数据
很多人喜欢采集大数据,认为数据越多越好,不管什么规则、质量好坏,这是不对的,我们在进行数据获取的时候,一定要保证我们数据的质量,避免脏乱差数据。
这里就是我们狭义上所说的数据分析了,根据实际场景需要可以分为四种:描述分析、统计分析、挖掘分析、建模分析
1、描述分析
其实就是数据分析思维,其实业务很喜欢让你做描述性的分析,因为不会用到算法之类的东西,业务能看得懂,就能跟你扯皮。
描述分析包括:
2、数理分析
数理分析,基本要用到一些数理统计学基础的分析方法,比如:
3、建模分析
第三个是建模分析,也就是数据分析模型,常见的一些我们都会讲到:
4、挖掘分析
最后就是挖掘分析,基于我们的一些数据分析和挖掘工具,比如常用的excel和python、FineBI等,这里不多做介绍。
最后一个关键词是“业务价值”,这是数据分析最核心也是最终的目的。
企业是做什么的呢?企业的作用是向市场提供产品或服务,为客户创造价值。那我们数据分析就是为企业提供服务和产品,为企业创造价值。
价值体现在两点:
第一点,需创造的价值让越来越多的客户知道并认可,从而获得用户粘性、实现持续增长,其实就是用户体验;
第二点,需提高企业创造价值的效率。
所以我们要做的数据分析也要跟紧紧贴合这两个点,这就要求我们在进行数据分析最后一步——数据可视化、数据报告等等时,要紧紧贴合业务,给领导或者业务最想看的数据,这也是一门学问。
数据分析 BI
商业智能BI产品更多介绍:www.finebi.com