【数据分析】自学数据分析的第三天,统计分析策略

【数据分析】自学数据分析的第三天,统计分析策略插图

大家好,这是我自学数据的第三天,接下来,我会继续把我每天学习到的东西进行总结和分享。

在数据分析里面,我们除了要熟练掌握工具之外,更重要的是要理解数据分析的思路和套路,也正是我们所说的策略或者说方法。数据统计分析策略有三类源自于统计学领域的统计分析策略,包括:

  • 描述性统计分析
  • 探索性统计分析
  • 推断性统计分析

在这三个策略下,我们可以循序渐进、由浅入深的进行相关的分析。

1.描述性统计分析

描述性统计分析顾名思义主要工作是进行“描述”,这个环节是既基础又重要的,我们平时所收集到的每批数据,都会有一定的特征,例如平均水平是怎么样的,最大最小时怎样的,波动分散程度如何等等。

通过描述性统计分析,可以使我们更好地去掌握和理解数据,例如以我们平时最常见对网站流量数据分析,我们会看每天的PV页面访问量(访问人次)和UV用户访问量(访问人数),然后通过描述性的分析得出一些数据概况,例如比较简单可以看出来的最大的访问量是多少,简单计算后得出平均的访问量是多少等等,经过描述性统计分析之后,我们能做到基本的“心中有数”。

1

当然我现在说的只是最简单的层面,更深一层的说实话我还没消化,大家感兴趣的可以去搜索一下关键词深入了解。

2.探索性统计分析

探索性统计分析主要是去探索数据内在的规律和联系或者是哪里出了问题。探索性统计分析策略在工作中用得是很频繁的,因为我们都需要去挖掘出数据的内在价值。比如说我们平时开车,汽车的速度和刹车距离之间有没有关系、有什么关系?

对于这类要挖掘两个不同变量之间的关系,我们可以绘制他们的散点图来发现他们是线性关系、非线性关系或者是无相关关系。

3.推断性统计分析

推断性统计分析相对来说难一些,里面要用到较多数学上的东西,简单来说,推断性统计分析想要根据样本的情况来推断出总体的情况。例如我们要通过样本去推断出总体的平均水平,就好像平时工厂产品要检验质量是否达标,都是通过样品的水平去推断出总体水平的。还有的就是推断是否相关和是否正态分布。

写在最后

各位网友,我后悔要每天分享了,因为我发现数据分析不是那么好学,我的数学基础无法支撑我前期快速吸收理论知识,接下来就随缘吧,今天这篇文章没什么营养,大家感兴趣的就去找一下关键词理解一下,这三个分析略有更深一层的东西和例子我都还没那么好的理解,没法输出例子去跟大家分享,抱歉。

 

【数据分析】自学数据分析的第三天,统计分析策略插图(2)

标签

发表评论