在数据分析时,如何区别[维度]和[指标]?

很多同学在面临数据分析时,常常面临海量的数据类型。而最大的问题就是,如何利用这些数据进行建模。这里提出维度和指标两个概念,也是数据分析时最常见的两个概念,他们分别代表什么呢?又该如何进行区分?怎样利用他们来建模?
已邀请:
符号帝国

符号帝国 - 青春留不住,白发自然生

赞同来自: 云淡风轻

说一点不同的看法;

个人认为城市、性别、时间段这类不能作为维度,这类变量属于分类变量,利用分类变量可以数据整体分为若干个组,并进行组与组之间的对比;在建模中这种分类变量一般作为控制变量出现;

维度应该是剖析事物的方法或者是分析问题的方向,例如我要建立一个【外卖平台竞争力模型】,从哪几个方向去考察外卖平台的竞争力呢?可以从配送方面、商家方面以及保障方面;也就是说可以从这三个维度去分析外卖平台的竞争力;

指标是用来具体衡量某个维度的,例如我们怎么衡量“配送”这个维度呢?可以从配送的平均时间、配送的准点率,自营配送队伍人员数,自营配送队伍占比;也就是说可以从这四个指标去衡量配送这个维度;

关于建模,首先要知道自己要干嘛,要解释或解决什么问题,确定要建什么模型,再看相关文献或资料总结可以从哪几个维度去分析,有的时候一个大维度下面还有若干个小维度,最后将维度细化到具体可衡量的指标,再选择合适的数学模型,一个建模就完成了。

当然在现在的研究中(我接触过的课题),也有不提维度,用一级指标、二级指标、三级指标来描述,但本质意思是一样的。
云淡风轻

云淡风轻 - 时间是审查一切罪犯的最老练的法官

赞同来自:

A:你选择女朋友有哪些(维度)上的要求?

B:身高要高,腿要长,三维要好。

A:具体指标是啥?

B:身高165cm以上,腿要80cm以上,三维是36 24 36。




数据是瞎写的,哈哈,36 24 36来自《独自等待》哈哈。

个人见解,供参考。谢谢。
呵呵哒

呵呵哒 - 青春是不耐久藏的东西

赞同来自:

数据分析其实是个很难的活,你需要考虑从哪些方面去分析,然后每个方面分析哪些数据才能得到一些结论。我理解哪些方面就是维度,每个方面下的具体数据就是指标。

举例:我在小区门口开了个小卖部,我想分析一下近一个月内各商品的销售情况,以决定明天的进货量(假设我每个月进一次货)。

分析过程:

一、确定三个大维度

      任何数据分析问题我都先拆解成三个维度:物,人,物+人;这里也就是商品,顾客,商品+顾客这三个大的维度。

二、大维度拆解成小维度

      1.就商品而言,我需要了解:

        A.一个月内商品的周转情况(进了多少货,卖出了多少);

        B.一个月内,不同商品的盈利情况;

        C.此外,我还想从局部看下每天的分布是怎样的。(总体+局部)

     2.从顾客的角度,我想了解:

       A.顾客的人口统计特征分布(顾客都是些什么人);

       B.单顾客创造的营业额、利润分布(顾客花多少钱,我能赚多少);

       C.单天客流量及访问时间段的分布(大家都什么时候来);

    3.从商品+顾客的角度,我想看:

       A.不同属性的用户,购买每类产品(零食,生鲜,日用品等)的转化,购买数量及分布(不同类别的人都最爱买什么);

      B.不同(统计特征)属性的用户,不同商品类别带来的营业额、利润及其分布(不同类别的人都爱买什么,哪类人可以给我带来最高利润);

      C.利润最高的用户,不同类别下购买时段的分布(利润最高的用户,都是什么时候来买东西)。

      D.利润最高的用户,购买商品的分布(利润最高的用户,都爱买什么)。

三、小维度下的指标

    1.就商品而言,需要分析的指标有:

     A&B的统计指标:商品ID,商品名称,商品单价,商品大小(特大/大/中/小四档),总进货量,总销售量,总营业额,总成本,总净利润;统计时间:近一个月,按月统计。

    C的统计指标:商品ID,商品名(筛选后),日期,销售量,营业额,净利润;统计时间:近一个月,按天统计。

   2.就顾客而言,需要分析的指标有:

    A&B的统计指标:顾客ID,性别,年龄,身份,月访问次数,月购买次数,月营业额,月利润;统计时间,近一个月,按月统计。

   C的统计指标:顾客ID,日期,访问时间段,访问次数;统计时间,近一周,按天统计。

   3.就顾客&商品而言,需要分析的指标有:

    A&B的统计指标:用户属性类别,商品类别,月访问次数,月购买数量,月营业额,月利润;统计时间:近一个月,按月统计。

    C的统计指标:用户属性类别,商品类别,日期,购买时间段,购买次数;统计时间,近一周,按天统计。

    D的统计指标:用户属性类别,商品类别,商品名称,购买次数。统计时间,近一个月,按月统计。

四、添删改查

   根据实际需求,投入产出比,优先级,对上述的维度进行筛选和修改;

   根据业务需求,对上述维度进行补充,例如:上述分析第三部分主要分析了高利润用户的特性和习惯,但对未购买的用户,购买次数多但利润不高的用户分析较少。更好地满足高利润用户的需求,转化低(无)贡献的用户是两种不同的思路。

   最后,上述数据如果能够结合模型和机器学习等智能分析手段,可以分析出更多更有价值的内容。如不同商品间的关联性(喜欢买A,B的人,都会喜欢买C),如不同类别用户之间的特性,大量购买XXX保健品的用户,一个月后都会大量购买婴儿产品(XXX保健品为孕期的常用保健品),如XXX季节,XXXX天气下,XXX和XXX商品的销量会激增。

参与讨论请先登录注册