我们此前已详细探讨过标准差的相关内容。我们知道计算一组数据标准差的公式,但同时也清楚,GMAT考试并不会要求我们实际算出标准差的具体数值,因为相关计算过程太过繁琐。不过,掌握这个公式依然十分必要,它能帮助我们比较不同数据集的标准差大小,这是一个我们需要熟练掌握的考点。


今天,我们来看几道GMAT相关题目,这些题目中的数据集标准差数值相近,如果不能准确理解标准差的计算原理,就很难判断哪组数据的标准差更大。先看下面这道题:

题目1:Which of the following distribution of numbers has the greatest standard deviation?


(A) {-3, 1, 2}


(B) {-2, -1, 1, 2}


(C) {3, 5, 7}


(D) {-1, 2, 3, 4}


(E) {0, 2, 4}


乍看之下,这几组数据的分布十分相似。如果我们试着把它们标注在数轴上,会发现它们的分布规律也相近,很难直接判断哪组数据的标准差最大。我们来快速计算各组数据与算术平均值的偏差值:


选项A:平均值=0,偏差值分别为3、1、2

选项B:平均值=0,偏差值分别为2、1、1、2

选项C:平均值=5,偏差值分别为2、0、2

选项D:平均值=2,偏差值分别为3、0、1、2

选项E:平均值=2,偏差值分别为2、0、2


我们不必纠结算术平均值的具体数值(平均值只是帮助我们计算每个数据与均值的偏差),重点应放在偏差值上。标准差的计算公式是:先将每个数据的偏差值平方,然后求平方值的总和,再用总和除以数据的个数,最后对计算结果开平方。由此可见,某个数据的偏差值越大,其平方值就会越大,进而会拉高整组数据的标准差。


需要注意的是,如果一组数据的偏差值增大,同时数据的个数也增多,我们就无法直接判断标准差的变化趋势——偏差值增大会使标准差上升,而数据个数增多会让计算公式中的分母变大,反而会导致标准差降低。最终标准差是升是降,要结合具体情况分析。


首先我们可以发现,选项C和选项E的偏差值完全相同,数据个数也一样,因此它们的标准差必然相等。而GMAT的单项选择题只有一个正确答案,所以选项C和E肯定不是正确选项。

接下来我们分析剩下的三个选项:


选项A:平均值=0,偏差值分别为3、1、2

选项B:平均值=0,偏差值分别为2、1、1、2

选项D:平均值=2,偏差值分别为3、0、1、2


对比选项A和D,两组数据的偏差值完全一致,但选项D的数据个数更多。这意味着选项D计算公式中的分母更大,因此其标准差小于选项A。现在就只剩下选项A和B需要比较:

选项A:平均值=0,偏差值分别为3、1、2

选项B:平均值=0,偏差值分别为2、1、1、2


我们可以看到,虽然选项A和B有两个偏差值相同,但选项A存在一个更大的偏差值3,且数据个数比选项B更少。这就意味着选项A的标准差要大于选项B,因此选项A的标准差是所有选项中最大的。综上,本题答案为A。


我们再来看另一道题:

题目2:Which of the following data sets has the third largest standard deviation?


(A) {1, 2, 3, 4, 5}


(B) {2, 3, 3, 3, 4}


(C) {2, 2, 2, 4, 5}


(D) {0, 2, 3, 4, 6}


(E) {-1, 1, 3, 5, 7}


如果不计算标准差的具体数值,该如何解答这道题呢?我们需要把这几组数据按照标准差从小到大的顺序排列。仔细观察后可以发现,每组数据的元素个数都是5个,且每组数据的平均值都是3。


我们先计算各组数据的偏差值:

选项A:偏差值分别为2、1、0、1、2

选项B:偏差值分别为1、0、0、0、1(标准差最小)

选项C:偏差值分别为1、1、1、1、2

选项D:偏差值分别为3、1、0、1、3

选项E:偏差值分别为4、2、0、2、4(标准差最大)


显然,选项B的标准差最小(偏差值整体最小),选项E的标准差最大(偏差值整体最大)。


因此这两个选项可以直接排除,它们不可能是标准差排名第三的选项。


剩下需要比较的三组数据偏差值如下:

选项A:偏差值分别为2、1、0、1、2

选项C:偏差值分别为1、1、1、1、2

选项D:偏差值分别为3、1、0、1、3


对比这三组数据,选项D的标准差大于选项A,因为选项D有两个3的偏差值,而选项A对应的偏差值是两个2。此外,选项C的数据分布比选项A更集中,它有四个1的偏差值。如果对此有疑问,我们可以计算偏差值的平方和来验证:


选项C偏差值的平方和:1+1+1+1+4=8

选项A偏差值的平方和:4+1+0+1+4=10


由此可见,选项A的标准差大于选项C,但小于选项D。将所有选项按照标准差从小到大排序,结果为:B<C<A<D<E。因此选项A的标准差排名第三,本题答案为A。


虽然在解题过程中,我们没有必要计算出标准差的具体数值,但我们运用了标准差公式的核心原理,从而顺利解答了这些题目。