总会有学生问这样一个问题:GMAT 到底能衡量什么?这个问题的语气总是暗含着一种怀疑,学生并不认为这项考试能精准评估任何真正有意义的能力,他们觉得我们在备考过程中承受的种种挫败与焦虑,不过是招生环节中一种 “施虐式” 的考验。


谈及标准化考试,人们产生些许愤世嫉俗的情绪是可以理解的。试想,如果 A 学生比 B 学生更精通几何与代数的基础知识,我们凭什么就此断定,A 在一个与几何、代数毫无关联的领域,会比 B 更有可能成就一番事业?


当然,我们有一套惯用的说辞:这项考试的设计初衷,是为了奖励灵活的思维能力,检验我们在高压环境下做出明智决策的水平。我确实认同这一点,但同时也十分清楚,考试终究存在局限性。有许多天赋异禀、聪慧过人的人,在这种人为设定的考试环境中会显得手足无措;一场短短2 小时的考试,绝无可能全面衡量出一个人的潜力。这一点,我们其实都心知肚明,而这也正是招生流程采用综合评估体系的原因所在。即便如此,GMAT 分数依然至关重要。因此,我觉得有必要查阅一些相关数据,看看这项考试在预测考生未来发展方面,究竟表现如何。


2005 年,GMAC发布了一份报告,分析了 1997 至 2004 年间 GMAT 分数与研究生阶段学业成绩的相关性。该报告概述了一项回归分析,研究人员在分析中得出了一个名为 “效度系数”的指标。效度系数为 “1”,意味着 GMAT 分数与研究生学业成绩之间存在完美的相关性 , 两个变量的变化趋势完全一致。报告指出,任何介于 0.3 到 0.4 之间的效度系数,都可被视为对招生工作具有参考价值。


最终测算得出,GMAT 的效度系数为 0.459。这一数据表明,该考试确实具备一定的预测价值,而且这种预测效力,似乎优于招生委员会考量的其他指标。例如,本科阶段学业成绩的效度系数仅为 0.283。(值得一提的是,当多个变量结合考量时,得出的效度系数会高于任何单一变量的系数。)


看到这里,问题似乎就迎刃而解了?我是不是只要把这份报告的摘要发给学生,就能反驳他们对标准化考试的质疑?事情远没有这么简单。


这份报告的结论部分明确指出:“解读本研究的效度数据时,应当认识到,不同研究生项目之间存在显著差异,各项研究变量在不同项目中的相对重要性也有所不同。这是符合预期的客观情况。”


由此,我们可以对数据做出这样一种解读:GMAT 在预测学生能否顺利完成 MBA 学业方面,表现相当不错。但如果你已经备考 GMAT 有一段时间,想必会立刻警觉起来 ——相关性并不等同于因果关系。有没有可能,GMAT 分数越高的学生,越容易被顶尖院校录取;而这些顶尖院校因为认为招生筛选环节已经完成,便制定了相对宽松的评分标准?倘若真是如此,那么 GMAT 分数与学业成绩之间的相关性,就无法反映出考生的学术能力,反而只能说明考生最终能进入什么层次的院校。


此外,还有一种观点认为,单纯研究 GMAT 分数与研究生学业成绩的相关性,其实意义有限。毫无疑问,院校当然希望学生能在课业中取得优异成绩,但招生决策的依据,理应还包括对申请者能为学校社群做出哪些贡献、以及毕业后的职业发展前景的预判。那么,研究生阶段的学业成绩,与走出校园后的职业成就之间,又存在怎样的相关性?我们又该如何衡量和定义 “成功”?这些都是复杂且尚无定论的问题。


再者,尽管在我这个门外汉看来,这份报告的统计方法十分严谨,但我们必须意识到,该研究是由 GMAT 的主办机构 GMAC 委托开展的,因此存在利益冲突这一问题不容忽视。Journal of Education for Business 刊登的一篇文章就对上述研究结果提出了质疑,该文章指出,GMAT 各科目中,最能预测领导力、沟通能力等常规管理素养的,其实是写作部分。然而讽刺的是,这一科目恰恰是招生委员会最不重视的(现在已经取消写作了),在之前那份研究报告中,它的效度系数也是最低的。


毋庸置疑,这些研究报告虽然很有意思,但当学生问我 GMAT 到底能衡量什么时,我依然无法给出一个确凿的答案。但颇具矛盾色彩的是,这一点其实值得我们感到欣慰。试想,如果 GMAT 衡量的是某种固定不变的内在特质,那么备考这件事本身就毫无意义了。但如果这项考试考察的是一套独特的能力组合,那么无论这些能力对未来的发展是否有直接帮助,我们都可以通过努力将其掌握。


从实际角度出发,最关键的一点在于:招生委员会确实看重 GMAT 分数。因此,我想对学生说的最终寄语是:别再纠结 GMAT 到底能衡量什么了,不如把这份精力投入到提分备考中,尽全力拿到最高分。