高中数学里有一个很基础的题,就是抽屉里有100个球,其中有3个是红色,求问连续不放回地抓取5次,第5次抓到的球是红球的概率。这个问题在现在看来并不复杂,因为我们知道球的数量,只需要列举前面4次抓球的情况和第5次抓球时还剩几个红球就可以实现。
但是如果我们反过来思考,如果你已经不放回地抽取了5次,第5次抽到了一个红球,那么你能判断抽屉里有几个红球吗?答案显然是不能。因为对于100个球来说,5个球实在太少,而且我们只进行了一次抽取5个球的实验,因此抽取的结果没有什么参考性。
△《抓个球》
我们都知道太阳东升西落,这是因为大多数人的日常都是这样以及大多数人住的地方不在两极的极点,这样我们总结出来的规律是有效的。但是对于大部分问题而言,总结出规律并且证明这个规律是可信的,都非常困难,因为我们绝大多数人对事物的直观观察,其实并不比摸象的瞎子高明到哪里去。
于是这就涉及到统计抽样的出现。人类历史上第一次现代意义上的统计抽样,是1662年约翰·格朗特写的《根据死亡清单做出的自然观察和政治观察》一书。这本书基于伦敦各个教区对当地人出生和死亡的记录写就,数据自1603年开始,数据包含姓名、性别、死因和死亡年龄。格朗特用分时、分类的方法统计了不同时段下死于不同原因的人数,并且用他手中的数据对整个伦敦的人口情况作出了推断,比如一名普通伦敦市民死于凶杀/瘟疫/饥饿的可能性有多大,并用这样的可能性评价伦敦的治安/公共卫生/财富水平。
△约翰·格朗特
这样的推断在如今看来并没有任何特别之处,并且这本小书所用的方法在今天看来是有问题的,比如没有办法证明教区对死亡原因的记录是真实的(比如出于害羞,没有人会写自己的爸爸死于梅毒),教区也无法统计意外死亡和非教徒的数据,这样书中的数据对于推断整个伦敦来说,可能并不充分。但是从历史的眼光看,这本书奠定了抽样推断、平均数和统计信息的基础。
格朗特的这本书再版了5次,并且帮助身为商人的格朗特加入了皇家学会。皇家学会有着身后的概率推演传统,比如他们曾经出版过一本叫做《在月球上另一个世界的发现或是易于证明在那个星球上存在另一个可居住世界的论述》的奇葩书。而30年后,学会会员、更为出名的埃蒙德·哈雷写就了另一部统计抽样的名作。
△埃蒙德·哈雷
我们现在知道哈雷的名字,是因为最著名的彗星(不是摩托)是用他的名字命名的。而他对于统计学的贡献,同样出现在人口学领域。当时莱布尼茨给了皇家学会一份德国布雷斯劳城的人口统计分月数据,哈雷基于死亡年龄段的人口分布,倒推出城市人口总数量、最优征兵数量和生存几率。比起格朗特的著作,哈雷更明确地使用了概率这个概念,并且将年龄分布数据总结为一张表。
而这张表或许正是现代风险管理的开端。哈雷用不同年龄段的死亡概率、人数分布计算了每个人如果要投保生命保险,那么保险的年金价值或者说投保价格应该是多少。在当时,荷兰已经开始从事远洋贸易,殖民地的商品风靡整个欧洲,新航线的风险与机遇吸引着所有人的目光。许多贸易商和掮客定下协议,贸易商在起航前付给掮客一部分钱,如果贸易完成那么掮客不用返还,但贸易失败的话掮客就要赔偿。毫无疑问这实际上就是赌博,不过我们有一个更好听的名字,叫做保险。
对于掮客而言,如何确定贸易商付的钱(也叫保险费)和自己的赔偿额,是一个非常困难的问题。而哈雷的数据表给了他们解决的思路,就是通过各种各样事件发生概率,比如某条航线遇到过多少次海盗、伦敦城哪个地区更容易出现火灾和盗窃,就可以估计自己应收和应付的款项规模是多大,实际上实现了对风险的量化,著名的劳埃德列表(Lloyd’s List)也由此诞生。因此哈雷的工作一方面使保险业成为一个基于调查数据库的行业,另一方面为精算师考试(FSA)奠定了基础。
当然,无论概率论还是统计学,此时依然还是一个宝宝,因为历史在等待一个叫伯努利的人出现。下一期我们就来讲讲伯努利的故事。
倍发科技 有金有险 2016年07月25日 21:02
https://mp.weixin.qq.com/s/BHb6wVmSVKkTsQ0ZMCM7eg
0