这个月读完一本畅销书——《信号与噪声》,内容翻译得很一般,但因为之前有太多大V和朋友推荐过此书,还是用了一周时间硬着头皮读完。书中最重要的思想大多都是围绕贝叶斯理论展开的。所以,这里先花一点时间解释一下这个公式:(点击图片查看详细解释)
01
—
何为“信号”和“噪音”
信息时代,每天产生的数据高达250兆字节,信息多到无从下手,但有用的信息却寥寥无几。所以作者在此基础上对我们收集的信息做了区分:
“信号”是真相,“噪声”却使我们离真相越来越远。
作者自己也承认“信号”和“噪声”并不是一个科学定义,但这样一种思考模式能够帮助我们思考如何区分哪些是有意义的信息。
02
—
过度拟合
模型是帮助我们理解某一领域复杂性的工具。比如,语言就是一种模型,可以无限近似地表达我们理解的世界。但模型并不能完整地取代现实情况。
在统计学中,将噪声误认为信号的行为被称为过度拟合,当拟合太过紧密时,一位置对数据中的噪声进行拟合,而不是挖掘数据的深层结构。
书中列举了很多实例,从经济发展到气候变化,大家关心的疾病、比赛或者政治中无时无刻不存在预测行为。
所有人都有各自的信仰和偏见,这种信仰和偏见是由个人的阅历、价值观、知识涵养、政治立场、专业背景等因素凝聚而成。失败的预测通常有很多共同点——只关注符合我们对这个世界期许的信息,而不在乎其真实性。比如其中一节讲到在股市中,非理性交易者的存在让价格泡沫不可避免,以及过度自信的投资者往往会陷入“赢家的诅咒”。所以理论上讲是不可能完美地预测市场,就像海森堡不确定性所说的那样。
03
—
拥抱不确定性
预测过程中总伴有各类无用或者无关的信息。哪些信号更重要、更值得关注,我们通常对此都有自己的见解。因为人们通常更喜欢确定性的表达和结论。而且,我们总期盼着能够清晰判断出“会”或者“不会”发生的结论,而天然排斥“可能或者比较不可能”的说法,所以在对待这个世界时就容易过于自信或者受未知的未知限制。“ 人为的判断终究会存在潜在的偏见。只有认识假设对预测的影响,并从自身找问题,才能做到更加客观。 ”
因此书中采用的是一种概率式的思考方法。鼓励提出不同假设并斟酌其发生的概率,后续还要根据update的信息进行修正。除了贝叶斯理论以外,作者并没有通过某些固定范式告诉大家预测的通用法制是什么,但以概率的方法思考问题确实是一种很有意思的方式。
0