这是一个完全个人运营的统计学习笔记站点。作为一名数据分析与统计学习者,我在平时工作与自学过程中会遇到许多细节坑点:看似简单的方法背后常藏着容易忽视的前提假设;同样的数据结构用不同方法结论可能完全不同;教材里一句带过的概念,用到实际数据上才发现远比想象中复杂。
这些经验零散记录在各种草稿里容易丢失,于是我把它们整理成文章放在这里,一方面方便自己回看,另一方面如果能对同样在学统计的读者有一点帮助,那就更好了。
理工科背景的在读研究生,本职和业余时间都在与数据打交道。长期使用 SPSS、R、Python 进行统计分析,也对传统统计学与现代机器学习方法的交界感兴趣。
文章内容均为个人理解,不保证完全正确。如果你发现错误或有不同见解,非常欢迎交流。