几月份的同学生日多?
最近好几个同学过生日,便做了下生日的分布统计,看看是不是某个月出生的人更多。手边只有某会的信息,除去没有填写生日资料的,大概有340+人。
能看出来,11、2月份的人数较多,4、7月份人数较少。
Roy Murphy对1981到1994年间在某保险公司投保的481,040人(注:原文中为480,040,应为书写错误)做了统计(数据在此)。
他分析说,7月到10月出生人数高于预期,3月到5月低于预期。不过,他没有对为什么会这样做出解释,只是说“也许最合理的解释是受孕在10-1月间升高,在6-8月间降低。”这相当于没有解释。
Susan L. Edwards在Bayesian Updating of the Generalized Birthday Problem中对Meredith College在2003春季学年的2,328名女学生(注:女子学校。但文中提到Cagnacci, Renzi, Alessandrini, and Volpe的工作证明,性别并不会对此统计结果产生较大影响)进行了统计。
可以看出,7、8、9月份较高,1、2、10月份较低。不过,假设生日是均匀分布的,那每个月份的天数也应该考虑进去,如,2月份一般只有28天,肯定不能和31天的月份相同。考虑到此,我们可以看下表:
对比Observed Percent和Uniform Percent,得到的Difference更能体现生日的月份分布规律。可以看出,7、8、9月仍旧是最高,但最低月份为1、10月以及连续的3、4、5月。
其实我还想找一下国内的生日统计数据,但没能搜到,明显国内对生日的保密工作做得比国外要好。我自己做的统计人数较少,其他两个统计分别为2000+和480k+,更有说服力。这两个统计中比较明显的一个结果是,7、8、9月较高,1、2、3、4月较少。
Susan L. Edwards文中提到影响生日分布的因素,再综合其他人的论述,则影响因素有:
- 温度/光周期:有研究表明温度和精子数量和活力负相关,女性的生理周期也会缩短。
- 流产的季节变化
- 种族、社会经济的状况:有假设认为,种族不同导致生日分布的不同可能和温度有关。早些的时候,只有富裕的家庭(主要是白人)能负担得起空调这样的奢侈品,而黑人,则不能这样去避免温度对生育的影响。这个假设也证明了社会经济状况对生日分布的影响。
- 文化:多种文化中的社会等级也会造成对生日分布的影响。
- 宗教:(注:原文中并没有对宗教(Religion)进行解释,只是提到了不同地区(Regions)中(怀疑写错了),如在炎热的地区,夏天高温会对受孕产生影响;但在寒冷地区如瑞典,温度又似乎并没有对生日的季节性变化产生影响)
- 社会人口学因素:在Bobak and Gjonca的研究中,北欧在3-5月春季间出生率高,10、11月秋季间出生率低,与美国的生日特征正好相反。而且,母亲年龄、教育程度、第几胎也会生日的季节性变化有较大影响。
- 选择怀孕时间:现代社会中,由于避孕措施的增加,怀孕时间越来越受到人工干预的影响。
考虑到国内的情况,个人认为适用于我国的主要因素有:
- 温度/光周期:温度和光周期对荷尔蒙的影响应该是不分地域的。而且,相对于瑞典,中国和美国的纬度分布更相似一些。
- 文化:考虑到很多人在春节之前结婚,时间上约为1月份,再加上怀孕时间,则出生日期落在11月份的概率较大。同样的,五一黄金周(已取消)和十一黄金周也是如此,这样,出生日期应该落在3月和8月。
- 城市和农村:有人在此文中提到,中国的农村人口很多,其劳作日期的规律对生日分布应该较大。3、4、5、9、10月农忙的时候XXOO的精力少,其余农闲的时候则多一些。这样导致1、2、3、7、8月的生日少,9、10、11、12月的生日多。这种分析应该对农村的人口更为精确。但随着机械化耕作的到来,劳作日期对人的影响减弱,相信这种趋势会越来越不明显。
综上所述,可以看出,生日的分布并非为均匀分布,而是有其分布规律的。那这样分析到底有什么好处呢?起码,你可以知道,11月份同学的生日多,那就多准备一下出去玩的钱和时间吧。