样本代表性或无偏性是指样本均值等于总体均值,是抽样调查的基本要求,通常以样本随机选择作为保障。然而,地理调查中样本抽取的随机性有时难以保障。
中国科学院地理科学与资源研究所王劲峰研究员带领研究团队研究建立了B-Shade模型,该模型充分利用地理空间横向相关性,以及样本与区域总体之间的纵向相关性。即使样本有偏,用B-shade模型也可以得到区域总体无偏最优估计。
研究人员以上海浦东新区疾病流行率估计为应用案例。区域发病率/流行率往往通过哨点医院的监测记录进行估计。但是,这些记录本身的误差及哨点医院设立的有偏性,传统方法得到的区域流行率估计值将是有偏的,这将误导疾病干预。
研究表明,使用该研究提出的B-Shade模型,基于有偏哨点医院数据计算得到研究区疾病流行率最优无偏估计。
相关研究成果发表在PLoS ONE 2011 6(8): e23428. doi:10.1371.
论文信息:Wang J-F(王劲峰), Reis BY, Hu M-G(胡茂桂), Christakos G, Yang W-Z(杨维中), et al. 2011. Area disease estimation based on sentinel hospital records.
PLoS ONE 6(8): e23428. doi:10.1371/journal.pone.0023428。