一种环境健康数据质量核查的自动化报告方法

    公开(公告)号:CN109213986A

    公开(公告)日:2019-01-15

    申请号:CN201811035616.7

    申请日:2018-09-06

    Abstract: 本发明公开一种环境健康数据质量核查的自动化报告方法:步骤一、将数据文件转化为数据流的形式,可供计算机程序批量操作;步骤二、将数据流转化为复杂数据对象,存入数据库;步骤三、依照领域相关研究需求,利用各类数据的校验规则对数据中的各项关键字段进行检查,对于发现的数据问题进行自动化检查和实时记录;步骤四、对于已发现数据中的问题经校验检查后的统计和记录并以审核报告的形式反馈给实施主体。本发明方法够统计大数据,简化了数据种类的复杂性,规避了数据多源异构的问题,统一了数据使用标准,提高了数据质量,从而极大的减轻了核查的人工工作量和方便研究工作的进行。

    一种面向大气污染健康风险评估的健康数据清洗方法

    公开(公告)号:CN105303492A

    公开(公告)日:2016-02-03

    申请号:CN201510708443.0

    申请日:2015-10-27

    Inventor: 孙庆华 李湉湉

    Abstract: 一种面向大气污染健康风险评估的健康数据清洗方法,它有五大步骤:一、在健康数据中抽取少量样本,人工根据样本中患者登记的户籍地和现住址信息判断患者为本地常住人口还是临时来本地就医人口;二、设计6条规则,构建决策树;三、基于上述6条规则对样本数据集进行处理,并结合步骤一的人工标注结果,得到决策树训练数据集;四、基于训练数据集构造决策树;五、对待清洗数据依次执行步骤二中的6项规则的判断,并将6条结果输入步骤四中训练好的决策树,得到最终的判断结果。本发明构思科学,计算简单,普适性强。它在面向大气污染健康风险评估的健康数据清洗中有较好的实用价值,在公共卫生与环境健康实际工作的推广中有切实的应用前景。

Patent Agency Ranking