数据量2.8亿条! 国家人口与健康大数据首次发布

2017-01-05 10:23 来源:光明网  我有话说
2017-01-05 10:23:53来源:光明网作者:责任编辑:李然

  光明网讯(记者 王卓)1月4日,我国人口与健康领域的大数据资源首次向社会公布。本次发布237个数据集,数据量49.1TB,2.8亿条,包括生物医学、基础医学、临床、公共卫生、中医药学、药学、人口与生殖健康七大类的数据集。高质量的“数据超市”为大数据服务政府决策、医疗服务、公共卫生、科技创新、企业发展以及百姓健康等领域提供科技支撑。

  中国医学科学院院长曹雪涛认为,数据难以共享是我国医学健康大数据开发应用的最大瓶颈。本次公布的部分科技资源,有利于推动人口与健康科学数据共享,促进相关领域的科学研究成果和数据红利得到充分释放,为推进健康中国建设,实现健康中国2030的战略目标发挥更大作用。

  国家人口与健康大数据由国家人口与健康科学数据共享平台公布,该平台是国家科技基础条件平台重要平台之一。中国工程院院士、共享平台管理中心主任刘德培院士介绍,国家人口与健康科学数据共享平台始源于2002年的科技部科学数据共享工程,平台的建设历时15年,数据内容涉及基础医学、临床医学、公共卫生、中医药学、人口与生殖健康和地方医学等领域。平台的科学数据总量已达到67.76TB,并与10多个国家建立了科学数据共享。 

  据刘德培介绍,为保护数据提供者权益和个人隐私,自动为每个数据集提供唯一标识,并为数据提供者创立电子注册证书。在数据导出时,去掉个人姓名等关键信息,实现个人隐私安全。“十二五”期间,国家人口与健康大数据已累计服务形成科研成果数91个,支持政府决策数155个,支持重大工程102个,支持应急事件43个,服务民生数144项。

  人口与健康大数据如何影响日常生活?

  为政府决策和百姓健康提供信息和知识

  为科技创新、医疗卫生和健康管理提供基于元数据的数据获取

  为健康产业发展和专业人才培养提供数据产品

  为国家重大工程和重点研发计划提供数据共享技术

  人口与健康“大数据超市”有多牛?

数据量2.8亿条! 国家人口与健康大数据首次发布

  生物学数据资源—NONCODE数据库整合了中国科学院、中国医学科学院、清华大学、北京大学等国内著名的科研院所大量的生物学数据资源(包括基因组、蛋白组、微生物等)数据资源。建立了非编码RNA数据库,记录了487164条非编码RNA的序列特征、分子功能以及与人类健康的关系,并获得《科学》杂志推荐。2005年建成至今,数据持续更新,保持每2年一次大的升级,科研文献总引用量为767次,2015年访问量1,269,889人次。

  中国国民体质与健康数据库依托中国医学科学院自2001年以来承担的一系列全国性居民健康调查,获取了反映我国居民健康况状的大量详尽数据。该调查采用分阶段、随机、整群抽样,目前已累计调查16个省、市和自治区,48个县市居民抽样调查数据,其中4个省已经进行了二次跟踪调查、该项调查指标涉及12大类、240余项,还包括生理信号和图像类数据自2012年以来,已采集受试者血清、DNA和尿样,进行基因组和蛋白质组研究。

[责任编辑:李然]
查看更多评论

动动手指扫一扫
赢奖品

WAP版|触屏版

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明员工 | 光明网邮箱 | 网站地图

光明网版权所有

立即打开