北京大学健康医疗大数据平台简介
北京大学健康医疗大数据平台集成多源健康医疗大数据、采用国际前沿的数据处理和分析技术,为国家健康医疗战略、医学实践和全人群健康管理提供大数据驱动的决策支持服务。
平台集中部署运行在北京大学健康医疗大数据国家研究院自建机房,可实现健康医疗大数据标准化、流程化、自动化、系统化的专业安全运维管理。
2019年4月2020年12月,北京大学健康医疗大数据平台两次通过了中国信息安全测评中心的国家信息系统安全等级保护三级测评(业务信息安全等级为第三级、系统服务安全等级为第三级、网络安全保护等级为第三级【S3A3】
依照2019年5月国务院颁布《中华人民共和国人类遗传资源管理条例》,北京大学健康医疗大数据国家研究院按政策引导建设了北京大学健康医疗大数据分析保藏平台,建设方案经我校伦理委员会审批后递交科技部中国人类遗传资源管理办公室申请保藏行政许可。2020年8月5日上午,由中国人类遗传资源管理办公室组织的专家团对我院保藏平台进行了现场勘查评审。2020年8月25日,获得中国人类遗传资源管理办公室行政审批许可。
公示链接:https://fuwu.most.gov.cn/html/rlycjgcx/20200826/123123436.html
北京大学健康医疗大数据平台由大数据分析模块和高性能计算模块组成。大数据分析模块支持多源异构数据存取及智能多维度建模分析,可实现多源异构的数据查询、数据模型建设、数据挖掘等功能,满足不同业务的数据分析需求(数据源探查、面向医生的科研查询、统计分析、关联分析、聚类分析、分类分析等),并且支持多元化统计分析软件的集成。同时大数据分析模块处理后的数据可流转到高性能计算模块,通过CPU和GPU服务器的高效并行计算能力进行分析,计算后的结果可通过大数据分析模块中的数据展示功能进行多种可视化形式多维度展示分析成果。
北京大学健康医疗大数据平台由10Gb与40Gb高速以太网互联连接,其中大数据分析模块各节点存储均由固态硬盘组成,存储可用容量为210TB、一共有2304GB DDR4内存。高性能计算模块共有660个处理器核心、4480GB DDR4内存、34块GPU卡,存储可用容量1.28PB,读写性能9GB/s,总计算能力达到2776.25TFLOPS。
北京大学健康医疗大数据平台依托北京大学健康医疗大数据国家研究院优势,在通过信息系统安全等级保护三级的安全保障下,开展了如下项目:
医学影像分析:利用高性能计算模块中CPU和GPU服务器的高效并行计算能力,针对于医学影像数据,采用深度学习和图像处理技术对公开或者非公开的生物医学影像数据集与自然图集进行图像分割、图像分类、目标识别等分析,从而形成智能化、自动化模型,用以达到辅助诊断、辅助临床决策等目的。
组学大数据分析:针对于多组学数据,采用了深度学习和机器学习等技术鉴别疾病组与正常组的差异,联系临床症状,探究疾病发生发展的(表观)遗传因素,为疾病的早诊和治疗提供理论依据。
NCIS数据分析:NCIS医疗质量控制数据收集系统,在2016年—2019年四年内,持续有近一万家医院在系统上填报本医疗机构的医疗质量控制数据。2018年和2019年还搜集了近四千家医院的病案首页数据。这些数据,为卫健委编写的2015年度、2016年度、2017年度、2018年度《国家医疗服务与质量安全报告》提供了客观、科学的数据参考;也为各医疗机构充分展现了本医疗机构的医疗服务状况及医疗质量水平,共同为科学评价行业医疗质量水平提供了充足的数据基础。
北京大学健康医疗大数据平台可提供的服务:
1、 高性能计算服务
利用高性能计算模块中CPU和GPU服务器的高效并行计算能力及大容量磁盘阵列数据存储的支撑,采用了大数据、深度学习、机器学习的分析技术,可以更好的对医疗影像或多组学等数据集的存储、分析、处理。
2、 大数据分析服务
利用大数据集群服务器的高速计算读写能力,支持对多源异构数据存取及智能多维度建模分析,可实现多源异构的数据查询、数据模型建设、数据挖掘等功能,满足不同业务的数据分析需求。
3、 服务器托管运维/安全保障服务
4、 虚拟服务器租用服务
(注:详情请参见附录北京大学健康医疗大数据国家研究院计算中心资源收费标准)
北京大学健康医疗大数据平台将竭诚为医学领域的高性能计算用户提供高质量的高性能计算服务、以及安全稳定的数据中心机房托管环境,欢迎大家使用!
附录1
北京大学健康医疗大数据国家研究院
计算中心资源收费标准
北京大学健康医疗大数据国家研究院依据《计算中心资源使用管理制度》,参考IDC机房服务的市场价格,收费标准如下:
占地费
1U
800
2U
1200
4U
1600
带宽
费用
带宽
使用费用(元/月)
备注
10Mbps
3800
50Mbps
9000
100Mbps
12000
计算公式
托管费=占地费+带宽 例:1U服务器+10Mbps带宽=800+3800=4600元/月;托管服务器都需要独立申请带宽,不与计算中心自有服务器共享
校内用户:
虚拟服务器租用
1个虚拟CPU
1G内存,
30G硬盘空间(SAS硬盘)
125元/月
CPU(个):
内存(G):
硬盘(G):
1个虚拟CPU
1G内存,
30G硬盘空间(SSD硬盘)
250元/月
CPU(个):
内存(G):
硬盘(G):
备注
-每增加1个CPU费用为50元/月
-每增加1G内存费用为20元/月
-每增加10G磁盘(SAS硬盘)空间费用为10元/月,每增加10G磁盘(SSD硬盘)空间费用为20元/月
*最小租用单位为月
*默认共享100M带宽,申请独立带宽需额外收费
校外用户:
虚拟服务器租用
1个虚拟CPU
1G内存,
30G硬盘空间(SAS硬盘)
250元/月
CPU(个):
内存(G):
硬盘(G):
1个虚拟CPU
1G内存,
30G硬盘空间(SSD硬盘)
500元/月
CPU(个):
内存(G):
硬盘(G):
备注
-每增加1个CPU费用为100元/月
-每增加1G内存费用为40元/月
-每增加10G磁盘(SAS硬盘)空间费用为20元/月,每增加10G磁盘(SSD硬盘)空间费用为40元/月
*最小租用单位为月
*默认共享100M带宽,申请独立带宽需额外收费
校内用户:
节点共享
作业与其他用户的作业一起排队,所需资源具备时开始运行。不限使用时长,最小单位为月
CPU节点
800元/月*节点
GPU节点
2000元/月*节点
节点独享(GPU不允许独享)
用户对租用的节点独占使用,无需排队。不限使用时长,最小单位为月。平台提供给独占使用的节点数不高于总计算资源的20%
CPU节点
1800元/月*节点
储存资源
用户在计算节点中须使用单独的用户HOME目录,目录大小进行限制。最小单位为月
存储节点
120元 / 月*1TB
备注
最小租用单位为月;多个项目共享节点资源的情况下,优先安排北京大学健康医疗大数据国家研究院牵头和参与的项目任务,同等条件下优先安排国家部委委托任务。默认共享100M带宽,申请独立带宽需额外收费
校外用户:
节点共享
作业与其他用户的作业一起排队,所需资源具备时开始运行。不限使用时长,最小单位为月
CPU节点
1600元/月*节点
GPU节点
4000元/月*节点
节点独享(GPU不允许独享)
用户对租用的节点独占使用,无需排队。不限使用时长,最小单位为月。平台提供给独占使用的节点数不高于总计算资源的20%
CPU节点
3600元/月*节点
储存资源
用户在计算节点中须使用单独的用户HOME目录,目录大小进行限制。最小单位为月
存储节点
240元 / 月*1TB
备注
最小租用单位为月;多个项目共享节点资源的情况下,优先安排北京大学健康医疗大数据国家研究院牵头和参与的项目任务,同等条件下优先安排国家部委委托任务。默认共享100M带宽,独立带宽需额外收费
1
运行维护
操作系统升级,故障处理
1000元/次
系统运行状态监控、预警
100元/台/月
应用系统运行状态监控、预警
100元/个/月
2
访问控制
限制服务器中应用的被访问范围,提高安全性
免费
3
漏洞扫描
强制定期(每月)对系统进行漏洞扫描,发现安全隐患及时通知并做相应处理,处理按次收费
1000元/次
4
网络入侵、病毒、网络攻击监测、阻断
应用多种检测机制在出站的网络流量中发现访问远控服务器,检测机制包括应用远控类型的情报指标(IOC,Indicator of Compromise)、木马协议分析特征分析、基于深度学习算法的DGA检测方法等。并通过可视化的方式将发现的失陷告警、关联主机、威胁类型等进行关联展示,呈现所有失陷情况及关联威胁
100元/月
5
安全防控
提供出口应用层安全防护能力
免费
6
公网IP映射
根据需求提供公网IP使用映射服务(由于IP地址有限,每个业务申请不得超过1个公网IP)
每个公网IP使用费用
2000元/年
7
VPN账号
利用VPN账号可远程登录服务器后台
每个VPN授权费用1000元/年
8
日志分析审计
对日志进行收集分析、对数据库日志审计、对异常行为进行审计,需额外收费,按次按库收费
1000/个/次
注:用户须遵循《北京大学健康医疗大数据国家研究院计算中心资源使用管理制度》中规定的单个项目占用存储和计算资源不超过计算中心资源总量的20%。