一、数据层相关
-
原始库(生产库)
释义:医院正在跑业务的真实数据库,如 HIS、EMR、LIS、PACS,不能直接动、不能直接科研。
-
ODS
释义:从生产库抽过来的原始数据临时层,基本不加工,只做汇聚,是专病库的数据来源。
-
CDR(临床数据中心)
释义:全院患者数据整合中心,专病库一般从 CDR/ODS 取数。
-
EDW(数据仓库)
释义:经过高度整合、建模、用于全院分析的数仓,比 ODS 更规整。
-
主题库 / 专题库
释义:按业务主题建库,如 “手术库”“慢病库”,专病库属于其中一种。
-
ETL
释义:抽取→转换→加载,把数据从业务系统搬到专病库的全过程。
-
ELT
释义:先抽取加载,再转换,现在大数据平台常用。
-
增量同步
释义:只同步新增 / 修改的数据,不每次全量抽,效率更高。
-
全量同步
释义:把历史所有数据重新抽一遍,常用于初始化。
二、数据标准与治理
-
ICD-10
释义:国际疾病分类编码,诊断必须用它标准化。
-
ICD-9-CM3
释义:手术操作分类编码,手术必须标准化。
-
数据映射
释义:把医院自己的编码对应到国家标准码。
-
术语标准化
释义:把 “高血压”“血压高”“HTN” 统一成一个标准名称。
-
数据质控规则
释义:判断数据是否合格的规则,如年龄不能 > 120、检验值不能为负。
-
缺失值
释义:该有却没有的数据,科研大忌。
-
异常值
释义:明显不合理的数据,如心率 1000 次 / 分。
-
去重
释义:同一个患者多条重复记录合并成一条。
-
主索引(EMPI)
释义:全院唯一患者识别号,保证一个人只对应一条档案。
三、专病库核心业务
-
专病入组
释义:患者满足条件,自动进入专病库。
-
自动入组
释义:系统按纳排规则自动筛选,不用医生手动加。
-
手动入组
释义:医生觉得符合但系统没抓到,手动加进去。
-
专病模型
释义:这个病要收集哪些字段,表结构怎么设计。
-
专病子集
释义:从专病库里再筛选一批特定人群做研究。
-
随访数据
释义:患者出院后复查、用药、结局数据,科研非常重要。
-
纵向数据
释义:同一个患者多次就诊、多年的连续数据。
-
横向数据
释义:同一时间点一批患者的快照数据。
四、科研平台常用
-
回顾性研究
释义:用历史病历数据做研究,最常见。
-
前瞻性研究
释义:从现在开始规划,后续随访观察。
-
队列研究
释义:分两组人群,观察一段时间看结局差异。
-
病例对照研究
释义:有病一组、没病一组,倒推危险因素。
-
单因素分析
释义:只看一个因素对结果的影响。
-
多因素分析
释义:同时考虑年龄、性别、基础病等多个因素。
-
统计分析
释义:计算率、均值、P 值、OR 值、风险比等。
-
数据可视化
释义:折线图、柱状图、散点图、生存曲线。
-
生存曲线
释义:肿瘤、慢病科研最常用的图。
-
科研项目管理
释义:立项、成员、数据使用、成果导出全流程。
-
数据导出
释义:医生把数据导出到 Excel/SPSS 做分析。
-
受试者招募
释义:用专病库快速找符合临床试验的患者。
(注:文档部分内容可能由 AI 生成)