专病库和科研词汇


一、数据层相关

  1. 原始库(生产库)

    释义:医院正在跑业务的真实数据库,如 HIS、EMR、LIS、PACS,不能直接动、不能直接科研。

  2. ODS

    释义:从生产库抽过来的原始数据临时层,基本不加工,只做汇聚,是专病库的数据来源。

  3. CDR(临床数据中心)

    释义:全院患者数据整合中心,专病库一般从 CDR/ODS 取数。

  4. EDW(数据仓库)

    释义:经过高度整合、建模、用于全院分析的数仓,比 ODS 更规整。

  5. 主题库 / 专题库

    释义:按业务主题建库,如 “手术库”“慢病库”,专病库属于其中一种。

  6. ETL

    释义:抽取→转换→加载,把数据从业务系统搬到专病库的全过程。

  7. ELT

    释义:先抽取加载,再转换,现在大数据平台常用。

  8. 增量同步

    释义:只同步新增 / 修改的数据,不每次全量抽,效率更高。

  9. 全量同步

    释义:把历史所有数据重新抽一遍,常用于初始化。

二、数据标准与治理

  1. ICD-10

    释义:国际疾病分类编码,诊断必须用它标准化。

  2. ICD-9-CM3

    释义:手术操作分类编码,手术必须标准化。

  3. 数据映射

    释义:把医院自己的编码对应到国家标准码。

  4. 术语标准化

    释义:把 “高血压”“血压高”“HTN” 统一成一个标准名称。

  5. 数据质控规则

    释义:判断数据是否合格的规则,如年龄不能 > 120、检验值不能为负。

  6. 缺失值

    释义:该有却没有的数据,科研大忌。

  7. 异常值

    释义:明显不合理的数据,如心率 1000 次 / 分。

  8. 去重

    释义:同一个患者多条重复记录合并成一条。

  9. 主索引(EMPI)

    释义:全院唯一患者识别号,保证一个人只对应一条档案。

三、专病库核心业务

  1. 专病入组

    释义:患者满足条件,自动进入专病库。

  2. 自动入组

    释义:系统按纳排规则自动筛选,不用医生手动加。

  3. 手动入组

    释义:医生觉得符合但系统没抓到,手动加进去。

  4. 专病模型

    释义:这个病要收集哪些字段,表结构怎么设计。

  5. 专病子集

    释义:从专病库里再筛选一批特定人群做研究。

  6. 随访数据

    释义:患者出院后复查、用药、结局数据,科研非常重要。

  7. 纵向数据

    释义:同一个患者多次就诊、多年的连续数据。

  8. 横向数据

    释义:同一时间点一批患者的快照数据。

四、科研平台常用

  1. 回顾性研究

    释义:用历史病历数据做研究,最常见。

  2. 前瞻性研究

    释义:从现在开始规划,后续随访观察。

  3. 队列研究

    释义:分两组人群,观察一段时间看结局差异。

  4. 病例对照研究

    释义:有病一组、没病一组,倒推危险因素。

  5. 单因素分析

    释义:只看一个因素对结果的影响。

  6. 多因素分析

    释义:同时考虑年龄、性别、基础病等多个因素。

  7. 统计分析

    释义:计算率、均值、P 值、OR 值、风险比等。

  8. 数据可视化

    释义:折线图、柱状图、散点图、生存曲线。

  9. 生存曲线

    释义:肿瘤、慢病科研最常用的图。

  10. 科研项目管理

    释义:立项、成员、数据使用、成果导出全流程。

  11. 数据导出

    释义:医生把数据导出到 Excel/SPSS 做分析。

  12. 受试者招募

    释义:用专病库快速找符合临床试验的患者。


(注:文档部分内容可能由 AI 生成)