专病库和科研词汇 – huangchaolong

一、数据层相关

原始库（生产库）

释义：医院正在跑业务的真实数据库，如 HIS、EMR、LIS、PACS，不能直接动、不能直接科研。
ODS

释义：从生产库抽过来的原始数据临时层，基本不加工，只做汇聚，是专病库的数据来源。
CDR（临床数据中心）

释义：全院患者数据整合中心，专病库一般从 CDR/ODS 取数。
EDW（数据仓库）

释义：经过高度整合、建模、用于全院分析的数仓，比 ODS 更规整。
主题库 / 专题库

释义：按业务主题建库，如 “手术库”“慢病库”，专病库属于其中一种。
ETL

释义：抽取→转换→加载，把数据从业务系统搬到专病库的全过程。
ELT

释义：先抽取加载，再转换，现在大数据平台常用。
增量同步

释义：只同步新增 / 修改的数据，不每次全量抽，效率更高。
全量同步

释义：把历史所有数据重新抽一遍，常用于初始化。

二、数据标准与治理

ICD-10

释义：国际疾病分类编码，诊断必须用它标准化。
ICD-9-CM3

释义：手术操作分类编码，手术必须标准化。
数据映射

释义：把医院自己的编码对应到国家标准码。
术语标准化

释义：把 “高血压”“血压高”“HTN” 统一成一个标准名称。
数据质控规则

释义：判断数据是否合格的规则，如年龄不能 > 120、检验值不能为负。
缺失值

释义：该有却没有的数据，科研大忌。
异常值

释义：明显不合理的数据，如心率 1000 次 / 分。
去重

释义：同一个患者多条重复记录合并成一条。
主索引（EMPI）

释义：全院唯一患者识别号，保证一个人只对应一条档案。

三、专病库核心业务

专病入组

释义：患者满足条件，自动进入专病库。
自动入组

释义：系统按纳排规则自动筛选，不用医生手动加。
手动入组

释义：医生觉得符合但系统没抓到，手动加进去。
专病模型

释义：这个病要收集哪些字段，表结构怎么设计。
专病子集

释义：从专病库里再筛选一批特定人群做研究。
随访数据

释义：患者出院后复查、用药、结局数据，科研非常重要。
纵向数据

释义：同一个患者多次就诊、多年的连续数据。
横向数据

释义：同一时间点一批患者的快照数据。

四、科研平台常用

回顾性研究

释义：用历史病历数据做研究，最常见。
前瞻性研究

释义：从现在开始规划，后续随访观察。
队列研究

释义：分两组人群，观察一段时间看结局差异。
病例对照研究

释义：有病一组、没病一组，倒推危险因素。
单因素分析

释义：只看一个因素对结果的影响。
多因素分析

释义：同时考虑年龄、性别、基础病等多个因素。
统计分析

释义：计算率、均值、P 值、OR 值、风险比等。
数据可视化

释义：折线图、柱状图、散点图、生存曲线。
生存曲线

释义：肿瘤、慢病科研最常用的图。
科研项目管理

释义：立项、成员、数据使用、成果导出全流程。
数据导出

释义：医生把数据导出到 Excel/SPSS 做分析。
受试者招募

释义：用专病库快速找符合临床试验的患者。

（注：文档部分内容可能由 AI 生成）

目录