全球旧事资料 分类
准主要内容及适用范围
2
f本标准规定了中医药数据集的分类与代码。本标准适用于中医药领域数据集调查与规划,数据集的组织与描述、整合、汇交、发布和目录查询,以及中医药信息系统的规划与设计。22标准主要内容的确定
本标准起草过程中,对当前中医药领域数据集和卫生领域数据集相关标准进行了调研和数据分析。
221数据集分类方法的确定调研分类编码的方法,分为线分类法和面分类法。
线分类法:线分类法是将分类对象按选定的若干属性(或特征),逐次地分为若干层级,每个层级又分为若干类目。同一分支的同层类目之间构成并列关系,不同层级类目之间构成隶属关系。
面分类法:选定分类对象的若干属性(或特征),将分类对象按每一属性(或特征)划分成一组独立的类目,每一组类目构成一个“面”。再按一定顺序将各个“面”平行排列。使用时根据需要将有关“面”中的相应类目按“面”的制定排列顺序组配在一起,形成一个新的符合类目。
结合中医药数据集的特点,本标准采用面分类法和线分类法相结合的方法。
222数据集分类与代码的确定(1)数据集分类维度的确定数据集分类根据数据集的重要属性对它进行分类。每个数据集都是围绕一定的主题构建的,每个数据集都有一个主题,这也是数据集的主要内容属性。所以中医药数据集分类以主题分类为主要分类。其次,数
3
f据集的内容来源,是来自于实验、观测等的原始记录,还是来自于研究报告、论文等经过一定总结归纳的内容,亦或来自于历史文献中等信息,对于数据集的使用者也是非常重要的。再次,数据集创建者是什么类型的机构,科研机构、医疗机构、还是商业机构等,也是数据集分类的一个重要维度。
所以,中医药数据集分类按照数据集主题进行主要分类,同时在若干相同主题数据集中,又根据其个性,如创建者类型、内容来源等多属性进行分类。
(2)数据集编码设计数据集分类编码设计分为中医药领域代码、创建者类型代码、数据来源类型代码、主题类型代码等4部分,每部分之间用符号“”分隔。中医药领域代码:用中医药英文缩写首字母TCM表示;创建者类型代码:按中医药领域业务范围,将数据集创建机构分为10个类型,并为每一类型赋予3位字母代码。数据来源类型代码:根据数据集原始数据来源不同,将数据集来源分为4个类型,用2位阿拉伯数字表示。主题类型代码:根据数据集内容主题不同,将数据集按主题分为6个一级类及若干子类,用6位阿拉伯数字表示。三、采用国际标准和国外先进r
好听全球资料 返回顶部