sas 如何使用proc split后生成决策树图形?

《纵向数据分析方法与SAS实现》由会员分享,可在线阅读,更多相关《纵向数据分析方法与SAS实现(143页珍藏版)》请在人人文库网上搜索。

1、纵向数据,張文超 2014年6月,目 录,1、什么是纵向数据? 2、介绍这类数据的分析方法,什么是纵向数据?,纵向数据是指一个被试群体在一个或多个变量上,多个时间点的测量结果。例如,一组纵向数据中有N个个体,所关心的变量有M个,测量时间点为T个。与横向数据相比,纵向数据有多个时间点,即T1。而横断数据T=1。纵向数据的第i个个体在第j个变量上的第t次测量结果可以表示Yijt,其(i=1,2,,N;j=1,2,M;t=1,2,T),纵向数据比横断数据多了一个时间维度。,多层(多水平)分析模型,来源:复杂数据统计方法,纵向数据分析方法,(1)方差分析 (2)多层线性统计分析模型 input x1

3、ouni表示不对x1 x4 作单变量方差分析; Repeated语句指示重复测量因素为time变量,共4个水平,各水平值分别为14。Printe 输出球对称性检验结果(即协方差阵的Mauchly检验结果)。,当不满足球形性时,一种是调整F,另一种是进行多元方差分析。,SAS 实现 -两因素重复测量方差分析,data A; input type$ subject time1 time2

利用正交多项式系数表配合正交多项式模型,方差分析的局限性,多水平统计模型简介,多层统计模型的出现,目前,大家基本上接受两组人分别独立开发出同一模型的结果。双方研究成果的发布时间基本相同(上世纪80年代末90年代初)。,S. Raudenbush与A. Bryk H. Goldstein,模型称为:hierarchical linear model; 软件为:HLM,模型称为:mul

8、tilevel models; 软件为:MLwiN(早期版本称ML3,MLn),横截面数据,层次结构数据,临床试验和动物实验的重复测量 多中心临床试验研究 纵向观测如儿童生长发育研究 流行病学现场调查如整群抽样调查 遗传学家系调查资料 meta 分析资料,多水平主成分分析 多水平因子分析 多水平判别分析 多水平logistic回归 多水平Cox模型 多水平Poisson回归

(unit) :指数据层次结构中某水平上的一个实体。例如,每个子女是一个水平1单位,每个家庭是一个水平2单位。 对于纵向数据,个体内不同测量时间是水平1,个体间不同个体是水平2。,层次结构数据为一种非独立数据。? 非独立数据

10、不满足经典方法的独立性条件,采用经典方法OLS可能失去参数估计的有效性并导致不合理的推断结论,非独立数据的组内相关结构各异,理论上,不同的结构应采用相应的统计方法。 多水平分析的概念为人们提供了这样一个框架,即可将个体的结局联系到个体特征以及个体所在环境或背景特征进行分析,从而实现研究的事物与其所在背景的统一。,层次结构数据的特殊性,经典模型的基本假定是单一水平和单一的随机误差项,并假定随机误差项独立、服从方差为常量的正态分布,代表不能用模型解释的残留的随机成份。 当数据存在层次结构时,随机误差项则不满足独立常方差的假定。模型的误差项不仅包含了模型不能解释的应变量的残差成份,也包含了高水平单位

11、自身对应变量的效应成份。 构建与数据层次结构相适应的复杂误差结构,这是多水平模型区别于经典模型的根本特征。,基本的多水平模型,随机结局?随机斜率?加入水平1解释变量?水平2解释变量?,固定效应:某研究中有多个不同的处理因素,若研究者感兴趣的各种处理因素都设计在研究当中,则认为这一因素具有固定效应。 Y0=b0+x y1=b1+x 随机效应:若处理包含的各个组别是从更大的总体中得到的随机样本,则认为该处理因素具有随机效应。 Y0=bj+x bj=b0+uj,多层统计分析模型目录:,1.方差成分模型 2.随机系数模型 3.模型参数估计方法 4.反应变量向量的协方差结构(了解) 5.假设检验 6.在

我要回帖

更多关于 sas em 决策树 的文章

 

随机推荐