纵向研究(Longitudinal Study)

  • 定义: 纵向研究(longitudinal study)又称随访研究(followup study),是指在不同时间点对同一特定人群的疾病、健康状况和某些因素进行一段时间的调查,即定期随访,观察或测量同一特定人群的疾病、健康状况或某种特征随时间的发生,发展和变化情况。其特点就是同一被试数据之间存在高度相关,并且数据随着时间可能呈现出稳态(稳定性)和变化(增强或衰退)两种基本情况。
  • 纵向数据的结构:
    • 最核心的是时间点(time point)
    • 嵌套结构中每个数据的层次,称为水平(level)。对于嵌套结构的基本单位,经济学中称一个个体数据为一个面板(panel)。而医学和生物学将来自同一批次或环境的数据称为集团数据(clustered data),例如同一父母的子女,同一窝的小白鼠。由于集团数据在先天遗传基因和后天生长环境上高度相关,所以每一个集团的数据可以视为心理学中的一个被试。
  • Example 同一批数据的纵向研究,其中与情绪调节相关的分析发到情绪相关期刊,与人格相关的分析发到人格期刊,与发展有关的分析发到发展心理学期刊。非常值得借鉴!
    1. Donald, J. N., Ciarrochi, J., & Sahdra, B. K. (2020). The consequences of compulsion: A 4-year longitudinal study of compulsive internet use and emotion regulation difficulties. Emotion (Washington, D.C.), 10.1037/emo0000769. Advance online publication. https://doi.org/10.1037/emo0000769
    2. Donald, J. N., Ciarrochi, J., Parker, P. D., & Sahdra, B. K. (2019). Compulsive internet use and the development of self-esteem and hope: A four-year longitudinal study. Journal of personality, 87(5), 981–995. https://doi.org/10.1111/jopy.12450
    3. Ciarrochi, J., Parker, P., Sahdra, B., Marshall, S., Jackson, C., Gloster, A. T., & Heaven, P. (2016). The development of compulsive internet use and mental health: A four-year study of adolescence. Developmental psychology, 52(2), 272–283. https://doi.org/10.1037/dev0000070

测什么?

  • 特质性的,例如人格,ER特质
  • 状态性的,例如情绪状态
  • 热点

相关概念: Prospective study (前瞻性研究) retrospective study (回溯性研究)

  • A prospective study, loosely defined, is a study that starts in the present and continues forward in time.
  • It is differentiated from a retrospective study, which looks at a known outcome backward, determining the factors that influenced the outcome. The retrospective study already has the material at hand, which can help make determinations about cause and effect, but the prospective researcher gathers information as an experiment or study progresses. This term is defined loosely because there are numerous permutations of both prospective and retrospective studies, and they can vary widely in how they are conducted.
  • Examples:
    • Marijnissen, R. M., Vogelzangs, N., Mulder, M. E., Van Den Brink, R. H. S., Comijs, H. C., & Voshaar, R. O. (2017). Metabolic dysregulation and late-life depression: a prospective study. Psychological Medicine, 47(6), 1041.
    • Vogelzangs, N., Beekman, A. T., van Reedt Dortland, A. K., Schoevers, R. A., Giltay, E. J., De Jonge, P., & Penninx, B. W. (2014). Inflammatory and metabolic dysregulation and the 2-year course of depressive disorders in antidepressant users. Neuropsychopharmacology, 39(7), 1624-1634.
    • 赵敏, 郝伟, 杨德森, 张亚林, & 李凌江. (2001). 海洛因依赖者复吸相关因素的前瞻性研究. 中国临床心理学杂志(02), 1-3+9.
    • 早期成长与发展研究:利用前瞻性的养子女设计研究遗传与环境的互动
    • 丁丽丽,何守森,周倩,徐小娟,唐敬海,张艳. (0). 家庭养育环境对儿童早期发育及情绪社会性发展的前瞻性研究. 中国儿童保健杂志(9期), 910-912.

纵向研究设计

要点

  1. 纵向研究或者说追踪研究的核心,就是“纵向”时间线如何设计。
    • 时间点的设计:追踪研究测量次数要求与理论模型有关, 模型越复杂, 需测量的次数越多, 最小测量次数不小于p + 1( p 为模型中未知固定参数个数) ( Tekle et al. ,2011; Willett et al. , 1998) 。追踪研究的测量次数应不少于 3 ( Willett et al. , 1998; 盖笑松, 张向葵, 2005;唐文清 等,2014) 。
    • 追踪研究主要依据理论假设确定时间间隔:急速发展期缩短间隔,而缓慢发展期则增加间隔(唐文清 等,2014)。
  2. 纵向设计的样本量如何确定?
    • 研究发现, 当测量次数小于 5、研究持续时间短于 3 年, 样本量 达 500 以 上 方 可 获 得 较 好 的 统 计 功 效( Hertzog, Lindenberger, Ghisletta, & Von Oertzen,2006; Muthén & Curran, 1997) 。
  • 参考文献:
    1. 唐文清, 方杰, 蒋香梅, & 张敏强. (2014). 追踪研究方法在国内心理研究中的应用述评. 心理发展与教育, 30(2), 216–224. https://doi.org/10.16187/j.cnki.issn1001-4918.2014.02.006 2.唐文清, 张敏强, 黄宪, 张嘉志, & 王旭. (2014). 加速追踪设计的方法和应用. 心理科学进展, 22(02), 369–380.
    2. Burchinal MR, Nelson L, Poe M. Growth curve analysis: An introduction to various methods for analyzing longitudinal data. Monographs of the Society for Research in Child Development. 2006;71:65–87.

类型

  1. 根据设计中变量的操纵来分:
    • 观察性纵向设计
    • 实验性纵向设计
    • 经济学中有一个术语叫面板设计(Panel Design),其实就是指纵向设计。A panel design is used when researchers sample a group, or panel, of participants and then measure some variable or variables of interest at more than one point in time from this sample. Ordinarily, the same people who are measured at Time 1 are measured at Time 2, and soon (Salkind 2010).
    • Panel design或者纵向设计,是相对于横向研究(cross-sectional study)而言的。
  2. 根据测量时间点的密度来分:
    • 密集型纵向数据(Intensive longitudinal data,ILD)。例如使用经验取样法(experience sampling method, ESM)所采集的数据就属于该类型数据,能够在短时间内,采集大量时间点的数据
    • 稀疏型纵向数据,例如重复测量实验数据,属于最简单的纵向数据(一般只有两个时间点),只需要ANOVA就可以分析。

纵向研究数据类型

  • 连续变量
  • 分类变量:二分,多分

纵向研究数据分析

  • 变量随着时间的变异,可以分为两种。第一是时间独立变量的变异,例如稳定的人格特质可能在不同的时间点表现出一致性;第二是时间依存变量的变异,例如老年人的认知水平会随着年龄的增加而减弱。
  • 分析的目的:单个或多个变量的发展趋势(例如认知功能是增强还是减弱),或者两个或多个变量之间的变化关系。

数据分析的基本概念

  • 模型(model)指的是变量之间的相互关系,对应Mplus中的model部分,可以用模型图中的变量模块(椭圆或方块)以及它们之间的箭头来表示。
  • 模型估计指的是根据某种统计原理(如贝叶斯或频次)应用于构建某种模型,以估计出模型中路径参数(estimate)的过程。
    • 例如最简单的一般线性多元回归模型中,使用最小二乘法(OLS)去估计X1-Xn对Y的参数。
    • 这部分对应的是Mplus中Analysis部分。
  • 算法指的是在模型估计中使用的具体运算方法,对应的是Mplus中Analysis-Estimator部分。
  • 模型检验:
    • 拟合度检验:潜变量建模的前提
    • 变量显著性检验

基本分析:描述,相关和基本推断统计

  • 纵向研究的数据分析也离不开基本的描述和相关分析。通过描述-相关和基本推断统计,我们能够得知感兴趣变量在不同人口学变量之间的差异,数据的自相关,以及时间对变量的影响(T1 VS T2)。
  • 如果人口学之间肉眼可见的差异(结合前人文献),那么后续的回归分析中就要控制掉这一人口学变量。
  1. 第一步,探索性分析(Exploratory analysis of longitudinal data)。干预组和对照组,其均值和标准差随时间变化的趋势是否存在差异(Mean of sth over time)。
  2. 第二步,派生变量分析(Derived Variable Analysis)
    • 原始变量是每个时间点每个被试的测量值
    • 对原始变量进行处理,如各组的时间信息平均掉,每个被试得到一个平均值。该值就属于派生变量。
    • 派生变量最显著的优点是可以拿去做双样本t-test或ANOVA,但纵向研究最大的不足就是损耗(Attrition), 因此有些被试可能只有前测,而缺失了后测,或者后测缺失了某个时间点等等。这些缺失的数据无法用于派生变量分析,只能排除
    • Pre/Post Analysis: a single baseline and a single follow-up measurement are available.
  3. 相关分析模型:被试内相关。思考:同一个被试的重复测量指标,适合做相关吗?

回归建模

  1. 回归模型的选择,从一般线性回归到分层(多层,或多水平)线性回归。标准回归方法假设所有的观测值(因变量)应该是相互独立。这显然不适用于纵向数据。如果将标准 回归应用到纵向数据,就会产生无效的标准差。面对这种情况,有如下几种解决办法:
    • 解决方法一:考虑每个被试内相关,并用其来估计回归参数的标准误。分层回归。
    • 解决方法二: 使用一般回归模型(general regression methods),对标准误进行矫正
    • 典例:Mixed effects regression model (MER):within-subjects model + between-subjects model
    • 典例:Generalized Estimating Equations (GEE)
  2. 追踪数据分析的回归模型:
    • 多层线性模型:一个被试数据嵌套于多层结构;可以处理两层或多层的嵌套数据(例如学生-学校-地区),可以纳入中介或调解变量
    • 潜变量增长曲线模型:
    • 最早由Meredith& Tisak(1984,1990)提出LCM的单变量模型,后来又扩展到多变量模型。多变量LCM被称为并行LCM。
    • 主要目的是分析各种变量的发展轨迹特征(截距、斜率)
    • 要求变量具有系统的时间趋势(线性或非线性)
    • 可以纳入协变量,以探索截距或斜率的影响因素
    • 可以探究一个变量的截距对另一个变量的斜率影响;或者截距之间的影响 * 交叉滞后模型
    • 最早由Joreskog (1970)提出
    • 主要目的在于探究变量间的历时性相互影响
    • 假设变量的观测值围绕均值上下波动
    • 不要求变量满足线性或非线性的时间变化趋势
    • 控制了上一时刻变量本身的影响(自回归)
    • 关键系数:自回归系数,交叉滞后系数
    • 注意显变量和潜变量的CLPM代码有所差异
  3. 总结

多层线性模型(Hierarchical Linear Model,HLM),也叫多水平模型(Multilevel Model,MLM)

  • 定位:嵌套数据结构
  • 注意:虽然可以将纵向数据中的时间点也视为一个数据层次或水平,但实际操作起来需要将数据从宽数据(wide)变成长数据(long)。这样减少了一个关键的自变量,增加了一个分类变量,反而会造成无法进行交叉滞后分析,只适合组别分析。所以,嵌套数据中的嵌套结构,一般指的是空间、社会意义上的层次,时间不作为一种层次。以学生为例,学生、班级、学校、城市、地区、国家。
  • 回归分析是几乎所有统计模型的基础,而回归分析的最一般形式则可以归为多层线性模型HLM。
  • 社会科学常用的高级统计方法之一,它在不同领域也有一些近义词或衍生模型:
    • 线性混合模型(Linear Mixed Model)
    • 混合效应模型(Mixed Effects Model)
    • 随机效应模型(Random Effects Model)
    • 随机系数模型(Random Coefficients Model)
    • 方差成分模型(Variance Components Model)
    • 增长曲线模型(Growth Curve Model)
  • 多层线性模型(HLM)及其自由度问题.

  • 参考文献; Hecker, K., & Violato, C. (2008). How much do differences in medical schools influence student performance? A longitudinal study employing hierarchical linear modeling. Teaching and learning in medicine, 20(2), 104-113. Trajectories and perceptual precursors of intelligence in minimally verbal autistic children from preschool to school age

广义估计模型(Generalized Estimating Equations,GEE)

  • 重复测量数据(实验性追踪数据?)经常面临的问题是
    1. 临床资料又常常含有缺失值,缺失某个时间点的数据。
    2. 观察指标Y不满足正态性、方差齐性,且样本量不是很大。
    3. 数据不符合相互独立的原则。
    4. 还有其他协变量数据。
  • GEE分析重点:假设我们观察到一组对象的多个时间点的重复测量(预测变量和结果变量),需要根据预测变量对个体结果/结局变量进行模型拟合。所以GEE感觉更适合实验性质的纵向数据,探究预测变量对结果变量的影响;而相比之下,LGM更适合观察性质的纵向数据。
  • 适用模型:广义估计方程(GEE)和混合效应模型分析都非常适合于重复测量数据。,GEE原理跟混合效应模型不太一样,但得到的结果一般是一致的。
  • 定位:
    1. 适用于在多次测量的重复数据中,探究预测变量对结果变量的影响——不像LGM主要关注变量的发展趋势。
    2. 纵向数据中,每一个对象的测量结果多少都有相关性,个体内的误差也是相关非独立的。GEE不需要假设误差独立分布,所以适用于多个非独立的变量的分析。
  • 工具1:Mplus中没有GEE的算法,但提供了MLR等针对非独立数据的算法。
  • 工具2(R语言):gee包,geepack包

潜变量增长曲线模型(Latent Growth Modeling,LGM)

  • 定位:分析个体发展趋势,具体而言潜增长模型关注的是样本中每个个体在某个变量(e.g., delinquency score)的多次测量中得分的变化趋势, 此模型捕捉到的正是在变化趋势或变化轨迹有关的参数上的个体间差异。HLM和LGM都可以用于纵向数据的分析,而且LGM相比HLM有诸多优点。但是个人感觉LGM对数据要求比较高,尤其是样本量。另外,HLM在纵向数据分析中的应用只是其功能一部分,其主要用于社会分层数据的横向数据分析。
  • 参考文献:Shin, J. H., & Shin, I. S. (2019). Investigation of Longitudinal Data Analysis: Hierarchical Linear Model and Latent Growth Model Using a Longitudinal Nursing Home Dataset. Research in Gerontological Nursing, 12(6), 275-283.
  • 教程
  • 简而言之,LGM将时间变量作为预测变量,探究因变量score如何随着time(如年龄增长)而线性变化。因变量分数的变异可以由两个参数来表征:截距(intercept)和斜率(slope)。LGM 定义截距和斜率为潜因子 , 分别表示测量变量的初始水平和随时间的变化率 , 两者共同描述追踪数据的发展轨迹特征。 HLM应用于纵向数据时原理类似。
  • 数据要求:
    1. 适用于固定时间截点的数据(非固定时间点数据不能用)
    2. 至少需要3个时间点
    3. 对样本量的要求较高(刘红云 ,孟庆茂 , 2003; Miyazaki & Raudenbush, 2000),有研究认为至少需要100个样本量(Curran et al., 2010),甚至想要获得较大的统计检验力(power > .80)则需要大于300的参与者数据才可(Raudenbush & Liu, 2001)。
    4. 数据缺失率随机,且低于20%
  • 在纵向数据分析中,LGM往往被认为是默认选择。但是这篇研究通过对比多种不同的分析方法发现,LGM并不一定是最优选择。Liu, S., Rovine, M. J., & Molenaar, P. C. M. (2012). Selecting a linear mixed model for longitudinal data: Repeated measures analysis of variance, covariance pattern model, and growth curve approaches. Psychological Methods, 17, 15–30. https://doi.org/10.1037/a0026971

潜类别模型

  • HLM和LGM在分析时,一个既定假设是样本内的总体趋势是一致的,不存在亚类。
  • 但有时候一些变量的发展趋势会存在亚类,例如有的个体压力越大,工作效率越高(线性增长);而有的个体,压力越大,工作效率呈现倒U型曲线(二次变化)。此时简单地使用HLM或LGM就会忽略这种可能,且样本内亚类存在还可能会导致模型拟合度欠佳。
  • 此时,要使用潜类别分析。潜在群组分析就是用来探究是否存在不同的群组,然后看不同的预测变量,及结果变量和不同群组的关系。
  • Latent Class Analysis (LCA),潜在类别分析,适用于处理分类变量;还有一个同胞兄弟,Latent Profile Analysis(LPA),潜在剖面分析,适用于处理连续变量
  • Latent Transition Analysis (LTA,潜在群组转变) 是Latent Class Analysis 的扩展,简单而言是把Latent class analysis 应用到纵向数据。Latent transitionanalysis (LTA) is a type of longitudinal analysis that explores change inlatent classes of individuals over time (Nylund, 2007).
  • 五个步骤。这个方法是在Nylund (2007)年博士论文里提出来的,详细提出了5个步骤,但我觉得有些麻烦,正式发表的论文没有见到是严格按照其五步的(来自荷兰统计联盟):
    1. Step 0:描述统计
    2. Step 1 确定群组数量——基于单个时间点数据,根据模型拟合指数决定潜在群组/剖面Class/Profile的数量。
    3. Step 2: 探索LCA/LTA 横断数据的前因变量及结果变量
    4. Step3: Explore Specification of the Latent Transition Model without Covariates。将不同时间点数据全部放入,探究LCA群组的转变。
    5. Step 4: Include Covariates in the LTA Model。在这一步里, 我们纳入covariates,如年龄、性别。学校欺凌,是不是男生,从TIME1到TIME 2比如因为年龄增长,从严重欺凌转到中度或无的群组?
    6. Step 5: Include Distal Outcomes and Advanced Modeling Extensions- Mover or Stayer

实战1:交叉滞后回归分析(Cross Lagged Panel Model, CLPM)

  • 定义:交叉滞后分析是对纵向追踪研究获得的多次数据进行分析,以便确定变量之间因果关系的一种分析方法。
  • 基本概念:
    • 时点,又称为时间点(time point),测量次数;
    • 自回归(autoregression):多个时间点同一自变量之间的因果关系
    • 相关/协方差:同一个时间点,不同变量之间的共变关系
    • 交叉滞后回归系数(cross-lagged regression): 多个时间点,不同变量之间的因果关系
  • 交叉滞后模型的常见类别:
    • 交叉滞后面板模型(CLPM)
    • 随机截距-交叉滞后面板模型(random CLPM)
  • Mplus代码的注意事项。写代码之前,先画出模型图。
  • AMOS是直接先画图。注意显变量是方框,潜变量算圆框。
  • 结果报告:
    • 显变量模型一般是饱和模型,不需要报告模型拟合系数。
    • 是不是必须报告标准化的模型结果?
    • 必须报告T1对T2的回归系数,SE,t和p值。
  • 分析定位(什么时候用):分析两个变量X和Y两者之间的关系如何随着时间变化没有明确假设的时候,可以使用交叉滞后分析来明确到底是x在影响y还是y在影响x,或者是相互都有影响(相互的–reciprocity),以及每个路径的强度
  • 交叉滞后的模型解释,关键术语:
    1. 自相关系数(X1-X2,or Y1-Y2)
    2. 交叉滞后系数(X1-Y2, or Y1-X2)
  • 结果解释。但是仅凭面板数据推因果也是有问题的,首先你是没有办法独立地操纵自变量,第二有可能你会忽略了其它的预测因素,所以使用交叉滞后模型做因果推论也是需要谨慎的:
  • 分析软件:R(lavaan),Mplus

随机截距交叉滞后(Random Intercept Cross Lagged Panel Model,RI-CLPM)

  • 在传统交叉滞后模型的基础上,Hamaker等人(2015)提出了随机截距的交叉滞后模型(random intercepts cross-lagged panel model),通过结构方程模型的方法,在交叉滞后模型中引入一个随机截距的潜变量,用此潜变量来表征特质水平的、不随时间变化的稳定性。变量在个体间存在不同的截距水平,每个个体是随时间而围绕自己的截距变化,不再是围绕统一的样本均值而变化。
  • 数据要求:需要至少3个时间点的数据
  • 代码和demo数据见荷兰统计学联盟微信公共号教程。

实战2:多水平线性/非线性回归(HLM)在纵向追踪数据中的应用

  • 数据要求:
    1. 至少需要3次以上的测量数据;2次可以用交叉滞后模型。
    2. 各次测量之间具体等价性,即保证每次测量使用的测量工具是一样的。如果测量工具需要随着个体发展性的需要而改变,则需要进行分数转换。
  • 使用软件:HLM7
  • 数据准备:Level1(长数据格式,需要增加Time变量,从0开始编码), Level2(宽数据,被试人口学和其他协变量信息)
  • 操作流程(参考刘红云老师,高级心理统计,第十四章)

实战3:LGM在纵向追踪数据中的应用

  • 使用软件:Mplus8
  • 数据准备:宽数据;对样本量要求很高,个人感觉没有300以上的样本量,模型拟合度弄不好。
  • 代码(参考王孟成老师,潜变量建模与MPLUS应用):
    1. 不变协变量(如性别),使用on,如 I S on gender;I S on age;
    2. 时间变化协变量(如情绪状态C是学习效应Y的协变量之一),Y1 on C1; Y2 on C2; Y3 on C3;
    3. 平行发展模型的LGCM(如运动时间和健康状况): IA SA | A1@0 A2@1 A3@3; IB SB | B1@0 B2@1 B3@3; IB SB ON IA SA; ! 用on把预测变量(IA SA)和结局变量(IB SB)联系起来
    4. 纵向中介模型,即在平行发展模型的基础上加一个不变协变量的中介: 在3代码上增加一句,IB SB IA SA ON C;
  • 指标1,模型拟合指标
  • 指标2,平均系数(means):
    1. 截距
    2. 斜率
    3. 二次项(Q)-曲线斜率
  • 指标3,变异值(Variances,表示个体差异):
    1. 截距
    2. 斜率
    3. 二次项(Q)-曲线斜率
  • 指标4,协相关(Slope with Intercept,表示?):
  • 结果报告参考文章:
    1. 姚卿, 陈荣, & 段苏桓. (2013). 童年中晚期孤独感的发展轨迹:一项潜变量增长模型分析*. 心理学报, 45(2), 206-216.
    2. 常淑敏, 郭明宇, 王靖民, 王玲晓, & 张文新. (2020). 学校资源对青少年早期幸福感发展的影响:意向性自我调节的纵向中介作用. 心理学报, 52(7), 12.

实战3 潜分类+logistics回归

数据准备

  • 先对PSQI进行变量转换,连续到二分(可以直接使用LPA,这样做没必要了)
  • 然后使用潜分类对PSQI的变化趋势进行分类
  • 再使用logistics回归检测情绪特质(如心理弹性)是否能够预测该分类
  • R3STEP command in Mplus (Asparouhov & Muthén, 2013; Vermunt, 2010)
  • DCON command in Mplus (Lanza, Tan, & Bray, 2013; see also Asparouhov & Muthén, 2013)

实战

实战4 潜剖面分析

结果报告

指标 标准
X2/df <3 good fit
RMSEA < 0.08 good fit
SRMR < 0.05 good fit
CFI > 0.95 good fit
TLI > 0.95 good fit
  • 模型复杂度(model complexity)指标。例如使用的参数数目。模型越复杂,可能拟合性越好,但牺牲了模型的简洁性和实用价值。
  • 自变量的多重共线性

参考文献

  • 《潜变量增长曲线模型》,(美)克里斯托弗·普里彻、(美)阿斯荣·威克曼,译者是姜念涛。
  • 黎小瑜, 罗坤, 曾小燕, & 邓稳根. (2018). 国内心理学文献中共同方法偏差检验的现状. 第二十一届全国心理学学术会议摘要集.
    1. Statistical Approaches to Longitudinal Data Analysis in Neurodegenerative Diseases: Huntington’s Disease as a Model
    2. An Overview of Longitudinal Data Analysis Methods for Neurological Research
    3. 基于交叉滞后结构的追踪模型-温忠麟(潜变量交叉滞后)
    4. 显变量交叉滞后分析
  • 参考文献: Hamaker, E. L., Kuiper, R. M., & Grasman, R. P. (2015). A critique of the cross-lagged panel model. Psychological methods, 20(1), 102.
    1. 刘清堂, 卢国庆, 邓伟, 吴林静, 梅镭, & 王娇娇. (2021). 情境感知的移动经验取样方法及工具研究. 中国远程教育, 06, 35–45. https://doi.org/10.13541/j.cnki.chinade.2021.06.005
    2. https://quantdev.ssri.psu.edu/