加載中........
×

重復測量數據的統計分析,警惕犯這些錯誤!

2019-7-11 作者:馮國雙   來源:小白學統計 我要評論0
Tags: 重復測量數據  

重復測量(repeated measures)數據是醫學領域中非常常見的一種數據,對于這種數據的分析,有很多種方法,有的還較為復雜,不是三言兩語能說清楚的。本文主要介紹一下重復測量數據的一些概況。

“重復測量”是什么

重復測量數據很多人可能都見過,比如隨機對照試驗中,對兩組人群分別在不同時間點進行觀察,這就是重復測量。再比如,同一人群不分組,分別在用藥前、用藥后1月、用藥后2月進行療效觀察,這也是重復測量。

當然,重復測量不僅限于時間上的重復,也可以是空間上的重復,例如,同一患者的兩只眼睛,同一腫瘤患者的不同腫塊,同一醫生所診治的不同病人等。這些都是空間上的重復。所以說,“重復”是一個廣義上的概念,不僅僅是時間上測量的重復。

有一點要說明一下,“重復測量”數據與“重復調查”數據,并不是一個概念。重復測量是對同一樣本的不同時間點的測量,而重復調查是在不同時間點對不同群體的調查。例如,每隔幾年就重復調查的營養膳食情況,每隔幾年進行的消費者調查,這些是在時間上重復,但每次調查不一定是同一群體,可能有重復的人群,但是大多數可能都不是上一次被調查的人。

這種重復調查數據分析的是年代、世代等的一些現象的變化,通常可以采用年齡+時期+世代分析,跟同一人群的重復測量數據不同。

重復測量數據的錯誤分析

目前發表的論文中,存在很多對重復測量數據的錯誤分析。比較典型的錯誤應用有:

對于同一人群(不分組)測量了4個時間點,分析時將這4個時間點作為獨立的4組,采用常規的方差分析來處理。

對于同一人群(不分組)測量了4個時間點,將4個時間點作為隨機區組,采用隨機區組方差分析來處理。

如果是將研究對象分為2組,每組分別測量4個時間點,分析時分別在每個時間點做t檢驗,而且煞有介事地說什么時候開始有差異,等等之類的。

將癌癥研究對象分為2組,每組研究對象有1個或多個復發腫瘤大小,將所有腫瘤合并在一起,以腫瘤為原始數據(而不是以個體為原始數據)進行常規的方差分析或t檢驗。

上述這些都是比較典型的錯誤做法,而這些錯誤用法在很多雜志上依然屢見不鮮。

為什么這么做是錯誤的呢?因為不管是時間上還是空間上,重復測量數據的共同的特點是同一研究對象的重復測量值之間是非獨立的(nonindependent)。

例如,同一患者的血壓值,在今天以及一個月以后測量,肯定有一定相關性的,不大可能今天測量140,下個月就變成180了。同樣,同一個體身上不同部位的腫瘤大小,可能也是有關系的,而不同人之間可能是獨立的。

傳統的t檢驗或方差分析等,要求的前提條件之一就是獨立性。直接采用t檢驗或方差分析來處理重復測量數據,就是無視方法的應用條件,往往容易導致標準誤的低估,從而增加假陽性錯誤。

重復測量數據的處理

那重復測量數據應該怎么來處理呢?這個需要根據研究目的和數據類型而定。

如果只有一組人群,在不同時間點分別進行觀察,如用藥前、用藥后1月、用藥后3月分別觀察療效情況,目的是比較用藥后是否比用藥前有所改善。這時可以考慮重復測量方差分析或者多水平模型(因為重復測量數據可以看做是一個2水平的數據,個體是水平2,重復測量值是水平1,水平1嵌套在水平2之中),還可以用廣義估計方程。

如果將一群人分為2組或多組,目的是為了比較時間點之間的差異,還有組間差異,這種仍然可以考慮重復測量方差分析或多水平模型,以及廣義估計方程。

如果一群人,觀察了多個時間點,目的是為了觀察不同時間點的變化趨勢。例如,對學齡前兒童測量其體重、身高一起其它發育指標,然后每隔2年測量一次,共測量5次,想觀察兒童身體發育的變化情況。這時候可以考慮生長曲線分析(growth curve analysis),探索隨時間變化的趨勢,是直線發展,還是曲線發展。

如果有一群人,觀察了多個時間點,目的不僅是為了觀察隨時間的變化趨勢,還想看看這些人的變化是不是可以進行歸類。例如還是剛才的例子,不僅要考察兒童的身體發育的趨勢,而且想看一下,是不是有的兒童發育快,有的兒童發育慢,把他們分分類。這時候可以考慮潛變量分類分析,軌跡分析模型等等。

有時,時間序列分析也可以算作是重復測量數據分析的一種,只不過時間序列分析的時間序列數據一般都不是個體,而是更高級的單位,如某地區多年GDP數據,某市10年的流感數據,等等。這些數據也算是重復測量,可以用時間序列分析進行預測,如根據前10年的流感數據,預測下一年的發病趨勢。所以,對于這種情況,一般目的是用于預測。

還有一種叫做面板數據(panel data),也可以看做是重復測量數據,這種數據一般也都不是個體數據,也是一些城市層面上的數據,不過跟時間序列不同的是,時間序列只是一個城市的多年數據,而面板數據是多個城市的多年數據。

這種數據一般在社會經濟領域用的較多,這種數據一般城市不一定太多,但觀察時間可能很多。跟醫學中的重復測量恰恰相反,醫學中通常是個體數據,觀察的個體很多,但觀察時間點沒有多少。所以,對于面板數據,也有自己的分析方法,比如固定效應模型分析(詳細還可分為個體固定效應、時間固定效應、個體-時間固定效應),隨機效應模型分析(也就相當于多水平模型)等等。

總之,重復測量數據這個詞很簡單,但是涵蓋的領域很廣泛,分析方法也較多,無論用什么方法,都需要結合研究目的、數據結構、數據類型綜合來判斷,而不是簡單地人云亦云,看別人文章怎么寫,你也怎么寫。



小提示:78%用戶已下載梅斯醫學APP,更方便閱讀和交流,請掃描二維碼直接下載APP

只有APP中用戶,且經認證才能發表評論!馬上下載

web對話
变态现金棋牌
重庆肘时彩历史最大奖 金星彩票是官方的吗 广东时时历史开奖记录 近期电子送彩金网址 真人棋牌娱乐排名 pt游戏交易平台 天津时时开奖结果查询 博众时时彩是什么 新疆时时和值走势图 北京快车pk10官方网站 福建时时技巧 至尊国际网址 电子游戏免费注册送28元 福彩110期6码22选5 永利爆大奖平台 美娱娱乐官方