Report of Cervical Cancer Survival Analysis
0.1 Finding Cutpoints for Continuous Variables
【本段簡述】
首先觀察各變數的Log Relative Hazard,依據變數與Log Relative Hazard 的關係使用Optimal Equal-HR Method和Hiearchical Bayes Model兩種方法對變項做切割,兩種方法的主要差異是在於前者主要用於切割Log Relative Hazard和變數間的是「U-shaped relationship」,而後者主要用於切割兩者屬於「Lineaer relationship」。
切割方式介紹:
Optimal Equal-HR Method:We use
findcutpoints()
in R package namedCutpointsOEHR
to determine two optimal cut-points of a continuous biomarker based on the U-shaped relationship between the value of the biomarker and its hazard ratio.Hiearchical Bayes Model:We use
rhier()
in the R package namedrolr
to determine two cut points of a continuous biomarker. Making use of the running logrank testrlr()
, the method first identifies an optimal cutpoint that gives the largest logrank statistic to split into two groups, and then repeats the process in each of the resulting groups to find additional two cutpoints. It then takes the cutpoint that gives the larger test statistic between the two as the second optimal cutpoint.
備註:若沒有滿足關係條件則不會有切割點出現。
0.1.1 Log Relative Hazard Plot
0.1.1.1 Plots for Biomarker
0.1.1.2 Plots for Covariate
0.1.2 Cutpoints with Optimal Equal-HR Method
0.1.2.1 Cutpoints table for Biomarker
Cutpoint_L | Cutpoint_R | |
---|---|---|
SCC | 0.10 | 5.60 |
UBE2C..H.Score.T. | 0.00 | 225.00 |
PDL1.CD274..H.Score.T. | 17.22 | 284.83 |
HPV18.E6..H.Score.T. | 25.00 | 232.50 |
HPV16.E6.H.Score.T. | 112.04 | 234.10 |
0.1.2.2 Cutpoints table for Covariate
Cutpoint_L | Cutpoint_R | |
---|---|---|
BW.kg. | 51.90 | 92.50 |
BMI | 20.60 | 41.70 |
OP.time..minutes. | 15.82 | 375.70 |
Blood.Loss..ml. | 5.00 | 30.00 |
Depth.of.invasion.mm. | 0.00 | 0.14 |
Total.LN | 0.00 | 0.03 |
No..Fraction | 10.00 | 21.00 |
LymphNodeInvasion | 11.00 | 26.00 |
wait4surgery | 0.00 | 4.00 |
R.Tperiod | 36.00 | 50.00 |
wait4R.T | 23.19 | 197.78 |
0.1.3 Cutpoints with Hiearchical Bayes Model
0.1.3.1 Cutpoints table for Biomarker
split1 | split2 | |
---|---|---|
CA125 | 20.80 | 43.10 |
CA199 | 15.08 | 79.43 |
CEA | 2.40 | 3.70 |
SCC | 0.40 | 5.90 |
UBE2C..H.Score.T. | 5.00 | 160.00 |
PDL1.CD274..H.Score.T. | 35.00 | 110.00 |
HPV18.E6..H.Score.T. | 100.00 | 232.50 |
HPV58.E6..H.Score.T. | 150.00 | 255.00 |
HPV16.E6.H.Score.T. | 60.00 | 95.00 |
ASCC2…H.Score.T. | 27.50 | 157.50 |
0.1.3.2 Cutpoints table for Covariate
split1 | split2 | |
---|---|---|
Age | 68.00 | 76.0 |
BH.cm. | 156.00 | 158.1 |
BW.kg. | 45.90 | 49.5 |
BMI | 18.90 | 25.2 |
OP.time..minutes. | 180.00 | 360.0 |
Blood.Loss..ml. | 500.00 | 1300.0 |
Depth.of.invasion.mm. | 0.42 | 0.9 |
Total.LN | 0.00 | 0.0 |
Total.dose..cGy. | 540.00 | 3780.0 |
No..Fraction | 3.00 | 21.0 |
AgeAtDiagnosis | 47.00 | 77.0 |
LymphNodeInvasion | 0.00 | 1.0 |
wait4surgery | 7.00 | 12.0 |
R.Tperiod | 50.00 | 52.0 |
wait4R.T | 32.00 | 45.0 |
wait4C.T | 37.00 | 43.0 |
0.2 Fit Univariate Cox Model
【本段簡述】
將目前的兩種切割方式分別進行univariate cox model fitting,接著比較兩種切割方式和原本未切割時的Cox Model在Log Rank Test之結果,每個變數皆取三者中結果中「達顯著水準p-value = 0.05」且「最為顯著」的方式,並依據結果重新建立新的dataset,以進行Full Model Selection。
0.2.1 Univariate Cox Model for Cutted Continuous Variable
0.2.1.1 Model for Optimal Equal-HR Method
依據p-value顯著程度升冪排序,以p-value = 0.05作為顯著水準,發現兩個顯著Biomarkers與八個顯著的Covariates。
0.2.1.1.1 Biomarker
test | df | pvalue | |
---|---|---|---|
PDL1.CD274..H.Score.T. | 10.38 | 2 | 0.01 |
HPV18.E6..H.Score.T. | 7.98 | 2 | 0.02 |
HPV16.E6.H.Score.T. | 2.35 | 2 | 0.31 |
SCC | 0.60 | 1 | 0.44 |
UBE2C..H.Score.T. | 0.44 | 1 | 0.51 |
0.2.1.1.2 Covariate
test | df | pvalue | |
---|---|---|---|
LymphNodeInvasion | 37.96 | 2 | 0.00 |
No..Fraction | 20.50 | 2 | 0.00 |
R.Tperiod | 14.25 | 2 | 0.00 |
BMI | 11.95 | 2 | 0.00 |
wait4R.T | 11.03 | 2 | 0.00 |
OP.time..minutes. | 10.93 | 2 | 0.00 |
BW.kg. | 10.51 | 2 | 0.01 |
Total.LN | 5.02 | 1 | 0.02 |
wait4surgery | 0.75 | 1 | 0.39 |
Depth.of.invasion.mm. | 0.53 | 1 | 0.47 |
Blood.Loss..ml. | 0.51 | 1 | 0.48 |
0.2.1.2 Model for Hiearchical Bayes Model
0.2.1.2.1 Biomarker
test | df | pvalue | |
---|---|---|---|
CA125 | 18.13 | 2 | 0.00 |
ASCC2…H.Score.T. | 7.79 | 2 | 0.02 |
CEA | 3.93 | 2 | 0.14 |
HPV16.E6.H.Score.T. | 3.16 | 2 | 0.21 |
HPV18.E6..H.Score.T. | 1.76 | 2 | 0.41 |
HPV58.E6..H.Score.T. | 1.64 | 2 | 0.44 |
SCC | 0.92 | 2 | 0.63 |
CA199 | 0.85 | 2 | 0.65 |
UBE2C..H.Score.T. | 0.60 | 2 | 0.74 |
0.2.1.2.2 Covariate
test | df | pvalue | |
---|---|---|---|
LymphNodeInvasion | 46.15 | 1 | 0.00 |
BMI | 25.32 | 2 | 0.00 |
BW.kg. | 23.25 | 2 | 0.00 |
AgeAtDiagnosis | 14.04 | 2 | 0.00 |
No..Fraction | 13.43 | 2 | 0.00 |
Total.dose..cGy. | 13.10 | 2 | 0.00 |
Age | 9.73 | 2 | 0.01 |
Depth.of.invasion.mm. | 7.24 | 2 | 0.03 |
OP.time..minutes. | 6.82 | 2 | 0.03 |
wait4R.T | 6.22 | 2 | 0.04 |
BH.cm. | 4.60 | 2 | 0.10 |
wait4C.T | 3.67 | 2 | 0.16 |
wait4surgery | 0.88 | 2 | 0.64 |
Blood.Loss..ml. | 0.71 | 2 | 0.70 |
0.2.2 Compare Results of Different Univariate Cox Model
這邊我們比較三種方式——不切割(Original)、 Optimal Equal-HR Method(簡稱O.E-HR)、Hiearchical Bayes Model(簡稱H.Bayes)中有一種以上Log Rank Test結果顯著的變數,選擇三種當中最為顯著的方式。
0.2.2.1 Log Relative Hazard Plot with Two Cuts
0.2.2.1.1 Biomarker
備註:綠色虛線為兩個切點
0.2.2.1.2 Covariate
備註:綠色虛線為兩個切點
0.2.2.2 Survival Plot for Biomarkers
0.3 Full Model Selection
【本段簡述】
這邊我們想依據Univariate Cox Model中顯著的變數,進行Full Model Selection。在建立模型前,先捨棄遺失值過多的變數,以免影響模型配適,接著使用Lasso Model Selection協助篩選變數。最後,我們合併其他在univariate cox model中表現顯著的Biomarkers,希望能得到更完整的模型。
0.3.1 捨棄遺失值過多的變數
若有任何遺失值,將無法進行Model Selection的步驟和最後模型的配飾,因此我們必須考慮刪除遺失值過多的變數。
0.3.1.1 各變數遺失值數量
變數名稱 | 遺失值數量 |
---|---|
Age | 0 |
BMI | 0 |
AgeAtDiagnosis | 0 |
LymphNodeInvasion | 0 |
Earliy.stage | 0 |
Surgery.earliy.stage | 0 |
本院術式 | 0 |
RT.OP順序 | 0 |
有無C.T | 0 |
有無緩和 | 0 |
BW.kg. | 1 |
FIGO_stage | 1 |
c.stage | 4 |
PDL1.CD274..H.Score.T. | 12 |
HPV18.E6..H.Score.T. | 12 |
ASCC2…H.Score.T. | 12 |
Depth.of.invasion.mm. | 74 |
R.Tperiod | 84 |
Total.dose..cGy. | 92 |
No..Fraction | 95 |
wait4R.T | 95 |
OP.time..minutes. | 106 |
Total.LN | 126 |
CA125 | 134 |
Family.history | 158 |
0.3.1.2 使用變數的數量與可使用資料數量的關係圖
下圖的x軸表示從上表編號1的變項開始累加所使用的變數,若x = 3表示從編號1的Age使用到編號3的AgeAtDiagnosis。
參考下圖,可以發現資料從第1個變數使用到第16個變數(ASCC2…H.Score.T.)的情況下,仍可使用208個資料,但從使用到第17個變數開始,資料量會急劇下降至不到150個資料,因此我們考慮先使用前面17個變項,也就是從Age至ASCC2…H.Score.T.的變項,進行Full Model Selection。
0.3.2 Lasso Model Selection
選定要進行變數篩選的16個變數後,我們使用R packageglmnet
中的cv.fit
進行lasso正則化Cox Model。參數考量上,判斷模型好壞的lambda我們選擇使用「Partial Likelihood Deviance」,而cross validation我們則選擇10-fold cv,最後參考使用lasso模型中lambda最小的模型。
0.3.2.1 Cross Validated Error Plot
0.3.2.2 Coefficients with Least Lambda in the Model
## [1] "LymphNodeInvasion" "Surgery.earliy.stage" "BW.kg."
## [4] "c.stage" "PDL1.CD274..H.Score.T."
0.3.3 Full Cox Model
最後,我們在模型中合併其他在univariate cox model中顯著的Biomarkers,希望能得到更完整的模型。
0.3.3.1 Coeficients
lower..95 | upper..95 | coef | exp.coef. | se.coef. | z | Pr…z.. | |
---|---|---|---|---|---|---|---|
AgeAtDiagnosis2 | 0.50 | 2.01 | 0.00 | 1.00 | 0.36 | 0.00 | 1.00 |
AgeAtDiagnosis3 | 0.85 | 6.03 | 0.82 | 2.27 | 0.50 | 1.64 | 0.10 |
LymphNodeInvasion3 | 1.36 | 5.37 | 0.99 | 2.70 | 0.35 | 2.83 | 0.00 |
Surgery.earliy.stage2 | 0.72 | 2.30 | 0.25 | 1.29 | 0.30 | 0.84 | 0.40 |
有無緩和y | 0.50 | 4.24 | 0.38 | 1.46 | 0.54 | 0.70 | 0.48 |
BW.kg.2 | 0.43 | 2.17 | -0.04 | 0.96 | 0.42 | -0.10 | 0.92 |
BW.kg.3 | 0.30 | 0.93 | -0.65 | 0.52 | 0.29 | -2.22 | 0.03 |
c.stage1 | 0.21 | 5.03 | 0.02 | 1.02 | 0.81 | 0.02 | 0.98 |
c.stage2 | 0.57 | 13.09 | 1.01 | 2.74 | 0.80 | 1.26 | 0.21 |
c.stage3 | 0.34 | 7.25 | 0.45 | 1.57 | 0.78 | 0.57 | 0.57 |
c.stage4 | 1.31 | 32.03 | 1.87 | 6.48 | 0.82 | 2.29 | 0.02 |
PDL1.CD274..H.Score.T.2 | 0.05 | 0.65 | -1.75 | 0.17 | 0.67 | -2.60 | 0.01 |
PDL1.CD274..H.Score.T.3 | 0.08 | 1.84 | -0.93 | 0.39 | 0.79 | -1.19 | 0.24 |
HPV18.E6..H.Score.T.2 | 0.58 | 25.32 | 1.34 | 3.83 | 0.96 | 1.40 | 0.16 |
HPV18.E6..H.Score.T.3 | 0.86 | 40.57 | 1.78 | 5.92 | 0.98 | 1.81 | 0.07 |
ASCC2…H.Score.T.2 | 1.08 | 12.73 | 1.31 | 3.70 | 0.63 | 2.08 | 0.04 |
ASCC2…H.Score.T.3 | 0.55 | 8.56 | 0.77 | 2.16 | 0.70 | 1.10 | 0.27 |
0.3.3.2 Log Rank Test
## test df pvalue
## 105.49 17.00 0.00
0.4 Association Analysis Between Variables and Cell Type
【本段簡述】
根據資料新增變數Cell Type後,每個Covariate和Biomarker皆與Cell Type做關聯分析,其中連續型變項選擇Kolmogorov-Smirnov Testks.test
,觀察在不同Cell Type的狀況下,各變項的分配是否有所差異,而類別型變項則選用Pearson’s chi-squared testchisq.test
比較。
0.4.1 新增變數:細胞型態 Cell Type
根據final.pathology這個covariate,新增covariate「Cell Type」,依據字串中是否有squamous/adenocarcinoma,將資料分成squamous、adenocarcinoma,若皆無則歸類為other type,共三個組別。 分組後進行associate analysis,判斷資料在不同Cell Type的狀況下,是否會影響其他covariates和biomarkers的分布狀況。
0.4.1.1 Distribution of Cell Type
從資料分配可以發現大部分的患者為squamous,為adenocarcinoma的三倍之多。
(備註:後面主要關注squamous和adenocarcinoma兩組的差異,沒有將other type併入分析)
0.4.2 Biomarker與Cell Type關聯分析
0.4.2.1 Kolmogorov-Smirnov Tests
從下表可以發現,顯著水準p-value = 0.05的狀況下,僅有HPV18.E6..H.Score.T.與Cell Type的關聯較為顯著。biomarker | D | p_value |
---|---|---|
HPV18.E6..H.Score.T. | 0.28 | 0.01 |
HPV18.E6.percentage.T. | 0.20 | 0.12 |
CA125 | 0.21 | 0.31 |
HPV58.E6..H.Score.T. | 0.16 | 0.35 |
CEA | 0.16 | 0.35 |
ASCC2.Percentage.T. | 0.15 | 0.44 |
SCC | 0.14 | 0.56 |
UBE2C..H.Score.T. | 0.13 | 0.61 |
HPV16.E6.H.Score.T. | 0.13 | 0.61 |
CA199 | 0.20 | 0.66 |
PDL1.CD274..H.Percentage.T. | 0.12 | 0.67 |
PDL1.CD274..H.Score.T. | 0.12 | 0.74 |
HPV58.E6..H.Percentage.T. | 0.10 | 0.87 |
ASCC2…H.Score.T. | 0.09 | 0.92 |
UBE2C..H.Percentage.T. | 0.09 | 0.94 |
HPV16.E6.percentage.T. | 0.09 | 0.95 |
0.4.2.2 Pearson’s chi-squared test
顯著水準p-value = 0.05的狀況下,,PDL1.CD274..H.Staining.intensity.T.和ASCC2.Staining.intensity.T.與Cell Type的關聯顯著。biomarker | X_square | p_value |
---|---|---|
PDL1.CD274..H.Staining.intensity.T. | 25.83 | 0.01 |
ASCC2.Staining.intensity.T. | 19.73 | 0.03 |
HPV58.E6..H.Staining.intensity.T. | 13.91 | 0.08 |
HPV18.E5..100 | 3.58 | 0.17 |
UBE1C…100 | 3.53 | 0.17 |
HPV16.E6.Staining.intensity.T. | 10.35 | 0.24 |
UBE2C..H.Staining.intensity.T. | 11.24 | 0.51 |
HPV16.E5.100 | 1.04 | 0.59 |
UBE1C…200 | 0.65 | 0.72 |
HPV18.E6.Staining.intensity.T. | 6.19 | 0.80 |
HPV58.E5…100 | 0.05 | 0.97 |
0.4.3 Covariate與Cell Type關聯分析
0.4.3.1 Kolmogorov-Smirnov Tests
將下表結果以p-value升冪排列,以p-value = 0.05作為顯著水準,可以發現AgeAtDiagnosis、BH.cm.、Age三個Covariates在不同Cell Type的狀況下,分佈有顯著差異。
covariate | D | p_value |
---|---|---|
AgeAtDiagnosis | 0.24 | 0.03 |
BH.cm. | 0.24 | 0.03 |
Age | 0.23 | 0.04 |
OP.time..minutes. | 0.24 | 0.15 |
No..Fraction | 0.25 | 0.17 |
wait4surgery | 0.20 | 0.26 |
R.Tperiod | 0.20 | 0.32 |
wait4C.T | 0.29 | 0.34 |
Depth.of.invasion.mm. | 0.17 | 0.41 |
Total.dose..cGy. | 0.18 | 0.52 |
BMI | 0.12 | 0.66 |
Blood.Loss..ml. | 0.14 | 0.83 |
wait4R.T | 0.10 | 0.99 |
BW.kg. | 0.07 | 0.99 |
Total.LN | 0.07 | 1.00 |
LymphNodeInvasion | 0.04 | 1.00 |
0.4.3.2 Pearson’s chi-squared test
將下表結果以p-value升冪排列,以p-value = 0.05作為顯著水準,可以發現Cell.type.12.type.、組織類型、grade、A、Other.disease、Endocervix.involvement在不同Cell Type下的分配有顯著差異。
covariate | X_square | p_value |
---|---|---|
Cell.type.12.type. | 410.49 | 0.00 |
組織類型 | 391.37 | 0.00 |
grade | 132.27 | 0.00 |
A | 31.71 | 0.00 |
Other.disease | 11.11 | 0.00 |
Endocervix.involvement | 10.91 | 0.03 |
Total.dose..cGy. | 116.88 | 0.06 |
G | 35.81 | 0.06 |
Menopause | 5.45 | 0.07 |
有無C.T | 4.99 | 0.08 |
Age | 134.69 | 0.09 |
Myoma | 4.63 | 0.10 |
癌症順序 | 7.67 | 0.10 |
LVSI | 4.51 | 0.11 |
Chemotherapy | 4.19 | 0.12 |
BH.cm. | 158.93 | 0.13 |
Washing.Cytology | 3.75 | 0.15 |
No..Fraction | 57.67 | 0.16 |
wait4C.T | 118.41 | 0.19 |
本院術式 | 24.38 | 0.23 |
Vaginal.involvement | 5.24 | 0.26 |
Depth.of.invasion.mm. | 215.72 | 0.27 |
Family.history | 2.43 | 0.30 |
BW.kg. | 313.57 | 0.31 |
para.aortic | 49.08 | 0.35 |
Blood.Loss..ml. | 75.42 | 0.37 |
P | 16.88 | 0.39 |
Hysterectomy | 14.51 | 0.41 |
Earliy.stage | 1.60 | 0.45 |
c.stage | 7.77 | 0.46 |
wait4surgery | 101.78 | 0.49 |
Cervix.involvement | 1.36 | 0.51 |
LymphNodeInvasion | 28.85 | 0.53 |
wait4R.T | 123.05 | 0.56 |
Para.aortic.lymphadectomy | 1.14 | 0.56 |
BMI | 251.34 | 0.57 |
FIGO_stage | 6.62 | 0.58 |
Surgery.earliy.stage | 1.06 | 0.59 |
原發部位 | 1.06 | 0.59 |
Radiotherapy | 0.89 | 0.64 |
DM | 0.75 | 0.69 |
AgeAtDiagnosis | 103.72 | 0.70 |
Salpingo.oophorectomy | 3.78 | 0.71 |
OP.time..minutes. | 41.82 | 0.72 |
有無neoadjuvant | 0.62 | 0.74 |
R.Tperiod | 78.18 | 0.81 |
外院術式 | 0.39 | 0.82 |
有無緩和 | 0.39 | 0.82 |
H.T | 0.30 | 0.86 |
Recurrence | 1.26 | 0.87 |
Pelvic.lymphadectomy | 1.91 | 0.93 |
有無R.T | 0.06 | 0.97 |
緩和方式 | 2.22 | 0.97 |
RT.OP順序 | 3.05 | 0.98 |
Total.LN | 22.22 | 0.98 |
Metastasis | 3.25 | 0.99 |
0.5 Association Analysis Between Cutted Variables and Cell Type
【本段簡述】
對於切割後與生存有顯著關係的變數,我們也嘗試觀察在不同Cell Type的狀況下,用Pearson’s chi-squared testchisq.test
比較各變項的分配是否有所差異。
初步做完chisq.test
後,發現所有變數皆與Cell Type無顯著關係。
0.5.1 Biomarker與Cell Type關聯分析
cutted_biomarker | X_square | p_value |
---|---|---|
PDL1.CD274..H.Score.T. | 7.03 | 0.13 |
HPV18.E6..H.Score.T. | 6.17 | 0.19 |
ASCC2…H.Score.T. | 4.49 | 0.34 |
CA125 | 3.55 | 0.47 |
0.5.2 Covariate與Cell Type關聯分析
cutted_covariate | X_square | p_value |
---|---|---|
有無C.T | 4.99 | 0.08 |
Age | 7.17 | 0.13 |
BMI | 6.91 | 0.14 |
Depth.of.invasion.mm. | 5.85 | 0.21 |
本院術式 | 24.38 | 0.23 |
AgeAtDiagnosis | 5.09 | 0.28 |
No..Fraction | 4.98 | 0.29 |
Family.history | 2.43 | 0.30 |
R.Tperiod | 4.43 | 0.35 |
Total.LN | 2.06 | 0.36 |
Earliy.stage | 1.60 | 0.45 |
c.stage | 7.77 | 0.46 |
OP.time..minutes. | 3.04 | 0.55 |
FIGO_stage | 6.62 | 0.58 |
Surgery.earliy.stage | 1.06 | 0.59 |
wait4R.T | 2.49 | 0.65 |
Total.dose..cGy. | 2.05 | 0.73 |
有無緩和 | 0.39 | 0.82 |
LymphNodeInvasion | 0.19 | 0.91 |
BW.kg. | 0.72 | 0.95 |
RT.OP順序 | 3.05 | 0.98 |
0.6 Full Model Selection for data with different cell type
【本段簡述】
我們希望能依據不同細胞型態分別找到適合用來預測存活狀況的model,在此我們先將資料分成squamous和adenocarcinoma兩組,同樣先依照遺失值數量,和篩選Full Model一樣,選擇從Age開始至ASCC2…H.Score.T.等16個變項來做Model Selection,Model Selection也同樣使用lasso配飾出適合的模型。
0.6.1 Full Model Selection for Adenocarcinoma data
0.6.1.1 Coeficients
lower..95 | upper..95 | coef | exp.coef. | se.coef. | z | Pr…z.. | |
---|---|---|---|---|---|---|---|
BW.kg.2 | 0.45 | 19.01 | 1.08 | 2.93 | 0.95 | 1.13 | 0.26 |
BW.kg.3 | 0.07 | 1.42 | -1.18 | 0.31 | 0.78 | -1.51 | 0.13 |
FIGO_stage1 | 0.03 | 1.75 | -1.41 | 0.24 | 1.01 | -1.41 | 0.16 |
FIGO_stage2 | 0.46 | 26.46 | 1.25 | 3.48 | 1.04 | 1.20 | 0.23 |
FIGO_stage3 | 0.60 | 165.29 | 2.30 | 9.99 | 1.43 | 1.61 | 0.11 |
FIGO_stage4 | NA | NA | NA | NA | 0.00 | NA | NA |
PDL1.CD274..H.Score.T.2 | 0.01 | 0.32 | -2.99 | 0.05 | 0.95 | -3.15 | 0.00 |
PDL1.CD274..H.Score.T.3 | NA | NA | NA | NA | 0.00 | NA | NA |
0.6.1.2 Log Rank Test
## test df pvalue
## 33.32 6.00 0.00
0.6.2 Full Model Selection for Squamous data
針對squamous data另外使用lasso配飾出新的資料,參考lasso的結果後,可以看到最後的Final Model如下:
0.6.2.1 Coeficients
lower..95 | upper..95 | coef | exp.coef. | se.coef. | z | Pr…z.. | |
---|---|---|---|---|---|---|---|
BMI2 | 0.19 | 0.96 | -0.86 | 0.42 | 0.42 | -2.06 | 0.04 |
BMI3 | 0.09 | 0.62 | -1.42 | 0.24 | 0.48 | -2.94 | 0.00 |
AgeAtDiagnosis2 | 0.67 | 7.87 | 0.83 | 2.30 | 0.63 | 1.33 | 0.18 |
AgeAtDiagnosis3 | 1.01 | 18.36 | 1.46 | 4.31 | 0.74 | 1.98 | 0.05 |
LymphNodeInvasion3 | 1.16 | 6.28 | 0.99 | 2.70 | 0.43 | 2.32 | 0.02 |
Surgery.earliy.stage2 | 0.79 | 2.94 | 0.42 | 1.53 | 0.34 | 1.26 | 0.21 |
c.stage1 | 0.16 | 4.96 | -0.11 | 0.89 | 0.88 | -0.13 | 0.90 |
c.stage2 | 0.36 | 9.29 | 0.60 | 1.83 | 0.83 | 0.73 | 0.47 |
c.stage3 | 0.29 | 6.76 | 0.35 | 1.41 | 0.80 | 0.43 | 0.67 |
c.stage4 | 1.20 | 29.17 | 1.78 | 5.92 | 0.81 | 2.19 | 0.03 |
0.6.2.2 Log Rank Test
## test df pvalue
## 78.55 10.00 0.00
0.7 Biomarker-Score
【本段簡述】
我們希望以類似 Protein-Score 的計算方式,用Biomarker的線性組合,計算出每一個病例的 Biomarker-Score,並分析Biomarker-Score與存活狀態的關聯是否顯著。
步驟如下: 1. 將所有「Biomarker」個別和前面的「Full Cox Model中所使用的Covariates」Fit出Cox Model, 2. 計算每個病例的Biomarker-Score,計算方式我們分成兩種:
Biomarker-Score:
Biomarker Score = β1 × PDL1.CD274 + β2 × HPV18.E6 + β3 × ASCC2
Absolute Biomarker-Score:
Absolute Biomarker Score = |β1|×PDL1.CD274 + |β2|×HPV18.E6 + |β3|×ASCC2
- 用 Cox Model 觀察兩種 Biomarker-Score 與存活狀態是否相關。
0.7.1 Biomarker-Score Calculation
計算後共有13種不同的Biomarker-Score出現,Distribution如下:
病例的Biomarker-Score大多集中在-0.64 ,而其組成公式如下:
β1 × PDL1.CD274 + β2 × HPV18.E6 + β3 × ASCC2 = ( − 1.03)×2 + ( − 0.49)×2 + 1.2 × 2 = −0.64
0.7.2 Cox Model of Biomarker-Score
用 Cox Model 檢定Biomarker-Score與存活狀態的關係,「結果顯著」。lower..95 | upper..95 | coef | exp.coef. | se.coef. | z | Pr…z.. | |
---|---|---|---|---|---|---|---|
BiomarkerScore | 1.37 | 2.3 | 0.57 | 1.77 | 0.13 | 4.32 | 0 |
0.7.3 Absolute Biomarker-Score Calculation
絕對值版本計算的Biomarker-Score中,病例的 score 明顯集中在 5.43,而其組成的公式為:
|β1|×PDL1.CD274 + |β2|×HPV18.E6 + |β3|×ASCC2 = (1.03)×2 + (0.49)×2 + 1.2 × 2 = 5.43
0.7.4 Cox Model of Absolute Biomarker-Score
用 Cox Model 檢定 Absolute Biomarker-Score 與存活狀態的關係,結果並「沒有顯著」。lower..95 | upper..95 | coef | exp.coef. | se.coef. | z | Pr…z.. | |
---|---|---|---|---|---|---|---|
BiomarkerScore_abs | 0.74 | 1.18 | -0.07 | 0.93 | 0.12 | -0.58 | 0.56 |
0.8 Biomarker-Score based on Each Cell Type
【本段簡述】
除了對整個 Data進行 Biomarker-Score 的計算,我們也使用前面針對不同 cell type 的 data 篩選過的 Cox Model ,個別計算 Adenocarcinoma data 和 Squamous data 的 Biomarker-Score ,並同樣觀察Biomarker-Score與存活狀態是否相關。
0.8.1 Adenocarcinoma Data
從結果觀察,可以發現在 Adenocarcinoma 的細胞型態下, Biomarker-Score 與存活狀態的關聯並沒有顯著相關。
0.8.1.1 Original Biomarker-Score for Adenocarcinoma
從圖表可以發現多數病例的Biomarker-Score為0.19,組成公式如下:
β1 × PDL1.CD274 + β2 × HPV18.E6 + β3 × ASCC2 = ( − 1.3)×2 + 0.45 × 2 + 0.95 × 2 = 0.19
0.8.1.2 Cox Model of Biomarker-Score for Adenocarcinoma
Adenocarcinoma data 中 , Biomarker-Score 與存活狀態並「沒有顯著關聯」。lower..95 | upper..95 | coef | exp.coef. | se.coef. | z | Pr…z.. | |
---|---|---|---|---|---|---|---|
BiomarkerScore | 0.97 | 2.7 | 0.48 | 1.62 | 0.26 | 1.84 | 0.07 |
0.8.1.3 Absolute Biomarker-Score for Adenocarcinoma
病例的 score 多集中在5.4,組成公式如下:
|β1|×PDL1.CD274 + |β2|×HPV18.E6 + |β3|×ASCC2 = 1.3 × 2 + 0.45 × 2 + 0.95 × 2 = 5.4
0.8.1.4 Cox Model of Absolute Biomarker-Score for Adenocarcinoma
依據Cox Model的結果發現Adencarcinoma data中Absolute Biomarker-Score與存活狀態的關聯「沒有顯著關聯」。lower..95 | upper..95 | coef | exp.coef. | se.coef. | z | Pr…z.. | |
---|---|---|---|---|---|---|---|
BiomarkerScore_abs | 0.52 | 1.16 | -0.26 | 0.77 | 0.21 | -1.24 | 0.22 |
0.8.2 Squamous Data
從結果觀察,發現在 Squamous 的細胞型態下, Biomarker-Score 與存活狀態的關係是顯著相關的。
0.8.2.1 Original Biomarker-Score for Squamous
病例的 score 大多集中在-1.27,公式如下:
β1 × PDL1.CD274 + β2 × HPV18.E6 + β3 × ASCC2 = ( − 1.08)×2 + ( − 0.7)×2 + 1.14 × 2 = −1.27
0.8.2.2 Cox Model of Biomarker-Score for Squamous
依據Cox Model的結果發現Squamous data中Biomarker-Score與存活狀態的關聯「有顯著關聯」。lower..95 | upper..95 | coef | exp.coef. | se.coef. | z | Pr…z.. | |
---|---|---|---|---|---|---|---|
BiomarkerScore | 1.23 | 2.24 | 0.51 | 1.66 | 0.15 | 3.34 | 0 |
0.8.2.3 Absolute Biomarker-Score for Squamous
病例多集中在5.84這個值,而其組成公式為:
|β1|×PDL1.CD274 + |β2|×HPV18.E6 + |β3|×ASCC2 = 1.08 × 2 + 0.7 × 2 + 1.14 × 2 = 5.84
0.8.2.4 Cox Model of Absolute Biomarker-Score for Squamous
依據Cox Model的結果發現Squamous data中Absolute Biomarker-Score與存活狀態的關聯「沒有顯著關聯」。lower..95 | upper..95 | coef | exp.coef. | se.coef. | z | Pr…z.. | |
---|---|---|---|---|---|---|---|
BiomarkerScore_abs | 0.7 | 1.21 | -0.08 | 0.92 | 0.14 | -0.6 | 0.55 |