Analyse de Survie

Révision express P1 · Tutorat Niçois 2025-2026

⭐ Ce qui tombe le plus souvent en exam
H24 Probabilité conditionnelle de survie — formulée avec "sachant qu'on a survécu"
H24 Lire et interpréter S(t) directement depuis un tableau
H24 Différence actuarielle (N=V-C/2) vs Kaplan-Meier (N=V-C)
FREQ Médiane de survie — plus petite valeur t telle que S(t) < 0,50
FREQ Censure — qui est censuré, pourquoi, quand
FREQ Date de point vs date d'origine vs date des dernières nouvelles
FREQ Test du log-rank — Qc > 3,84 → différence significative
🚨 4 pièges H24
Piège n°1

Confondre S(t) et probabilité conditionnelle

"Survivre encore 3 ans après avoir survécu 2 ans" ≠ S(3)

S(2+3) / S(2) = S(5) / S(2)
Dès que tu vois "sachant que" ou "encore X ans" → formule conditionnelle !
Piège n°2

Confondre survie et mortalité

S(t) = 0,439 → taux de survie = 43,9%
Taux de mortalité = 1 − 0,439 = 56,1%

Ne jamais lire S(t) comme un taux de mortalité !
Piège n°3

Médiane = la valeur de t, pas 0,50 !

La médiane est une durée (jours, mois...) pas une probabilité.
Si S(14) = 0,50 et S(22) = 0,43 → médiane = 22, pas 14 !

0,50 = seuil. Médiane = premier t où S(t) passe STRICTEMENT sous 0,50
Piège n°4

Identifier la méthode par l'effectif ?

FAUX ! Regarde toujours la formule dans le tableau :
N = V−C/2 → actuarielle
N = V−C → Kaplan-Meier

>200 patients = recommandation, pas obligation !
🎯 Les 3 calculs à maîtriser absolument

💜 Prob. conditionnelle

S(t) / S(τ)
ExVivant à 2 ans, survivre jusqu'à 5 ans = S(5)/S(2) = 0,20/0,60 = 0,33

🟡 N actuarielle

N = V − C/2
ExV=80, C=10 → N=75 → survie inst. = (75−D)/75

🔴 Log-rank

Qc = (D−E)²/E
SeuilQc > 3,84 → différence significative au risque 5%
📖 Tout le cours — définitions essentielles
Définition

Cohorte incipiente

Patients inclus au début de leur affection, à un point uniforme de l'évolution de leur maladie (cas incidents). ≠ cohorte historique où la date d'origine est antérieure à l'inclusion.

Définition

Date d'origine

Date de début de la surveillance pour chaque patient (ex : date de diagnostic, date de randomisation). Peut être différente pour chaque patient.

Définition

Date de point

Date calendaire fixe choisie pour faire le bilan. Au-delà, les informations ne sont plus prises en compte. = date d'analyse = date de fin d'étude. Identique pour tous les patients.

"On analyse les données le..." ou "l'étude s'arrête le..." → c'est la date de point
Définition

Date des dernières nouvelles

Date la plus récente avec des infos sur le patient :
• Patient décédé → date du décès
• Perdu de vue → date de perte de vue
• Vivant à la date de point → date de point

Définition

Temps de participation

Durée de surveillance = délai entre date d'origine et date des dernières nouvelles.

  • Patient décédé → date d'origine → date du décès
  • Vivant à la date de point → date d'origine → date de point
  • Perdu de vue → date d'origine → date de perte de vue
Définition

Temps de recul

Délai entre la date d'origine et la date de point = durée max potentielle de suivi. Toujours ≥ temps de participation.

Temps de recul ≠ temps de participation !
Définition

Censure

L'événement d'intérêt n'a pas été observé. Concerne :

  • Sujets perdus de vue
  • Sujets vivants à la date de point (exclus-vivants)
Ces deux mécanismes sont de nature DIFFÉRENTE !
Définition

Fonction de survie S(t)

S(t) = P(T > t) = probabilité que l'événement survienne après le délai t.

S(t) = 1 − F(t)

S(t) est décroissante, S(0) = 1. Courbe en marches d'escalier (KM) ou segments obliques (actuarielle).

Définition

Médiane de survie

Plus petite valeur de t telle que S(t) < 0,50 (strictement). Préférée à la moyenne (censures). Si S(t) reste ≥ 0,50 → médiane impossible à estimer.

S(t) = 0,50 exactement → PAS encore la médiane !
Définition

Facteur pronostique

Associé à l'évolution de la maladie chez des patients déjà malades. ≠ facteur de risque (survenue de la maladie dans une population saine).

Analyse de survie → toujours facteur pronostique
Méthode

Analyse actuarielle

  • Intervalles fixés a priori, égaux
  • N = V − C/2
  • Grands échantillons (>200)
  • Courbe : segments obliques
  • Non paramétrique
Méthode

Kaplan-Meier

  • Intervalles définis par les instants d'événements → inégaux
  • N = V − C
  • Petits effectifs — méthode de choix
  • Courbe : marches d'escalier
  • Non paramétrique
🧮 Toutes les formules

💜 Fonction de survie — définition

S(t) = P(T > t) = 1 − F(t)
LectureS(2 ans) = 0,60 → 60% survivants à 2 ans → taux de mortalité cumulée = 40%

🟢 Probabilité conditionnelle — survivre encore

S(t | τ) = S(t) / S(τ) avec τ < t
Quand ?"Sachant qu'on a survécu τ ans, probabilité de survivre encore jusqu'à t"
Ex 1Vivant à 2 ans, survivre jusqu'à 5 ans : S(5)/S(2) = 0,20/0,60 = 0,33
Ex 2Vivant à 1 an, survivre encore 3 ans de plus : S(1+3)/S(1) = S(4)/S(1)
"Encore X ans" → additionne : t = τ+X  |  "Jusqu'à t ans" → t reste t

🔴 Probabilité conditionnelle — décéder entre τ et t

P(décès entre τ et t | vivant à τ) = 1 − S(t)/S(τ)
= [S(τ) − S(t)] / S(τ)
ExVivant à 2 ans, décéder avant 5 ans : [S(2)−S(5)]/S(2) = (0,60−0,20)/0,60 = 0,67

🟡 Actuarielle — calcul de N et survie instantanée

N = V − C/2     Survie inst. = (N−D)/N
ExV=80, C=10, D=8 → N=75 → survie inst. = 67/75 = 0,893
N peut être décimal si C est impair (ex : C=5 → C/2=2,5 → c'est normal !)

🔵 Kaplan-Meier — calcul de N et survie instantanée

N = V − C     Survie inst. = (N−D)/N
ExV=30, C=3, D=2 → N=27 → survie inst. = 25/27 = 0,926

🔗 Survie cumulée S(t) — commune aux deux méthodes

S(t) = S(t−1) × survie instantanée(t)
= produit de TOUTES les survies instantanées depuis t=0
ExS(6 mois)=0,900 ; survie inst. à 12 mois=0,893 → S(12 mois) = 0,900×0,893 = 0,804
S(t) ne peut que rester stable ou diminuer → jamais augmenter !

⚡ Test du log-rank

Qc = (DA−EA)²/EA + (DB−EB)²/EB

Qc > 3,84 → p < 0,05 → différence significative
DA < EAMoins de décès observés qu'attendus dans A → survie meilleure dans le groupe A
Si Qc est DANS [0;3,84] → on NE conclut PAS à une différence. C'est quand Qc DÉPASSE 3,84 !
📋 Récapitulatif — quelle formule selon l'énoncé ?
Je lis dans l'énoncé...J'utilise...Formule
"probabilité de survivre à t ans"S(t) directementS(t)
"sachant qu'on a survécu τ ans" + survivre jusqu'à tCond. survivreS(t) / S(τ)
"encore X ans après avoir survécu τ ans"Cond. survivreS(τ+X) / S(τ)
"décéder entre τ et t sachant vivant à τ"Cond. décéder1 − S(t)/S(τ)
Tableau avec N = V − C/2ActuarielleN = V − C/2
Tableau avec N = V − CKaplan-MeierN = V − C
"comparer deux groupes"Log-rank(D−E)²/E
✏️ Réflexes mathématiques à avoir

➗ Diviser deux décimaux — S(t)/S(τ)

1Identifie numérateur (haut) et dénominateur (bas)
2Multiplie les deux par 100 pour enlever les virgules : 0,40/0,60 → 40/60
3Simplifie : 40/60 = 4/6 = 2/3 ≈ 0,667
Le résultat d'une probabilité conditionnelle est toujours entre 0 et 1. Si tu obtiens >1 → tu t'es trompé de sens !

✖️ Multiplier des décimaux — survie cumulée

1S(t) = S(t−1) × survie instantanée
2Astuce : 0,900 × 0,893 → pense à 9/10 × 893/1000 = 8037/10000 = 0,804
3Ou : 0,9 × 0,893 = 0,9 × 0,9 − 0,9 × 0,007 = 0,81 − 0,0063 = 0,804
S(t) cumulée ne peut que diminuer → si ton résultat > S(t−1) → erreur !

➖ Calculer N = V − C/2 sans erreur

1Divise C par 2 d'abord
2Si C est impair → C/2 est décimal : C=5 → C/2=2,5c'est normal !
3Ex : V=80, C=5 → N = 80 − 2,5 = 77,5 → survie = (77,5−8)/77,5 = 69,5/77,5 = 0,897
N peut être décimal en actuarielle → ne pas arrondir !

📐 Calculer le chi² du log-rank étape par étape

1Calcule (DA − EA)² puis divise par EA
2Calcule (DB − EB)² puis divise par EB
3Additionne les deux résultats → Qc
4Ex : DA=15, EA=22, DB=29, EB=22
Qc = (15−22)²/22 + (29−22)²/22 = 49/22 + 49/22 = 2,23 + 2,23 = 4,45
54,45 > 3,84 → différence significative. DA < EA → survie meilleure dans A ✓
Vérification : DA + DB doit égaler EA + EB (= nb total de décès observés)

📅 Calculer une durée entre deux dates

1Temps de participation = date des dernières nouvelles − date d'origine
2Temps de recul = date de point − date d'origine
3Ex : Inclus le 1er avril 2020, perdu de vue le 1er janvier 2022, date de point 1er juillet 2022
→ Participation = avr.2020→jan.2022 = 21 mois
→ Recul = avr.2020→juil.2022 = 27 mois
Compte les mois sur les doigts ! Avr→jan = 9 mois + 12 mois (2020→2021→2022) = 21 mois

🎯 Lire S(t) — réflexes immédiats

S(t) = 0,75 → 75% survivants à t → 25% décédés (= 1−0,75)
S(t) passe de 0,90 à 0,75 → prob. de décéder dans l'intervalle = 0,90 − 0,75 = 0,15
Médiane → cherche premier t où S(t) passe strictement sous 0,50
S(t) reste toujours ≥ 0,50 → médiane impossible à estimer
🌳 Arbre de décision
❓ Quelle est ma question ?
↙         ↓         ↘
📊 Survie brute à t ?
S(t) directement
🔀 "Sachant qu'on a survécu" ?
↙    ↘
Survivre encore
S(t) / S(τ)
Décéder entre
1 − S(t)/S(τ)
⚖️ Comparer 2 groupes ?
Log-rank : (D−E)²/E
↓ (si tableau à remplir)
N = V − C/2 dans le tableau
Méthode actuarielle
N = V − C dans le tableau
Kaplan-Meier
🔑 Mots-clés déclencheurs
Signal → formule conditionnelle

Mots qui déclenchent S(t)/S(τ)

  • "sachant qu'on a déjà survécu"
  • "sachant qu'on est vivant à"
  • "vivre encore X ans après"
  • "ayant déjà survécu τ ans"
Dès que tu vois un de ces mots → formule conditionnelle obligatoire !
Signal → lecture directe

Mots qui indiquent S(t) direct

  • "probabilité de survivre à t ans"
  • "proportion de survivants à t"
  • "% patients encore malades à t jours"
  • "S(t) = ..." → lire directement
🃏 Flashcards — clique pour retourner

Clique sur une carte pour révéler la réponse.

🎯 Quiz — entraîne-toi !
⚠️ Les 10 pièges classiques
Piège n°1

S(t) vs probabilité conditionnelle

"Survivre 3 ans encore sachant vivant à 2 ans" ≠ S(3)

FAUX : S(3) = 0,40
VRAI : S(5)/S(2) = 0,20/0,60 = 0,33
"encore" = additionne. "jusqu'à" = t reste t.
Piège n°2

Survie vs mortalité

S(24 mois) = 0,439 → taux de SURVIE
Taux de mortalité = 1 − 0,439 = 56,1%

S(t) = survivants, pas décédés !
Piège n°3

Médiane = 0,50 ou valeur de t ?

S(14)=0,50 ; S(20)=0,50 ; S(27)=0,43 → médiane = 27, pas 14 ni 20 !

0,50 = seuil. Médiane = premier t STRICTEMENT sous 0,50.
Piège n°4

Survie instantanée vs cumulée

Survie inst. à 16 mois = 0,906 ≠ S(16 mois)
S(16) = produit de TOUTES les survies inst. = 0,564

0,906 = un seul intervalle. S(t) = depuis t=0.
Piège n°5

N = V au lieu de N = V−C/2

FAUX : N=80 → 72/80=0,900
VRAI : N=75 → 67/75=0,893
Piège n°6

Log-rank : dans l'intervalle = différence ?

Qc dans [0;3,84] → on NE conclut PAS.
Qc > 3,84 → on conclut à une différence.

C'est quand Qc DÉPASSE 3,84, pas quand il est dedans !
Piège n°7

Censuré = perdu de vue seulement ?

FAUX ! Censuré = :
• Perdu de vue
• Vivant à la date de point

Deux mécanismes de NATURE DIFFÉRENTE.
Piège n°8

>200 patients = actuarielle obligatoire ?

FAUX ! C'est la formule de N qui détermine la méthode, pas l'effectif seul.

N=V−C/2 → actuarielle  |  N=V−C → KM
Piège n°9

Comparer répondeurs vs non-répondeurs

Guarantee-time bias ! Les patients doivent survivre assez longtemps pour avoir la possibilité de répondre.

Méthode à proscrire ! Comparer groupe traité vs non traité.
Piège n°10

KM = méthode paramétrique ?

FAUX ! Les deux méthodes (actuarielle ET KM) sont non paramétriques → aucune hypothèse sur la distribution.