Zielsetzung
Ziel unserer Studie war es, die Inter- und Intra-Rater Variabilität zwischen manuellen und vollautomatisierten, künstlicher Intelligenz (KI)- gestützten Messungen von Lymphknoten (LK) in kontrastmittelgestützten CT-Untersuchungen des Thorax zu bewerten.
Material und Methoden
In der vorliegenden retrospektiven Studie wurde, ähnlich der klinischen Routine, der Lang- (LAD) und Kurzachsendurchmesser (SAD) von 60 vorselektierten thorakalen LK (n=30 mediastinal; n=30 axillär) in kontrastverstärkten Staging-CT-Untersuchungen gemessen. Die Auswertung erfolgte durch 13 Radiologen mit unterschiedlichem Erfahrungsstand. Um eine Bilderkennung zu vermeiden, wurden alle Messungen zweimal, mit einem Zeitabstand von drei Monaten, durchgeführt. Darüber hinaus wurde ein zuvor trainiertes neuronales Netzwerk (CNN) verwendet, um automatische 3D-LK-Segmentierungen zu erstellen und diese zur automatischen Messungen zu verwenden. Zum Auswerten der Unterschiede zwischen den Messungen wurden Friedman- und Conover-Post-hoc-Tests mit Holm-Bonferroni-Korrektur durchgeführt und der Konkordanzkorrelationskoeffizient (CCC) zwischen allen Gruppen berechnet.
Ergebnisse
Die durchschnittlichen Messungen pro LK betrugen 3-26 mm für den SAD und 4-39 mm für den LAD. Es zeigte sich eine starke Korrelation zwischen den KI-gestützten und den manuellen Messungen (CCC von 0,81 für beide Messungen für den LAD und CCC von 0,82 und 0,83 für den SAD). Es zeigten sich keine signifikanten Unterschiede zwischen den KI-gestützten und den Messungen der erfahrenen Leser für die SADs (p>.05). Die Analyse zeigte einen statistisch signifikanten Unterschied zwischen den Messungen der meisten einzelnen Lesern (p<.05).
Schlussfolgerungen
KI kann eine robuste SAD-Messung in der Thorax-CT ermöglichen, die der Messung durch erfahrene Radiologen gleichkommt. Somit könnte KI eine vollautomatisierte SAD-Messung für das Staging, Follow-up und multizentrische Studien bei Krebspatienten ermöglichen.