LARGE LANGUAGE MODELS in der Radiologie

Auf dem RSNA 2024 wurden fünf spannende Studien präsentiert,
die die Potenziale und Grenzen von KI-basierten Lösungen beleuchten.

Fünf wegweisende Studien vom RSNA 2024

Die Integration von Künstlicher Intelligenz (KI) in die Radiologie eröffnet neue Möglichkeiten, Arbeitsprozesse zu optimieren, die Patientenzufriedenheit zu erhöhen und die Qualität der Diagnostik zu verbessern. Auf dem RSNA 2024 wurden fünf spannende Studien präsentiert, die die Potenziale und Grenzen von KI-basierten Lösungen beleuchten und Hinweise darauf geben, wo die Reise für die Nutzung von Large Language Models (LLM) hingehen kann. 

Fortschritte bei Patientenkommunikation und Entscheidungsunterstützung

Die erste Studie mit dem Titel „The Impact of LLM-Model-Generated Radiology Report Summaries on Patient Comprehension: A Randomized Controlled Trial“, vorgestellt von Kayla Berigan, MD, untersuchte, ob KI-generierte Zusammenfassungen radiologischer Berichte das Verständnis bei Patienten verbessern können. Patienten wurden unterschiedlichen Berichtstypen zugeordnet, darunter unveränderte Standardberichte, von KI generierte Zusammenfassungen sowie Kombinationen aus KI- und menschlicher Bearbeitung. Die Ergebnisse zeigten, dass Kombinationen aus KI und menschlicher Überarbeitung das Verständnis signifikant verbesserten. Fast 50 % der Patienten gaben an, die Berichte besser verstanden zu haben, verglichen mit nur 22 % in der Gruppe mit Standardberichten. Kann man das also künftig der KI überlassen? Nicht ganz, denn 80 % der KI-Berichte mussten vor der Freigabe überarbeitet werden, was die Notwendigkeit weiterer Forschung zur Optimierung dieser Technologie verdeutlicht. 

Eine weitere Untersuchung wurde von Giacomo Avesani, MD, unter dem Titel „Harness GPT-4 for Clinical Decision Support: Using a LLM Model for Triaging Patients at Risk of Intravenous Contrast Reactions“ präsentiert. Sie evaluierte, wie GPT-4 bei der Risikobewertung von intravenösen Kontrastmitteln unterstützen kann. Die Forschenden hatten in 200 simulierten Szenarien die Antworten des Modells analysiert und kamen zu dem Schluss, dass 94 % der Antworten als sicher und 82 % als nützlich bewertet werden konnten. Ein vielversprechender Anfang. Dennoch gibt es Einschränkungen bei komplexeren Szenarien, die weitere Optimierung erforderlich machen, so Avesani. Insgesamt stellte die Studie heraus, dass GPT-4 vor allem bei Erstbewertungen hilfreich sein kann, jedoch nur als ergänzendes Werkzeug verstanden werden sollte. 

Optimierte Datenanalysen und Arbeitsabläufe

Michael Corbin, MD, präsentierte die Studie „LLM, the Future Replacement of Radiology Retrospective Research?“, die sich mit der Leistungsfähigkeit von GPT-4 in der automatisierten Analyse von Radiologieberichten beschäftigte. Der Fokus von Corbin und seinen Kollegen bei der Untersuchung lag auf der Diagnose thorakaler Aortenaneurysmen (TAA). GPT-4 zeigte einerseits eine beeindruckende Sensitivität von 97 %, andererseits jedoch eine deutlich geringere Spezifität von 30 %. Im Vergleich zu manuellen Analysen konnte GPT-4 dennoch 90 % der Patienten korrekt klassifizieren, während der Wert bei manuellen Methoden bei 74 % lag. Die Studie zeigte das Potenzial von GPT-4 für die retrospektive Forschung auf, machte aber auch die Notwendigkeit deutlich, extrahierte Daten zu validieren und die Prozesse weiter zu optimieren. 

Ein weiterer innovativer Ansatz wurde von Elaine Kim mit der Studie „Fine-Tuned LLM for Accurate Breast Pathology Information Extraction“ vorgestellt. Sie zeigte in ihrem Vortrag, dass feinjustierte Sprachmodelle, wie Mistral-7B-Fine-Tuned, bei der Extraktion von Daten aus Brustpathologieberichten eine erstaunlich hohe Genauigkeit aufweisen. Die Modelle erreichten eine Genauigkeit von 98,8 % bei der Gewebequelle und 95,9 % bei der Diagnosekategorie. Interessant war, dass diese feinjustierten Modelle kommerzielle Alternativen nicht nur in Sachen Effizienz, sondern auch bei den Kosten übertrafen. Gleichzeitig wies Kim darauf hin, dass die Untersuchung auch ergab, dass die Studienergebnisse nur begrenzt generalisierbar sind, weil die Daten ausschließlich von einer einzigen Institution stammten. 

Abschließend präsentierte Martin Segeroth, MD, BSc, die Studie mit dem Titel „Leveraging Fine-Tuned LLM for Automated Protocoling of CT Examinations“. Er und sein Team haben die Automatisierung der CT-Protokollierung anhand von über 120.000 CT-Datensätzen aus den Bereichen Abdomen und Kardio-Thorax analysiert. Das Ergebnis: Feinjustierte Modelle, wie BioMistral-7B, zeigen eine deutlich höhere Genauigkeit als herkömmliche neuronale Netzwerke. Bei spezifischen Untersuchungen, wie etwa „Unenhanced Kidney Stone CT“, erreichten die Modelle beeindruckende 96 % Genauigkeit. Diese Ergebnisse unterstreichen das Potenzial von LLMs, Arbeitsabläufe in der Radiologie zu standardisieren und zu optimieren. 

Perspektiven für die Radiologie der Zukunft

Die fünf vorgestellten Studien verdeutlichen eindrucksvoll die vielfältigen Möglichkeiten, die KI in der Radiologie bietet. Von verbesserter Patientenkommunikation über optimierte Datenanalysen bis hin zu automatisierten Protokollierungen reichen die Anwendungsmöglichkeiten in nahezu jeden denkbaren Bereich. Gleichzeitig wird deutlich, dass KI keine einfache und vor allem noch keine perfekte Lösung darstellt. Zunächst gilt es, noch bestehende Herausforderungen, wie Datenqualität, Validierung und technische Optimierung, zu überwinden, bevor eine flächendeckende Integration in die klinische Praxis erfolgen kann. Die auf der RSNA 2024 vorgestellten Ansätze zeigen jedoch auch sehr eindeutig auf, dass KI die Zukunft der Radiologie entscheidend mitgestalten wird. 

Autor: Miriam Mirza 

 

Weitere Beiträge zum Thema
Beliebte Beiträge