Künstliche Intelligenz

KI in Facharztprüfung durchgefallen

Kann Künstliche Intelligenz den Fach(tier-)arzt bei der Interpretation von Röntgenbildern ersetzen? Ein aktueller Test zeigt: So weit ist die Technik noch nicht.

Im Jahr 2016 sagte George Hinten, Gewinner des Turing-Award – einer Art Nobelpreis der Informatik: „Wir sollten jetzt aufhören, Radiologen auszubilden. Es ist völlig offensichtlich, dass Künstliche Intelligenz in fünf Jahren den Radiologen überlegen sein wird.“ Fünf Jahre sind inzwischen vergangen und britische Forschende haben die mutige These in einer Studie überprüft: Eine Künstliche Intelligenz (KI) trat gegen 26 Radiologen aus der Humanmedizin an, welche kürzlich die Abschlussprüfung der Facharztausbildung (Fellowship des Royal College of Radiologists, FRCR) bestanden hatten. Die KI war den Fachärzten allerdings nicht überlegen und hätte die Prüfung nicht bestanden.

Prüfungstag: KI gegen junge Radiologen

Teil des FRCR Examens ist ein Stresstest, in dem die Kandidaten 30 Röntgenaufnahmen innerhalb von 35 Minuten beurteilen müssen. Die Bilder stammen von allen Körperteilen und zeigen sowohl Routineprobleme als auch komplexe Pathologien. 90 % Richtige sind nötig, um den Test zu bestehen. Diese Prüfung wurde in der Studie nachgestellt. Der KI-Kandidat war das Tool Smarturgencys (Milvue, Frankreich), das sich bereits seit 2020 auf dem Markt befindet und in zehn europäischen Kliniken eingesetzt wird. Es kann sowohl muskuloskelettale Röntgenbilder als auch Thoraxaufnahmen beurteilen und hatte ein umfangreiches Training mit 600.000 Röntgenaufnahmen hinter sich. 

KI interpretiert Röntgenbilder erstaunlich gut

Die KI hätte keines der zehn nachgestellten Examen bestanden. Aber angesichts der Komplexität der Bilder und der wilden Mischung von Fällen waren die KI-Interpretationen erstaunlich akkurat. Wurden für die KI nicht interpretierbare Bilder z.B. vom Schädel oder Abdomen ausgeklammert, hätte Smarturgencys immerhin zwei Examen bestanden und damit drei der menschlichen Radiologen übertroffen. In einer der nachgestellten Prüfungen erreichte die KI die meisten Punkte und sogar bei Bildern, welche die meisten Radiologen falsch interpretierten, lag die KI-Trefferquote bei über 50 Prozent. Gerade auf Bildern von Händen und Füßen ist häufig eine Vielzahl von Knochen und Gelenken dargestellt, was menschliche Betrachter langwierig und ermüdend finden können – für die KI aber überhaupt kein Problem ist. Interessanterweise hatten die meisten Radiologen mit einem noch besseren Abschneiden der KI gerechnet, was in Zukunft dazu führen könnte, dass medizinisches Personal zu sehr auf den künstlichen Kollegen vertraut.

Kein Ersatz für menschliche Radiologen

Der Stresstest zeigte: Um mit menschlichen Radiologen mithalten zu können, braucht die KI zusätzliches Training – zum einen zu den bisher nicht interpretierbaren Aufnahmen, zum anderen zu besonders subtilen Veränderungen.  Mit dem entsprechenden Training und in ihrem häufig eng umgrenzten Einsatzgebiet, kann eine KI Fachärzten sicherlich Arbeit abnehmen – ersetzen wird sie sie zumindest vorerst noch nicht.

Zum vollständigen Artikel: hier