UniversitätsSpital Zürich: Innovative Machine-Learning-Technologien für die Kodierung

Ärzte, Administratoren und medizinische Fachkräfte des UniversitätsSpitals Zürich (USZ) haben in Zukunft einen neuen Assistenten: ein Machine Learning System, das ihnen hilft, medizinische Codes für die Abrechnungen zu vergeben.

Für das USZ, eines der grössten Spitäler der Schweiz, ist eine genaue medizinische Kodierung unerlässlich. Wird ein Patient im Krankenhaus behandelt, werden deshalb in seinem Patientendossier die Diagnosen, verschriebene Medikamente, Laborergebnisse, Therapien und Behandlungsschritte dokumentiert. Basierend auf dieser Dokumentation müssen Codes generiert werden, die die Grundlage für die Rechnungsstellung darstellen.

Glücklicherweise liegen diesen medizinischen Codes Standards zugrunde. Das wichtigste Kodiersystem für Diagnosen ist das weltweit als Standard anerkannte ICD-System (International Statistical Classification of Diseases and Related Health Problems). Es wurde von der Weltgesundheitsorganisation veröffentlicht, wird in 117 Ländern verwendet und ist in 43 Sprachen verfügbar.

Trotz der Standardisierung ist die medizinische Kodierung sehr komplex. Allein der ICD-10-Katalog umfasst mehr als 15’000 Diagnosecodes, dazu kommen weitere Systeme, die bei der Klassifikation von Behandlungen eine Rolle spielen. Ein Krankenhauspatient erhält pro Aufenthalt im USZ durchschnittlich acht Diagnosen oder Befunde, es können aber auch bis zu 100 Diagnosen pro Fall sein. Jede Diagnose und jedes Verfahren muss mit dem entsprechenden Code versehen werden, damit die Abrechnung korrekt ist. Der grösste Teil der Codes wird manuell durch speziell geschulte Arbeitskräfte erfasst.

Jedes Jahr bearbeiten die Kodierer im USZ die Behandlungsdaten von mehr als 41’000 stationären Patienten. Obwohl das Kodierteam des USZ in den letzten Jahren exzellente Arbeit verrichtet hat, passieren dabei mitunter Fehler. Auch einzelne, kleine Fehler können das Abrechnungsergebnis in der Summe stark beeinflussen: sagt Dr. Rudolf Moos, der Leiter des Datenmanagements des USZ. «Die Ansprüche an unsere Kodier- und Abrechnungsqualität sind deshalb extrem hoch.»

 

Neuer «Machine Learning Ansatz» zur Kodierunterstützung

 

Am Markt gibt es heute verschiedene Lösungsansätze, um die Codierarbeit zu unterstützen. Dies sind weitestgehend regelbasierte Systeme. Ein regelbasiertes System kann nur erfolgreich sein, wenn für jeden der mehr als 15.000 ICD-Codes entsprechende Regeln in hinreichender Qualität implementiert sind. Eine kaum lösbare Herausforderung, zumal regelbasierte Systeme auch mit unstrukturierten Daten zu kämpfen haben, genau die Art von Daten, die in vielen medizinischen Berichten enthalten sind. Zudem sind Anpassungen an regelbasierten Systemen sehr zeit- und kostenintensiv und damit sehr unflexibel.

Eine Lösung wäre, mehr menschliche Kodierspezialisten zu gewinnen. Aber gute Kodierfachkräfte gibt es kaum, sie sind hoch spezialisiert und müssen in der Regel von den Spitälern selbst ausgebildet werden. Das USZ hat mit DXC Technology deshalb einen ganz neuen Lösungsweg beschritten: Basierend auf der qualitativ hochstehenden Kodierarbeit der letzten Jahre, die digital verfügbar ist, wurde mit Hilfe von

Machine Learning ein System trainiert, das den Kodierern ICD-Codes für die Kodierung neuer Fälle vorschlägt.

Diese halbautomatisierte Lösung soll den menschlichen Aufwand bei der medizinischen Kodierung einfacher Fälle systematisch reduzieren, sodass die Kodierspezialisten mehr Zeit für die komplexen Fälle haben. Ein weiterer grosser Vorteil dieser innovativen Lösung ist, dass die Ärztinnen und Ärzte ihre Arztbriefe weiterhin frei verfassen und sie kein neues zusätzliches System mit vorgegebenen Formulierungen erlernen müssen. Die Machine-Learning-Lösung nimmt ihnen diese Arbeit ab, weil das System in der Lage ist, auch unstrukturierte Texte der Ärzte korrekt zu interpretieren.

Bisher wurde die Machine-Learning-Lösung nur für eine Revision eingesetzt, um übersehene Leistungen nachfakturieren zu können. Nach Schweizer Recht können Krankenhäuser korrigierte Rechnungen rückwirkend für mehrere Jahre einreichen. Zukünftig soll die Lösung dann zur semi-automatischen Kodierunterstützung eingesetzt werden.

Bei der Umsetzung des neuen «Machine-Learning-Ansatzes» wurde ein Lernprozess durchschritten. Nach der Entwicklung eines ersten «Machine Learning Prototyps» für 128 ICD-Codes mit sehr ermutigenden Ergebnissen, wurde ein Re-Design notwendig, damit die Lösung für eine deutlich höhere Anzahl von ICD-10-Codes genutzt werden kann. Diese Anforderung entstand, weil ein Patient jede Kombination von Diagnosen haben kann – eine Situation, die als Multilabel-Klassifikation bekannt ist. Mit einer neuen, verteilten Architektur (cluster-based) und einer anderen Programmiersprache können nun Modelle für 1.024 ICD-Codes deutlich schneller erlernt werden.

 

Intensives Training für künftige Höchstleistungen

 

Dennoch bleibt viel Arbeit übrig. Im nächsten Schritt wird die Lösung so erweitert, dass sie Modelle für 2.048 ICD-10 Codes beinhaltet, bis Ende des Jahres sind 4.096 Codes geplant. Das Ziel dabei ist, die Anzahl falscher Vorschläge weitestgehend zu eliminieren (Spezifität > 99 %), ohne dass hierunter die Vollständigkeit der korrekten Vorschläge zu sehr leidet (Sensitivität). «Die Beseitigung von Fehlern schon in der Trainingsphase ist sehr wichtig», erklärt Michael Gehbauer, der verantwortliche Analytics Key Account Manager von DXC Technolgy, «weil ein maschinelles Lernsystem sonst die Fehler lernt.»

Um die Ergebnisse weiter zu verbessern, wird das Machine-Learning-System zusätzlich zu den Arztbriefen mit weiteren, teils strukturierten Informationen versorgt, dazu gehören das Alter des Patienten, sein Geschlecht, die Aufenthaltsdauer im Spital, Operationen und Verfahren, Medikamente und Laborergebnisse. Das USZ arbeitet seit den 1990er Jahren mit elektronische Krankenakten, sodass ein hoher digitaler Reifegrad vorlag. «Diese historischen Daten werden nun verwendet, um das System zu trainieren», sagt Rudolf Moos. Mit Blick auf die Zukunft hoffen DXC und das USZ-Team, dass die Lösung schnell in das Krankenhausinformationssystem des USZ integriert werden kann.

Für das USZ war die Zusammenarbeit mit DXC entscheidend für den Erfolg. «Wir haben viele IT-Experten im Haus, aber wir brauchten einen Partner mit Big-Data-Knowhow und Machine-Learning-Kenntnissen», sagt Moos. «Der Ansatz liefert bereits jetzt Ergebnisse, die vergleichbaren Ansätzen in der Literatur hinsichtlich Qualität (Vollständigkeit und Richtigkeit) weit überlegen ist. DXC hat hierzu einen entscheidenden Teil beigetragen. Wir sind froh, einen solchen Partner für das Projekt gefunden zu haben.»