Der entwickelte „LLM-Anonymizer“ identifiziert und entfernt personenbezogene Daten aus klinischen Texten – direkt auf lokalem Rechner, ohne Cloud-Dienste oder Programmierkenntnisse.
Für die Studie wurden 250 reale Klinikbriefe analysiert. Das Tool erreichte mit dem Modell Llama-3 70B eine Redaktionsgenauigkeit von über 99 Prozent bei gleichzeitig sehr geringer Fehlerquote.
Im Vergleich zu etablierten Tools wie CliniDeID oder Microsoft Presidio zeigte der LLM-Anonymizer eine überlegene Sensitivität bei der Erkennung personenbezogener Informationen – ein entscheidender Vorteil für die sichere Nutzung klinischer Routinedaten in der Forschung.