KI in der Logopädie Die Masterarbeit von Walter Trückl

Willkommen zur Entdeckungsreise!

Erkunden Sie die faszinierende Welt der Künstlichen Intelligenz in der Logopädie.

Eine Entwicklungsarbeit realer Anwendungen für reale Herausforderungen.

I. Start der Entdeckungsreise: Die Vision hinter der Arbeit

Herzlich Willkommen!

Diese interaktive Präsentation lädt Sie ein, die zentralen Erkenntnisse einer Masterarbeit zu erkunden, die sich mit dem faszinierenden und zukunftsweisenden Thema der Large Language Modelle (LLMs) in der logopädischen Tätigkeit auseinandersetzt. Begleiten Sie mich, Walter Trückl, auf einer spannenden Reise in die Welt der Künstlichen Intelligenz in der Logopädie – eine Reise, die zeigt, wie Technologie und Therapie Hand in Hand gehen können, um die Patient:innenversorgung potenziell zu revolutionieren.

Die Motivation hinter dieser Arbeit entspringt der Beobachtung einer rasanten Entwicklung in den Bereichen künstlicher Intelligenz (KI) und maschinellen Lernens, insbesondere im Bereich von LLMs wie ChatGPT. Diese Technologien besitzen das Potenzial, die Landschaft unterschiedlichster Lebens- und Arbeitsbereiche grundlegend zu verändern. Auch im Gesundheitswesen eröffnen sich hierdurch neue Möglichkeiten für Diagnose, Therapie und die Interaktion mit Patient:innen.

B. Der rote Faden: Die Symbiose aus therapeutischer Erfahrung und technischer Expertise

Ein zentrales Anliegen dieser Masterarbeit und dieser interaktiven Darstellung ist es, die Verbindung von gesundheitsberuflicher Erfahrung mit technischer Expertise als durchgängiges Leitmotiv – als "roten Faden" – zu verdeutlichen. Diese Arbeit ist mehr als nur eine technische Studie; sie ist das Ergebnis einer tiefen Verbindung zwischen dem Verständnis für therapeutische Bedürfnisse und der Faszination für technologische Möglichkeiten. Der gewählte interdisziplinäre Ansatz des Masterstudiengangs "Health Assisting Engineering" an der FH Campus Wien bildet hierfür die ideale Grundlage.

Die Verknüpfung von technologischem Know-how mit klinischer Expertise ist entscheidend, um sicherzustellen, dass entwickelte Anwendungen sowohl technisch robust als auch klinisch relevant sind. Meine persönliche Erfahrung in beiden Domänen ermöglichte eine authentischere und praxisnähere Problemdefinition und Lösungsfindung. Es geht darum, nicht nur die Ergebnisse zu präsentieren, sondern auch den Prozess dieser interdisziplinären Synthese als wertvoll und wegweisend darzustellen.

C. Was erwartet Sie auf dieser Reise? (Interaktive Mindmap)

Diese interaktive Reise führt Sie durch die Schlüsselaspekte der Masterarbeit. Die folgende Mindmap dient als Navigationshilfe und lädt Sie ein, die verschiedenen Bereiche in Ihrem eigenen Tempo zu erkunden:

Masterarbeit:
LLMs in der Logopädie
Die Welt der Sprachmodelle
Im Dialog mit Expert:innen (HCD)
Von der Idee zur Anwendung
Erkenntnisse & Ausblick
Interaktive Elemente & Service
Der rote Faden: Therapie & Technik

Klicken Sie auf einen Knoten, um direkt zum entsprechenden Abschnitt zu springen.

II. Die Welt der Sprachmodelle: LLMs und KI einfach erklärt

Die Begriffe Künstliche Intelligenz (KI) und Large Language Modelle (LLMs) sind in aller Munde, doch was verbirgt sich genau dahinter? Dieser Abschnitt bietet eine verständliche Einführung in die Grundlagen.

A. Das ABC der KI: Was sind LLMs und KI?

Künstliche Intelligenz (KI) ist ein weitgefasster Begriff aus der Informatik. Vereinfacht gesagt, zielt KI darauf ab, Systeme zu entwickeln, die Aufgaben ausführen können, die typischerweise menschliche Intelligenz erfordern. Dazu gehören Lernen, Problemlösen, Wahrnehmung und Sprachverständnis. Man könnte KI als eine Art "digitales Gehirn" betrachten.

Innerhalb der KI gibt es Teilbereiche wie Maschinelles Lernen (ML) und Deep Learning (DL). Large Language Modelle (LLMs)LLMs sind eine spezifische Anwendung von Deep Learning im Bereich der natürlichen Sprachverarbeitung (NLP). Sie sind darauf ausgelegt, menschliche Sprache zu interpretieren, zu generieren und zu manipulieren. sind die "Sprachexpert:innen" des digitalen Gehirns, trainiert mit riesigen Textmengen, um semantische Muster zu erfassen.

B. Ein Blick hinter die Kulissen: Wie funktionieren LLMs?

1. Der Transformer – Das Herzstück

Das Transformer-Modell (Vaswani et al., 2017) ist die Grundlage moderner LLMs. Es nutzt Mechanismen wie "Self-Attention", um Kontexte in Texten effizient zu verstehen. Es besteht aus Encodern (Eingabeverarbeitung) und Decodern (Ausgabegenerierung).

2. Tokenisierung – Sprache in Zahlen

Text wird in kleinere Einheiten, sogenannte TokensTokens können einzelne Wörter, Wortteile oder Zeichen sein. GPT-3 wandelt ein Wort in ca. 1,2 Tokens um., zerlegt. Dies ist ein fundamentaler Schritt, um Sprache für Maschinen verständlich zu machen.

3. Vektorisierung – Bedeutung im Raum

Tokens werden in numerische Vektoren umgewandelt. Diese Vektoren repräsentieren semantische Eigenschaften, wodurch LLMs Bedeutungsähnlichkeiten erkennen können (z.B. liegen "Onkel" und "Tante" im Vektorraum ähnlich zueinander wie "männlich" und "weiblich").

4. Training – Wie LLMs lernen

LLMs lernen durch Pretraining (mit riesigen Textmengen, um allgemeine Sprachmuster zu erfassen) und FinetuningAnpassung des Modells an spezifische Aufgaben oder Domänen mit kleineren, spezialisierten Datensätzen. (Anpassung an spezifische Aufgaben oder Domänen).

5. Prompt Engineering – Die Kunst der richtigen Frage

Prompt EngineeringDie Gestaltung präziser Anweisungen (Prompts), um LLMs zu steuern und gewünschte Ausgaben zu erhalten. ist der Prozess, LLMs durch präzise Anweisungen (Prompts) zu steuern. Die Qualität der Ausgabe hängt stark vom Prompt ab. Die Prototypen dieser Arbeit nutzen spezifische Prompts.

C. Chancen und Grenzen: LLMs in der Therapie

LLMs bieten enorme Chancen: Textgenerierung, Übersetzung, Zusammenfassung, Wissensabruf. Die Fähigkeit zum "Few-Shot" oder "Zero-Shot Learning" ermöglicht schnelle Anpassung an neue Aufgaben.

Aber es gibt auch Grenzen: LLMs haben kein echtes Verständnis. Risiken sind "Halluzinationen"Generierung plausibel klingender, aber falscher Informationen. Ein großes Risiko im Gesundheitswesen. (falsche Infos), "Bias"Widerspiegelung von Verzerrungen aus Trainingsdaten, was zu unfairer Darstellung führen kann. (Verzerrungen) und das "Black-Box-Phänomen"Undurchsichtigkeit der Entscheidungsprozesse, was Nachvollziehbarkeit erschwert. (Intransparenz). Eine kritische Betrachtung ist essenziell. Eine Fokusgruppen-Teilnehmer:in sagte treffend: "Es ist essenziell, dass wir die Kontrolle über die Technik behalten und nicht umgekehrt."

III. Im Dialog mit Expert:innen: Der Human-Centered-Design-Ansatz

Die Entwicklung neuer Technologien im Gesundheitswesen erfordert einen Ansatz, der den Menschen in den Mittelpunkt stellt. Nur so kann sichergestellt werden, dass Innovationen den Bedürfnissen der Anwender:innen gerecht werden.

A. Warum ein menschzentrierter Ansatz?

Technologie muss dem Menschen dienen. Im sensiblen Therapiebereich ist es unerlässlich, dass neue Werkzeuge die Arbeit der Therapeut:innen unterstützen. Der Human-Centered-Design-Ansatz (HCD)Ein Entwicklungsansatz, der die Bedürfnisse, Wünsche und Einschränkungen der Endnutzer:innen in den Mittelpunkt stellt. wurde gewählt, um Bedürfnisse, Erwartungen und Bedenken von Logopäd:innen systematisch zu erfassen und in die Prototypenentwicklung einfließen zu lassen.

B. Die Methodik der Masterarbeit

Die Arbeit verfolgte einen dreisäuligen Mixed-Methods-Ansatz. Die folgende Grafik visualisiert den iterativen Forschungsprozess:

1. Literaturrecherche
2. Qualitative Daten (Fokusgruppen & Feedback)
3. Prototypenentwicklung & Iteration

Erkenntnisse aus Literatur und Fokusgruppen flossen in die Prototypenentwicklung ein, und Nutzer:innenfeedback führte zu Anpassungen.

C. Stimmen aus der Praxis: Erkenntnisse aus den Fokusgruppen

Die Interviews mit fünf Logopäd:innen lieferten wertvolle Einblicke. Hier einige Schlüsselthemen und Zitate:

"Ich glaube, es wäre äußerst vorteilhaft, wenn Berichte automatisch erstellt werden könnten. Das würde uns erheblich entlasten."

- Teilnehmer:in zur Automatisierung

"Datenschutz ist von höchster Priorität, Patient:innendaten müssen vor Diebstahl oder Missbrauch geschützt werden."

- Teilnehmer:in zum Datenschutz

"Gerade in der Logopädie ist es essenziell, dass wir direkt mit den Patient:innen arbeiten... Das ist unser Kapital und muss auch so bleiben."

- Teilnehmer:in zur Mensch-Technik-Balance

Digitale Patient:innenakten könnten die Kommunikation zwischen verschiedenen Berufsgruppen erheblich erleichtern.

- Erkenntnis zum interdisziplinären Austausch

Genannte Anwendungsfälle umfassten Therapiematerialerstellung, Informationserfassung, digitale Assistenz, Unterstützung bei Bildinterpretation (FEES), Fortbildung und Telemedizin.

D. Tabelle: Identifizierte Anwendungsfälle

Die folgende Tabelle fasst Anwendungsfälle aus Literatur und Fokusgruppen zusammen (basierend auf Tab. 2 der Masterarbeit):

Anwendungsfall Beschreibung Quelle(n) Potenzielle Vorteile

IV. Von der Idee zur Anwendung: Die Entwicklung der Prototypen

Um die Machbarkeit und den Nutzen von LLMs greifbar zu machen, wurden drei Prototypen entwickelt: BerichtGPT, LoCo (Logopädischer Co-Pilot) und Blitzstarter:in.

A. Der Weg zum Prototyp

Der Entwicklungsprozess war iterativ und nutzer:innenzentriert. Ausgewählt wurden drei Szenarien, die ein breites Spektrum logopädischer Tätigkeiten abdecken. Technologische Basis waren LLMs via OpenAI-API, anfangs mit Python, später mit Low-Code-Plattformen (Botpress) und final mit dem Open-Source-Framework LobeChatEin Open-Source-Framework zur Erstellung interaktiver Chatbot-Anwendungen mit LLMs, das in dieser Arbeit für die Prototypen genutzt wurde. für eine benutzer:innenfreundliche Oberfläche.

B. Im Scheinwerferlicht: Die Prototypen im Detail

1. BerichtGPT: Ihr:e intelligente:r Assistent:in für die Berichterstellung

Mission & Problem: Zeitaufwendige Erstellung logopädischer Berichte. BerichtGPT soll durch automatische Generierung von Behandlungsberichten aus unstrukturierten Notizen entlasten.

Lösung & Funktionsweise: Nutzt vordefinierte Vorlagen und LLM-Fähigkeiten, um aus Stichpunkten vollständige, fachlich korrekte Berichte zu erstellen (inkl. ICD-10 Codes, ICF-Orientierung).

Einblick "Denkweise" (Prompt): Anweisung an LLM: Orientierung an ICF/ICD-10, fachliche Annahmen, gendergerechte Sprache, evidenzbasierte Maßnahmen, vorgegebene Berichtsstruktur.

Stimmen der Tester:innen: Funktionalität positiv, hilfreich. Kritik: Verarbeitungsdauer, Wunsch nach besserer Anpassbarkeit. Bewertung (1-5): UX 4.0, UI 3.5, Anpassbarkeit 4.0.

2. LoCo (Logopädischer Co-Pilot): Ihr:e evidenzbasierte:r Kolleg:in

Mission & Problem: Bedarf an schnellem Zugriff auf aktuelle Fachinformationen. LoCo liefert als virtueller Assistent umfassende, evidenzbasierte Antworten.

Lösung & Funktionsweise: Trainiert auf aktuelle Studien und Best Practices. Kann Therapiepläne erstellen, Übungen erklären, Fragen zu Störungsbildern beantworten (mit österreichspezifischer Terminologie).

Einblick "Denkweise" (Prompt): Definiert als "digitale:r Assistent:in und Expert:in für Logopäd:innen in Österreich". Soll präzise, praxisorientiert, angepasst an österr. Standards antworten.

Stimmen der Tester:innen: Antworten oft "beeindruckend", "erstaunlich gut". Fähigkeit, komplexe Aufgaben zu lösen, geschätzt. Manchmal Schwierigkeiten bei einfachen Aufgaben (z.B. SMART-Ziele).

3. Blitzstarter:in: Ihre Begleiter:in in die Selbstständigkeit

Mission & Problem: Unterstützung bei administrativen und rechtlichen Fragen zur Praxisgründung.

Lösung & Funktionsweise: Hilft beim Ausfüllen von Formularen, Überblick über Behördenwege, Erstellung Praxislogo. Trainiert auf österr. Rechtsnormen (MTD-Gesetz, GBR-Eintragung). Keine Rechtsberatung.

Einblick "Denkweise" (Prompt): Positioniert als "umfassende:r Assistent:in für Logopäd:innen, die sich in Österreich selbstständig machen wollen". Liefert Schritt-für-Schritt-Anleitungen, Checklisten.

Stimmen der Tester:innen: Unterstützung als sehr nützlich eingeschätzt. Informationen zu rechtlichen Aspekten und Dokumentenerstellung genutzt.

Die iterative Anpassung der Prototypen, z.B. die Umstellung auf LobeChat für bessere Usability, ist ein Kernaspekt des Human-Centered Designs.

C. Technische Einblicke für Entdecker (Optionale Vertiefung)

Details zur LobeChat-Implementierung und Herausforderungen

LobeChat-Implementierung: Die Entscheidung für LobeChat basierte auf Benutzer:innenfreundlichkeit, Konfigurationsmöglichkeiten und LLM-Unterstützung. Implementierung auf DSGVO-konformem Server mit Docker Compose (LobeChat, PostgreSQL, NGINX, Logto). Details im Anhang 5 der Masterarbeit.

Herausforderungen: Rasche Technologieentwicklung, oft unzureichende Doku, Notwendigkeit flexibler Reaktion. Trotzdem konnten funktionale Prototypen als Evaluationsbasis entwickelt werden.

D. Grafik: Vergleich der Prototypen-Evaluationsergebnisse

Die folgende Grafik zeigt die durchschnittlichen Bewertungen der Benutzer:innenerfahrung (UX) und Benutzeroberfläche (UI) für die Prototypen BerichtGPT und LoCo (Skala 1-5). Für Blitzstarter:in gelten die Gesamtbewertungen.

Qualitatives Feedback: BerichtGPT: Zeitersparnis, gute Textqualität vs. Dauer, Anpassbarkeit. LoCo: Gute Antworten vs. Probleme bei einfachen Aufgaben. Blitzstarter:in: Nützlich für Gründung.

V. Erkenntnisse und Ausblick: Die Zukunft von LLMs in der Logopädie

Die Masterarbeit hat eine explorative Reise in das Potenzial von LLMs für die logopädische Tätigkeit unternommen. Die Ergebnisse sind vielschichtig und werfen ein Licht auf Chancen, Herausforderungen und zukünftige Entwicklungen.

A. Die Quintessenz: Zentrale Ergebnisse

Forschungsfragen: "Welche Anwendungsfälle für LLMs könnten für die logopädische Tätigkeit relevant sein?" und "Wie schätzen Logopäd:innen eine künftige Anwendbarkeit von LLMs in der Praxis ein?".

Ergebnisse: LLMs bieten signifikantes Potenzial in **Dokumentationserstellung, Therapiematerialgenerierung und Diagnostikunterstützung**. Logopäd:innen zeigten positive Einstellung, aber auch Bedenken (Datenschutz, therapeutische Beziehung). Prototypen wurden funktional positiv bewertet. Erfolgreiche Integration erfordert Berücksichtigung ethischer, rechtlicher, praktischer Aspekte und Einbindung von Logopäd:innen.

B. Potenziale entfesseln, Hürden meistern

Möglichkeiten: Effizienzsteigerung, Personalisierung, schneller Wissenszugriff. Die Frage ist "nicht ob diese Systeme zum Einsatz kommen, sondern warum nicht".

Hürden: Datenschutz, Verlässlichkeit, Bias-Vermeidung, Wahrung der menschlichen Komponente. Notwendigkeit von Aus- und Weiterbildungsprogrammen.

C. Verantwortungsvolle Innovation: Ethik & Datenschutz (FAQ)

Die Einhaltung ethischer und datenschutzrechtlicher Vorgaben ist Grundvoraussetzung. Hier einige häufige Fragen:

Wie sicher sind Patient:innendaten bei LLM-Nutzung?
Strenge DSGVO-Vorgaben müssen eingehalten werden (Datensparsamkeit, Zweckbindung, Sicherheit). Die Prototypen wurden auf DSGVO-konformen Servern entwickelt. Es ist entscheidend, dass finale Anwendungen robuste Sicherheitsmaßnahmen und transparentes Datenmanagement implementieren.
Kann ein LLM Therapeut:innen ersetzen?
Nein. Technologie sollte menschliche Interaktion ergänzen, nicht ersetzen. Die Fokusgruppen betonten die Unverzichtbarkeit des menschlichen Kontakts. LLMs sind Werkzeuge zur Unterstützung.
Was wird gegen Bias in LLMs getan?
Forschung und Entwicklung zielen darauf ab, Bias in Trainingsdaten und Algorithmen zu erkennen und zu reduzieren. Wichtig ist auch die kritische Überprüfung der LLM-Ausgaben durch Fachpersonal.
Wer haftet bei Fehlern eines LLM?
Diese komplexe Frage ist noch nicht abschließend geklärt und Gegenstand rechtlicher Diskussionen. Bei medizinischen Anwendungen liegt die Verantwortung letztlich oft beim anwendenden Fachpersonal, das die LLM-Vorschläge prüft.

D. Ein Blick in die Kristallkugel: Zukünftige Entwicklungen

Die Entwicklung von LLMs schreitet rasant voran. Vielversprechende Trends sind:

  • Multimodale SprachmodelleVerarbeitung von Text, Sprache, Bildern und Videos. (Text, Sprache, Bild, Video)
  • Integration von symbolischem Reasoning & Langzeitgedächtnis
  • Personalisierte Medizin und Therapie
  • Effizientere, lokale Modelle (z.B. auf Smartphones)
  • Erklärbare KI (XAI)Methoden zur Visualisierung und Erklärung von LLM-Entscheidungsprozessen.
  • Integration mit Robotik, IoT und Wearables

E. Der Appell: Gestalten Sie die Zukunft mit!

Die Integration von LLMs in die Logopädie steht am Anfang, birgt aber immenses Potenzial. Diese Masterarbeit legt einen Grundstein. Ein Appell an alle Beteiligten: Setzen Sie sich aktiv mit dem Thema auseinander! Eine proaktive Beschäftigung ist essenziell, um Entwicklungsprozesse mitzugestalten und die bestmögliche Versorgung zu gewährleisten. Die Balance zwischen technologischer Innovation und menschenzentrierter Versorgung ist entscheidend.

VI. Interaktive Elemente und Service-Bereich

Um die Inhalte dieser Masterarbeit zugänglich zu machen, finden Sie hier weitere interaktive Elemente und Services.

A. Interaktive Mindmap der Masterarbeit

Die interaktive Mindmap auf der Startseite visualisiert die Kernkonzepte und ermöglicht eine nicht-lineare Erkundung.

B. FAQ-Bereich

Antworten auf häufig gestellte Fragen (ergänzend zu Ethik & Datenschutz):

Was war das Hauptziel der Masterarbeit?
Das Hauptziel war die explorative Untersuchung von relevanten Anwendungsfällen für Large Language Modelle (LLMs) in der logopädischen Tätigkeit und die Einschätzung ihrer künftigen Anwendbarkeit durch Logopäd:innen.
Können die Prototypen praktisch eingesetzt werden?
Die entwickelten Anwendungen sind Prototypen und dienen der Demonstration und Evaluation im Rahmen der Masterarbeit. Sie sind nicht für den direkten klinischen Einsatz gedacht, bilden aber eine Grundlage für zukünftige Entwicklungen.
Wie können sich Logopäd:innen auf Veränderungen durch KI vorbereiten?
Durch kontinuierliche Weiterbildung, Offenheit für neue Technologien, kritische Auseinandersetzung mit Chancen und Risiken sowie aktive Teilnahme an Diskursen und Gestaltungsprozessen.

C. Glossar technischer und fachlicher Begriffe

Wichtige Begriffe sind im Fließtext mit einem TooltipBewegen Sie den Mauszeiger über unterstrichene Begriffe, um eine Kurzerklärung zu erhalten. versehen. Hier eine Auswahl:

AI (KI)Künstliche Intelligenz; Systeme, die menschenähnliche Denk- und Lernfähigkeiten simulieren.

APIApplication Programming Interface; eine Schnittstelle, die es verschiedenen Softwareprogrammen ermöglicht, miteinander zu kommunizieren.

BiasSystematische Verzerrung in Daten oder Algorithmen, die zu unfairen Ergebnissen führen kann.

Black-BoxSysteme, deren interne Funktionsweise für Außenstehende undurchsichtig ist.

DockerPlattform zur Erstellung, Bereitstellung und Ausführung von Anwendungen in Containern.

FokusgruppeQualitative Forschungsmethode: Gruppendiskussion zu einem bestimmten Thema.

HCDHuman-Centered Design; nutzer:innenzentrierter Entwicklungsansatz.

TransformerNeuronale Netzwerkarchitektur, Basis moderner LLMs, nutzt Selbstaufmerksamkeit.

D. Download-Bereich

Die vollständige Masterarbeit "Large Language Modelle (LLMs) in der logopädischen Tätigkeit: Eine explorative Studie zu ausgewählten Anwendungsfällen" steht hier zum Download bereit:

Masterarbeit herunterladen (PDF)
Audio Overview (via NotebookLM)

Der Audio Overview wurde mit NotebookLM erstellt.

E. Kontakt

Autor: Walter Trückl

Diese interaktive Webanwendung wurde erstellt, um die Ergebnisse der Masterarbeit zugänglich und erlebbar zu machen. Für Fragen oder Kooperationsanfragen können Sie über folgende E-Mail-Adresse Kontakt aufnehmen: walter(ät)trueckl.at