RecoMed - LT

Transcription

RecoMed - LT
RecoMed
Automatic speech recognition with medical
transcription
Subventionné par
Idiap Research Institute
●
Independent research institute
○
○
●
~10 development staff
Research themes: “Human & Media Computing”
○
○
○
○
○
●
~100 people in total; mainly in research
Speech processing
Biometrics
Social signal processing
Machine learning
...
Technology transfer
○
via TheArk & IdeArk incubator
Definition of medical transcription
■
Wikipedia:
Medical transcription, also known as MT, is an allied health profession,
which deals in the process of transcription, or converting voicerecorded reports as dictated by physicians or other healthcare
professionals, into text format.
3
Transcription process at Suva
■
■
Delay between patient outing and discharge letter is too long
Hard constraint: 21 days
4
Existing medical ASR solutions
http://www.capterra.com/medical-transcription-software
Federal Act on Data Protection
■
https://www.admin.ch/opc/en/classifiedcompilation/19920153/index.html
■
Personal data
All information relating to an identified or identifiable person
■
Sensitive personal data
Data related to religion, health, social security measures, administrative
or criminal proceedings or sanctions
Distribution of personal data is severely restricted.
6
Project goal and objectives
■
Goal
Integration of an Automatic Speech Recognition (ASR) system in the
computerized patient record of the Clinique Romande de Réadaptation
(CRR)
■
Objectives
●
●
●
Transition from analog to digital dictaphones (CRR)
Development of a dedicated, robust ASR system (Idiap)
Integration of the ASR system in the new patient record workflow
7
Data
■
Background data
●
●
■
BDLex
Domain data
●
●
■
Bref 120 (~100 hours)
Suva anonymised medical transcripts (~100 Mio of words)
Suva anonymised audio recordings (~16 hours)
Anonymisation
●
●
Names, ages diseases all removed
Sentences from a given doctor randomised
8
Acoustic modeling
■
■
■
State of the art modeling techniques
Acoustic robustness with unsupervised adaptation
Kaldi toolkit
●
Kaldi is probably the most important tool in the chain
9
Language modeling
■
Multiple medical domains:
Ambulatory, Neurology, Rehabilitation, Evaluation, Paramedical
■
Punctuation modeling
… les personnes ayant une insuffisance respiratoire
chronique ouvrez la parenthèse par exemple
bronchite chronique virgule asthme virgule
emphysème virgule fibrose pulmonaire fermez la
parenthèse … selon les objectifs suivants deux
points à la ligne tiret bilan physiothérapeutique
complet ...
10
Text format: raw asr text
la physiothérapie et une composants importante de la rééducation
pulmonaire chez les personnes ayant une insuffisance respiratoire
chronique ouvrez la parenthèse par exemple bronchite chronique
virgule asthme virgule emphysème virgule fibrose pulmonaire
fermez la parenthèse … selon les objectifs suivants deux points à la
ligne tiret bilan physiothérapeutique complet ouvrez la parenthèse
inclus test de marche de six minutes virgule echelle de bureau
Text format: formatted text
La physiothérapie et une composants importante de la rééducation pulmonaire chez les
personnes ayant une insuffisance respiratoire chronique (p.ex. bronchite chronique, asthme,
emphysème, fibrose pulmonaire) ... les objectifs suivants :
- bilan physiothérapeutique complet (inclus test de marche de 6 mn, echelle de bureau des,
fonctions pulmonaires).
- évaluation individuel des besoins du patient, de ses capacités respiratoires fonctionel.
- éducation thérapeutique du patient pour mieux gérer sa vie avec maladie chronique.
- ménage bronchiques.
- réentraînement progressif à l'effort.
- accompagnement thérapeutique à l'arrêt du tabac.
- rapport de fin de traitement adressée au médecin prescripteur.
- le programme de réhabilitation et conçu de manière individualisé adapté à votre personne, à
votre âge, et retour condition physique.
Notre programme de réhabilitation respiratoire pluridisciplinaire à l'hôpital de la tour et sous
direction médicale responsable et reconnue par la société suisse de pneumologie, remboursée
par l'assurance maladie de base.
Conclusions
●
Medical transcription requires customisation
○
○
●
Language models to domain
The customisation is in conflict with data privacy
○
○
●
Acoustic models to medical practitioners
Speech specialists are not in hospitals
State borders are important
Toolkits such as Kaldi are invaluable