Dental reports: when AI finally automates your reporting

Clinical documentation — including radiological reports, consultation notes and co...

Clinical context and challenges of AI in dental documentation

Clinical documentation — including radiological reports, consultation notes and referral letters — is essential to the continuity of care and interprofessional communication. However, this task represents a considerable administrative burden, contributing significantly to practitioner burnout. While artificial intelligence (AI), driven by natural language processing (NLP) and large language models (LLMs), offers prospects for the automated synthesis of complex data, its practical application in dentistry remains poorly structured in the scientific literature.

Objectives and scope of the review

This scoping review aimed to rigorously map the technological developments related to the automated generation of dental reports. The authors analysed the studies published between January 2015 and March 2026 in the Embase, MEDLINE, and IEEE Xplore databases. The main objective was to characterise the types of AI employed, the input modalities (images, texts, voice), and the clinical contexts of use, while identifying the methodological gaps hindering their adoption.

Research questions and assessment criteria

The study did not test a single clinical hypothesis but sought to answer four questions: which technologies are currently deployed, in which specific clinical settings do they operate, how does their actual performance compare to human reports, and what scientific barriers remain? The review focused on the ability of these systems to produce structured, readable and clinically valid documents from heterogeneous data.

Study design

This scoping review was conducted according to the PRISMA-ScR (Preferred Reporting Items for Systematic Reviews and Meta-Analyses Extension for Scoping Reviews) protocol. The authors synthesised data from the scientific literature to map the applications of artificial intelligence in the generation of dental reports.

Data search and selection

A systematic search was conducted across three main databases: Embase, MEDLINE via Ovid and IEEE Xplore. The period covered extends from January 2015 to March 2026. Out of a total of 1,265 identified records, 7 studies meeting the inclusion criteria were selected for the final analysis.

Inclusion criteria and PCC framework

The PCC (Population-Concept-Context) framework defined the selection parameters:

Population: Reports intended for healthcare professionals (dentists, radiologists) and patients.
Concept: Automated generation systems for dental documentation (radiological reports, clinical notes, referral letters).
Context: Routine dental clinical practice.

Les études exclues étaient celles limitées au diagnostic pur (détection de caries ou perte osseuse) sans fonction de rédaction narrative.

Analyse et évaluation de la performance

Les 7 études incluses se répartissent comme suit : 6 concernent la génération de rapports radiologiques à partir de panoramiques dentaires et une porte sur les examens cliniques via transcription vocale. L'évaluation de la performance des modèles (incluant des variantes GPT et des LLM affinés) a reposé sur plusieurs méthodes :

Mesures de similarité textuelle : ROUGE, BLEU et BERTScore.
Validité clinique : Analyse des hallucinations, validité structurelle, latence de réponse et longueur de l'output.
Évaluations humaines : Questionnaires patients sur la clarté et notations cliniques par des praticiens.

Synthèse des données et performances des systèmes d'IA

Cette revue de portée (scoping review) a initialement identifié 1 265 enregistrements. Après filtrage, seuls 7 articles publiés entre 2015 et 2026 ont été inclus dans l'analyse finale, illustrant le caractère émergent de cette technologie en médecine dentaire. La répartition thématique des études est la suivante :

Radiologie (6 études sur 7) : Focalisation sur la génération automatisée de rapports à partir de radiographies panoramiques.
Examen clinique (1 étude sur 7) : Génération de rapports à partir de la transcription vocale des données de charting.

Les auteurs rapportent que les modèles basés sur le traitement du langage naturel (NLP), notamment les variantes de GPT et des modèles de langage de grande taille (LLM) spécifiquement affinés, ont été utilisés pour produire les documents finaux. Bien que l'hétérogénéité des données empêche une méta-analyse statistique, les résultats compilés mettent en évidence plusieurs indicateurs de performance clés :

Domaine d'évaluation	Observations rapportées par la revue
Précision clinique	Précision élevée pour l'identification des observations courantes.
Lisibilité	Indices de lisibilité comparables aux rapports rédigés par des praticiens humains.
Perception patient	Les versions simplifiées par l'IA ont significativement amélioré la clarté perçue par les patients.
Métriques techniques	Utilisation systématique des scores ROUGE, BLEU et BERTScore pour valider la structure linguistique.

Sur le plan qualitatif, la synthèse souligne que l'IA parvient à structurer des données hétérogènes en rapports cohérents, adaptés aussi bien aux professionnels qu'aux patients. Cependant, les auteurs notent une variabilité importante dans les méthodes d'évaluation (latence de réponse, longueur de sortie, analyse des hallucinations), ce qui limite la comparaison directe entre les systèmes. Aucune p-value globale n'est rapportée en raison de la nature descriptive de cette revue de portée, mais la validité structurelle des rapports générés est systématiquement soulignée comme un point fort des modèles récents.

Une synthèse des avancées technologiques en documentation clinique

La charge administrative en cabinet dentaire représente une part croissante du temps de travail, au détriment du soin direct. Cette revue de portée (scoping review), couvrant la période de janvier 2015 à mars 2026, a cartographié l'utilisation de l'intelligence artificielle (IA) pour l'automatisation des comptes rendus cliniques et radiologiques. Sur 1 265 enregistrements identifiés, 7 études ont été rigoureusement sélectionnées pour analyser les performances des modèles de traitement du langage naturel (NLP) et des grands modèles de langage (LLM).

La majorité des travaux (6 études sur 7) se concentre sur la génération automatisée de rapports radiologiques à partir de clichés panoramiques. Une étude s'est distinguée par l'utilisation de la transcription vocale pour générer des comptes rendus d'examens cliniques. Les technologies employées reposent principalement sur des variantes de GPT et des LLM affinés (fine-tuned) pour le contexte médical, permettant de transformer des données brutes (images ou voix) en documents structurés et cohérents.

Performances et applicabilité clinique des modèles

Les résultats de cette revue soulignent que les rapports générés par l'IA affichent une précision élevée pour les observations courantes. La lisibilité de ces documents est jugée comparable à celle des rapports rédigés par des praticiens humains. Point intéressant pour la relation patient-praticien : les versions simplifiées par l'IA ont obtenu une meilleure évaluation de la part des patients en termes de clarté, suggérant un rôle clé de l'IA dans la médiation de l'information thérapeutique.

L'évaluation de ces systèmes repose sur une batterie d'indicateurs techniques (ROUGE, BLEU, BERTScore) mais aussi cliniques, incluant l'analyse des hallucinations (erreurs factuelles générées par le modèle), la latence de réponse et la validité structurelle. Malgré ces performances encourageantes, les auteurs notent une forte hétérogénéité dans les types de rapports, les ensembles de données utilisés et les langues traitées, ce qui limite encore la comparaison directe entre les solutions.

Discussion : entre gain d'efficience et limites actuelles

L'analyse clinique des résultats montre que l'IA n'est plus seulement un outil de diagnostic (détection de caries ou de perte osseuse), mais devient un véritable assistant de communication. Cliniquement, cela signifie une réduction potentielle drastique du temps passé à la rédaction des courriers de correspondance ou des comptes rendus opératoires. L'étude révèle toutefois des limites structurelles : le faible nombre de publications parues (7 études) souligne que nous sommes encore à l'aube de cette technologie dans le secteur dentaire.

La comparaison avec les données existantes suggère que, si l'interopérabilité des systèmes reste faible, le potentiel de transfert vers la pratique quotidienne est réel via des solutions émergentes (comme DentScribe ou Yalha). Les principaux défis identifiés par les auteurs résident dans le risque d'hallucinations et la nécessité de cadres d'évaluation standardisés. Pour le praticien, l'enjeu n'est pas de déléguer totalement la rédaction, mais d'utiliser l'IA pour pré-structurer l'information, garantissant ainsi des dossiers complets et lisibles tout en luttant contre l'épuisement professionnel lié aux tâches administratives.

Conclusion

Cette revue confirme que les systèmes d'IA sont capables de produire des rapports dentaires de haute qualité à partir d'entrées diverses. Cependant, une validation sur des cohortes multilingues plus larges et une analyse approfondie de la compréhension réelle par les patients sont indispensables avant une intégration généralisée.

Synthèse de l’étude

Cette revue systématique, couvrant la période 2015-2026, a analysé sept études sur l'automatisation des rapports dentaires par l'IA. Six d'entre elles se concentrent sur la génération de comptes rendus radiographiques (panoramiques) et une sur la transcription vocale des examens cliniques. Les modèles de langage (LLM et variantes GPT) affichent une précision élevée et une lisibilité équivalente à celle des praticiens, tout en optimisant la clarté des documents remis aux patients.

Concrètement, pour le praticien :

Déléguez la rédaction technique : L'IA peut désormais structurer vos rapports radiographiques et notes cliniques de manière cohérente, réduisant ainsi le temps administratif passé devant l'ordinateur entre deux patients.
Simplifiez la communication patient : Utilisez les outils de reformulation assistés par IA pour transformer vos diagnostics complexes en lettres d'information vulgarisées, ce qui améliore significativement la compréhension et l'acceptation du plan de traitement.
Pratiquez une relecture critique : Bien que les scores de précision (ROUGE, BLEU) soient excellents, une vérification humaine reste indispensable pour détecter d'éventuelles "hallucinations" ou erreurs de transcription avant l'intégration définitive au dossier médical.

Lexique technique de l'étude

NLP (Natural Language Processing) : Domaine de l'intelligence artificielle focalisé sur le traitement du langage naturel, permettant ici l'extraction et l'organisation de récits cliniques à partir de dossiers de santé non structurés pour la synthèse de rapports.

LLM (Large Language Model) : Modèles de langage à large échelle, tels que les variantes GPT, capables de transformer des données hétérogènes (images, texte) en narrations cliniques cohérentes et structurées.

Analyse d'hallucination (Hallucination analysis) : Critère d'évaluation de la fiabilité de l'IA mesurant sa propension à générer des informations cliniques erronées ou inexistantes, un enjeu critique pour la sécurité des rapports radiologiques.

ROUGE / BLEU / BERTScore : Métriques statistiques de performance utilisées pour quantifier la qualité linguistique et la précision sémantique des rapports générés par l'IA en les comparant à des rapports de référence rédigés par des experts.

IA Multimodale : Systèmes capables d'intégrer et de traiter simultanément plusieurs types de données d'entrée (imagerie panoramique, notes textuelles et dossiers informatisés) pour produire une documentation clinique exhaustive.

PRISMA-ScR : Cadre méthodologique spécifique aux revues de portée (scoping reviews), utilisé ici pour assurer la transparence et la rigueur de la synthèse des 7 études sélectionnées parmi 1 265 enregistrements.

Source

Titre original : Artificial intelligence applications in automated dental report generation – a scoping review
Auteurs : Madeline Yon, Ethan Ng, Michael M. Bornstein
Publication : Frontiers in Oral Health - 2026-06-02
DOI : https://doi.org/10.3389/froh.2026.1817718

Information destinée aux professionnels de santé. Ce contenu peut comporter des erreurs ou des résumés tronqués. Nous recommandons de toujours vérifier avec l'article source original. Delynov se décharge de toute responsabilité quant à l'utilisation de ces informations. Ce document n'est pas destiné aux patients ni au grand public.

Root Canal Sealing: When AI Predicts Bioceramic Success

Predicting clinical success in endodontic treatments traditionally relies on the analysis of...