mercredi 12 novembre 2025

Intelligence artificielle
08h30 - 13h00
Salle 353
CAOS

Intelligence Artificielle (IA) en chirurgie orthopédique

  • Cliquez pour afficher le contenu
    Présentation introductive sur l’IA dans le domaine de la santé
    08h30 / 08h40
    Orateur(s) : Julien Bardou-Jacquet (Bordeaux)
  • Cliquez pour afficher le contenu
    IA en préopératoire – triage et aide à l’indication
    08h40 / 09h30
    Keynote

    Optimisation du délai de consultation de patients grâce à un algorithme IA : pourquoi et comment ? 

    • Pourquoi le triage est devenu indispensable en chirurgie orthopédique 
    • Trier et décider : Méthodes traditionnelles vs IA 
    • L’IA oui, mais pas à l’aveugle : dans les coulisses d’un développement responsable de l’IA en santé 

    Orateur(s) : Guillaume Lonjon (Montpellier), Mikaël Chelli (Nice)
    08h40 / 09h00
    Un outil d’intelligence artificielle pour améliorer l’indication chirurgicale en arthroplastie totale du genou
    Orateur(s) : Julien Lebleu (BELGIQUE)
    09h00 / 09h03
    Afficher abstract
    

    Communications orales

     

    Intelligence artificielle

    ABSTRACT N° SOFCOT25-283

    Un outil d’intelligence artificielle pour améliorer l’indication chirurgicale en arthroplastie totale du genou

     

    Julien Lebleu* 1, Corentin Pangaud2, 3, Andries Pauwels1, Philippe Vanoverschelde 4

    1moveUP, brussels, Belgium, 2Institute of Locomotion, 3Institut des sciences du mouvement, Marseille, France, 4Hip and Knee Unit, Gent, Belgium

    Introduction : L’intelligence artificielle pourrait optimiser les indications chirurgicales de prothèse totale de genou (PTG) et la prédiction des résultats postopératoires. Cette étude évalue un nouvel algorithme, basé sur l’analyse prédictive et radiographique, visant à aider les chirurgiens dans leur prise de décision.

    Material and methods : Une étude rétrospective monocentrique a inclus 222 patients atteints de gonarthrose avec une indication potentielle de PTG. Le move Up Index Score® a été calculé afin de prédire l’indication chirurgicale et les résultats postopératoires. Le critère de jugement principal était la capacité de cet indice à prédire la décision du chirurgien d’opter pour une PTG ou un traitement conservateur. Les critères secondaires comprenaient la corrélation entre l’indice et les PROMs, l’association avec des facteurs cliniques, notamment l’analyse radiographique, ainsi que la prédiction des résultats fonctionnels précoces.

    Results : Le score moyen du move UP Index® était de 69 ± 16 dans le groupe conservateur et de 52 ± 17 dans le groupe chirurgical. L’indice était modérément corrélé avec le KOOS JR (r = 0,50 ; p < 0,05). Les trois principaux facteurs cliniques associés étaient la douleur, la difficulté à la marche et la préférence du patient pour le traitement. Dans le groupe conservateur, la déviation de l’axe mécanique (MAD) moyenne était de 12,7 ± 10,3 mm et la déformation angulaire HKA de 3,0° ± 2,5°. Dans le groupe chirurgical, ces valeurs étaient respectivement de 14,8 ± 10,7 mm et 4,1° ± 3,0°. L’algorithme a également prédit les délais fonctionnels postopératoires : un retour au travail entre 6 et 8 semaines, une reprise de la conduite entre 5 et 7 semaines, et un abandon des béquilles entre 5 et 6 semaines.

    Discussion : L’algorithme proposé offre une approche plus objective pour l’évaluation de l’indication chirurgicale. La prise en compte de facteurs cliniques et radiographiques permet une segmentation plus fine des patients, notamment en intégrant la préférence du patient, qui joue un rôle clé dans la décision thérapeutique. La capacité du modèle à prédire des délais postopératoires réalistes est une avancée majeure, facilitant l’anticipation du parcours de rééducation. Toutefois, cette étude rétrospective doit être complétée par des validations prospectives pour confirmer l’efficacité du modèle en pratique clinique.

    Conclusion : Cette étude présente un nouvel outil d’intelligence artificielle améliorant la prise de décision en indication chirurgicale pour la PTG. En intégrant facteurs cliniques, radiographiques et préférences des patients, cet indice offre une approche plus personnalisée et prédit les résultats fonctionnels précoces.

    Conflits d’intérêts :

    J. Lebleu: Pas de conflit déclaré ,

    C. Pangaud: Pas de conflit déclaré ,

    A. Pauwels: Pas de conflit déclaré ,

    P. Vanoverschelde Patent or product inventor: PVO. is a co-founder of moveUP, the company developping the moveUP Index

    Évaluation de l’efficacité d'un chatbot médical pour l’admission des patients avant consultation
    Orateur(s) : Julien Lebleu (BELGIQUE)
    09h03 / 09h07
    Afficher abstract
    

    Communications orales

     

    Intelligence artificielle

    ABSTRACT N° SOFCOT25-505

    Évaluation de l’efficacité d'un chatbot médical pour l’admission des patients avant consultation

     

    Julien Lebleu* 1, sander goossens2, Quinten schietecatte2, Charles-Eric Winandy1, Philippe Vanoverschelde 3

    1moveUP, Bruxelles, 2Vesalius.ai, 3Hip and Knee Unit, Gent, Belgium

    Introduction : Cette étude empirique examine l’efficacité d'un chatbot médical conçu pour l’admission des patients avant leur consultation clinique. L’objectif principal est d’évaluer la perception des patients sur plusieurs dimensions de la communication en santé, en comparant l’utilisation du chabot aux procédures d’admission traditionnelles.

    Material and methods : Une méthodologie comparative a été employée auprès de 56 patients, répartis en deux groupes : 25 ont utilisé le chatbot pour l’admission pré-consultation, tandis que 31 ont suivi le protocole conventionnel. L’échantillon comprenait des participants de différentes tranches d’âge (9 entre 0 et 24 ans, 38 entre 25 et 49 ans, 39 entre 50 et 74 ans, et 1 de plus de 75 ans) et avec des niveaux variés d’exposition aux chatbots médicaux (46 n’ayant jamais utilisé de chatbot, 39 l’ayant utilisé occasionnellement, et 2 régulièrement). L’étude s’est déroulée sur une période de quatre jours.

    Trois variables principales ont été évaluées : le sentiment des patients d’être compris lors du processus d’admission, la perception de la sécurité des informations médicales, et le degré de confort à partager des informations de santé via un chatbot IA. Une évaluation globale de la qualité et de la sécurité de l’expérience pré-consultation a également été réalisée.

    Results : Les patients ayant utilisé le chabot ont rapporté un niveau de satisfaction supérieur sur tous les paramètres mesurés par rapport aux procédures d’admission traditionnelles. En particulier, la qualité et la sécurité de l’expérience pré-consultation ont été notées 4,34 sur 5 avec le chatbot contre 3,81 pour la méthode conventionnelle.

    Discussion : Ces résultats suggèrent que le chabot améliore significativement l’environnement d’admission médicale en le rendant plus sécurisé et empathique, renforçant ainsi la confiance et la satisfaction des patients. L’étude démontre également que même les participants ayant une expérience limitée des chatbots ont bénéficié du processus d’admission assisté par l’IA, soulignant ainsi son potentiel pour améliorer l’accessibilité et l’efficacité des soins de santé.

    Conclusion : L’adoption d'un chatbot dans les procédures d’admission pré-consultation pourrait optimiser l’expérience des patients tout en maintenant des standards élevés de sécurité et de confort. Ces résultats ouvrent des perspectives sur l’intégration des chatbots médicaux dans les pratiques cliniques afin d’améliorer l’efficacité et la qualité des soins.

    Conflits d’intérêts :

    J. Lebleu: Pas de conflit déclaré ,

    S. goossens Consultancy, Expert: Vesalius.ai,

    Q. schietecatte Consultancy, Expert: Vesalius.ai,

    C.-E. Winandy: Pas de conflit déclaré ,

    P. Vanoverschelde Consultancy, Expert: Vesalius.ai

    Discussions avec l'auditoire
    09h07 / 09h30
  • Cliquez pour afficher le contenu
    IA en peropératoire – planification et assistance chirurgicale
    09h30 / 10h30
    Keynotes

    09h30 L’IA et la modélisation biomécanique : vers une planification personnalisée (Antoine Perrier)

    Bases de la simulation numérique 

    Prédiction des conséquences anatomiques 

    Intégration IA pour une planification agile et précise (exemple dans la prothèse de genou). 

    Résumé : Au même titre que la robotique a transformé l’exécution du geste chirurgicale, la simulation numérique augmentée par l’IA permettra dans les années à venir de prédire les conséquences anatomiques d’un choix de planification, mais surtout de proposer la planification la plus adaptée pour un patient donné. Nous aborderons ici les bases de la simulation numérique et la nécessité du couplage avec l’IA afin de permettre une utilisation agile et peu chronophage au service du chirurgien et du patient 

    Pierre-Alban Bouché (MCU-PH, Hôpital Lariboisière, Paris) 

     

    09h40 L’impact des données sur la planification : modélisation prédictive par IA (Pierre-Alban Bouché)

    Machine Learning appliqué aux registres chirurgicaux 

    Stratégies opératoires individualisées 

    Résumé L’utilisation croissante des bases de données issues des registres chirurgicaux ouvre de nouvelles perspectives pour la planification préopératoire. L’objectif est d’expliquer le principe des modèles prédictifs fondés sur l’intelligence artificielle, et d’explorer leur potentiel en tant qu’outils d’aide à la décision chirurgicale. En s’appuyant sur des données réelles, ces modèles permettent d’individualiser la stratégie opératoire en fonction des caractéristiques propres à chaque patient, ouvrant ainsi la voie à une médecine plus personnalisée et anticipative. 


    09h30 / 09h50
    Modèle numérique et planification de Prothèse Totale Inversée d’Épaule : la posture du patient influence t’elle nos mesures préopératoires ?
    Orateur(s) : Alexandre Caubere (Toulon)
    09h50 / 09h57
    Afficher abstract
    

    Communications orales

     

    Shoulder / Elbow

    ABSTRACT N° SOFCOT25-258

    Modèle numérique et planification de Prothèse Totale Inversée d’Épaule : la posture du patient influence t’elle nos mesures préopératoires ?

     

    Alexandre Caubere* 1, François Boux de Casson2, Amaury Jung2, Marc-Olivier Gauci3

    1HIA Sainte-Anne, Toulon, 2Blue Ortho, Grenoble, 3CHU Pasteur 2, Nice, France

    Introduction : La planification préopératoire permet d'anticiper certaines complications lors de nos Prothèses Totales Inversée d’Épaule (PTEI). La segmentation osseuse automatique basée sur le scanner préopératoire permet une reconstruction 3D fidèle de l'anatomie de l'articulation gléno-humérale. Le but de notre étude était de définir la variabilité de la posture huméro-scapulaire lors de l'imagerie préopératoire et d'évaluer son influence sur les mesures de latéralisation angulaire. Nous émettons l'hypothèse qu'il existe une variabilité importante de l'abduction et que cette variabilité a une influence sur les mesures de latéralisation angulaire.

    Material and methods : Une revue rétrospective et multicentrique, de scanners collectés prospectivement à partir d'un système de planification de PTEI (Equinoxe, Exactech GPS, Blue-Ortho) a été réalisée. Tous les cas dans lesquels l'omoplate et l'humérus ont été segmentés ont été inclus. Des modèles 3D ont été générés à partir de segmentations. Le cadre de référence anatomique et le plan de l'omoplate ont été calculés, et les points de repère permettant les mesures angulaires ont été positionnés sur l'omoplate et l'humérus (tubercule glénoïde supérieur ; bord le plus latéral de l'acromion ; bord le plus latéral de la grosse tubérosité). La position de l'humérus par rapport à la scapula a été automatiquement calculée, ce qui a permis d'évaluer les angles d'abduction, de flexion et de rotation interne de l'articulation scapulo-humérale. Les angles de latéralisation (LSA) et de distalisation (DSA) ont été calculés. Une analyse de régression linéaire multiple a été effectuée pour évaluer l'association entre LSA/DSA et les positions initiales de l’humérus par rapport à la scapula.

    Results : Au total, 21 863 patients ont été inclus dans l'étude, avec une répartition presque égale entre les femmes (52,6 %) et les hommes (47,4 %). La position préopératoire de l'humérus par rapport aux mesures scapulaires a montré une abduction médiane de 10,3°±12,4, une flexion médiane de 3,9°±8,9 et une rotation interne médiane de 6,5°±18,9. Les médianes du LSA et DSA préopératoire étaient respectivement de 87,4°±14,3 et 43°±10,2. Le LSA était plus influencé que le DSA par la position. L'abduction présentait la corrélation la plus forte pour le LSA (β = - 0,29, p < 0,0001) moins importante pour le DSA (β = 0,04, p < 0,0001). Ce qui indiquait qu'une variation de 10° d’abduction entraînait une variation de - 3° du LSA et de seulement 0,4° pour le DSA. La flexion et la rotation interne présentaient des corrélations plus faibles avec les mesures angulaires : βLSA = βDSA = - 0,04, p < 0,0001 pour la flexion ; βLSA = 0,12 et βDSA = - 0,04, p < 0,0001 pour la rotation.

    Conclusion : La position du patient sur le scanner préopératoire est un paramètre qui doit être pris en compte lors de la planification de nos PTEI. Cela affecte les mesures angulaires et anatomiques fournies automatiquement par le logiciel de planification.

    Conflits d’intérêts : Pas de conflit déclaré

    MedShoulder : publication d'une base de données à grande échelle, labellisée pour la segmentation automatisée de scanners d'épaules arthrosiques utilisant l'apprentissage actif et les réseaux de neurones convolutionnels
    Orateur(s) : Marc-Olivier Gauci (Nice)
    09h57 / 10h04
    Afficher abstract
    

    Communications orales

     

    Shoulder / Elbow

    ABSTRACT N° SOFCOT25-694

    MedShoulder : publication d'une base de données à grande échelle, labellisée pour la segmentation automatisée de scanners d'épaules arthrosiques utilisant l'apprentissage actif et les réseaux de neurones convolutionnels

     

    Robin Cremese1, Théo Aguilar-Vidal2, Isa Costantini2, Jean-Baptiste Masson1, Marc-Olivier Gauci* 3

    1Décision et calcul bayésien (DBC) - Epiméthée, INRIA, Institut Pasteur, PARIS, 2IULS, CHU de Nice, 3Unité ICARE, INSERM U1091, NICE, France

    Introduction : Il n'existe aucune base de données publique de scanners d'épaules arthrosiques avec un algorithme de segmentation automatique validée. Ce manque de données ouvertes limite la recherche et l'innovation. Notre objectif était d'introduire et valider une base de données complète de scanners d'épaules arthrosiques pour la segmentation osseuse automatisée, avec un cadre d'apprentissage profond ouvert.

    Material and methods : MedShoulder comprend 180 scanners d'épaules arthrosiques annotés par des chirurgiens experts pour trois segments osseux entiers de l'épaule : humérus, scapula et clavicule. Le développement utilise une approche d'apprentissage actif avec l'architecture MedNext dans le framework nnUNet. Des chirurgiens experts ont réalisé la labellisation avec un processus de revue consensuelle. L'apprentissage actif a accéléré l'annotation en identifiant les cas les plus informatifs. Les performances ont été évaluées par le coefficient de similarité de DICE (DSC) et la distance de Hausdorff (HD).

    Results : La base de données présente une fiabilité inter-évaluateurs de κ=0,92. Le modèle MedNext a obtenu des scores de DICE moyen de 0.97 pour l’humérus, 0.95 pour la scapula et 0.91 pour la clavicule. Les valeurs HD95 moyennes étaient de 1,4 mm, 1,24 mm et 17,5 mm respectivement. L'apprentissage actif a réduit le temps d'annotation de 40% par rapport à l'étiquetage séquentiel traditionnel. Les expériences de validation croisée ont montré des performances cohérentes, avec des écarts-types inférieurs à 0,02.

    Discussion : Les bases de données articulaires sont souvent conservées par les industriels sans aucun accès publique. La publication d'une base de données et d'un algorithme de segmentation automatique associé évite la monopolisation des avancées par quelques acteurs privés et favorise une science ouverte, accélère l’innovation, améliore la précision des traitements et garantit un accès équitable aux avancées technologiques.

    Conclusion : MedShoulder offre une contribution significative à l'analyse d'imagerie de l'épaule arthrosique. La combinaison d'apprentissage actif et de réseaux de neurones démontre une approche efficace et reproductible de création de bases de données. La disponibilité publique d'une base de données et des modèles facilitera la recherche et les applications cliniques en chirurgie de l'épaule.

    Conflits d’intérêts : Pas de conflit déclaré

    Discussions avec l'auditoire
    10h05 / 10h30
  • Cliquez pour afficher le contenu
    IA en postopératoire – chatbot, suivi et collecte de donnée
    11h00 / 11h50
    Keynote - IA : enjeux de fiabilité et de recevabilité des LLM – Explication pratique & mathématique
    Orateur(s) : Jules Descamps (Paris), Guillaume Draznieks ()
    11h00 / 11h20
    Interprétation automatisée et standardisée des radiographies guidée par IA pour le suivi des arthroplasties de l’épaule
    Orateur(s) : Tugdual Pichon ()
    11h20 / 11h27
    Afficher abstract
    

    Communications orales

     

    Shoulder / Elbow

    ABSTRACT N° SOFCOT25-633

    Interprétation automatisée et standardisée des radiographies guidée par IA pour le suivi des arthroplasties de l’épaule

     

    Tugdual Pichon* 1, Matthis Maillard2, Théo Estienne2, Dalale Gueddouri2, Charlotte Pouchy2, Julien Berhouet1

    1CHU Tours, Tours, 2Deemea, Paris, France

    Introduction : Le suivi postopératoire des prothèses d’épaule repose sur l’analyse minutieuse des radiographies afin d’évaluer le positionnement de l’implant et d’anticiper d’éventuelles complications. Cependant, cette tâche est particulièrement complexe en raison de la variabilité anatomique de l’articulation scapulo-humérale et des multiples incidences radiographiques nécessaires. Elle demeure chronophage et représente un défi pour les cliniciens non spécialisés.Cette étude propose une approche innovante utilisant une suite d’algorithmes d’apprentissage profond pour l’interprétation automatisée des radiographies d’épaule en pré et post-arthroplastie. L’objectif est de standardiser et améliorer l’évaluation du positionnement prothétique ainsi que la détection précoce d’anomalies, rendant ainsi le suivi des arthroplasties d’épaule plus accessible et fiable pour un large éventail de praticiens.

    Material and methods : Nous avons constitué une base de données de radiographies d’épaules issues de plusieurs sources, incluant un centre clinique partenaire ainsi que des jeux de données publiques. Après application d’une suite d’algorithmes de contrôle qualité, 8 794 radiographies d’épaules ont été sélectionnées, dont 1 487 avec prothèse inversée. Des experts médicaux ont manuellement annoté ces images afin d'entraîner un réseau de neurones à prédire la position de repères anatomiques clés, permettant ainsi la détection d'éventuelles anomalies de positionnement osseux et/ou prothétiques. La performance des algorithmes a ensuite été évaluée en comparant leurs prédictions à celles de chirurgiens sur les mêmes images.

    Results : Nos algorithmes de contrôle qualité ont obtenus un score F1 et une aire sous la courbe (AUC) respectivement de 0.99 et 0.99 pour la prédiction du type de prothèse, de 0.97 et 0.98 pour la prédiction de la vue.

    Nos algorithmes ont prédit 13 et 19 points sur les radiographies respectivement pré et postopératoires. Ces points ont permis de mesurer les angles suivants : Lateral Shoulder Angles, Distal Shoulder angles, Critical Shoulder Angle et les angles alpha, bêta, delta et gamma.

    L’erreur moyenne est respectivement de 20,8 pixels (SD 39,96 pixels) pour les algorithmes d’annotations automatisées et de 12,5 (SD 5.58) pour la prédiction des angles de référence comparée aux chirurgiens.

    Discussion : Ces travaux démontrent pour la première fois l'intérêt d’utiliser l’intelligence artificielle dans le cadre du suivi des patients après la mise en place d’une prothèse d’épaule. Les algorithmes développés ont démontré un niveau de performance prometteur sur les différentes tâches réalisées. Pour optimiser les performances, des fonctions d'augmentation des données (rotation, zoom, changement de contraste, etc..) vont être utilisées.

    Conclusion : Cette étude met en lumière le potentiel considérable des algorithmes d'IA dans leur capacité d'automatiser et de standardiser le processus d'interprétation des radiographies, améliorant et accélérant ainsi l'efficacité et la reproductibilité des évaluations médicales.

    Conflits d’intérêts : Pas de conflit déclaré

    Évaluation de l’impact des différents guides de coupe dans la prothèse totale de genou basée sur les PROMs : une étude prospective à partir du registre RENACOT
    Orateur(s) : Pierre-Alban Bouche (Paris)
    11h27 / 11h34
    Afficher abstract
    

    Communications orales

     

    Degenerative knee condition

    ABSTRACT N° SOFCOT25-168

    Évaluation de l’impact des différents guides de coupe dans la prothèse totale de genou basée sur les PROMs : une étude prospective à partir du registre RENACOT

     

    Pierre-Alban Bouche* 1, Sophie Putman1, Antoine Poichotte1, Alexandre Poignard1, Christian Delaunay1, Stéphane Boisgard1

    1RENACOT, Paris, France

    Introduction : L’alignement des composants tibiaux et fémoraux d’une prothèse totale de genou (PTG) joue un rôle clé dans le succès de cette chirurgie. Un défaut d’alignement des PTG peut favoriser un descellement prématuré ou altérer la fonction finale. Actuellement, cinq guides de coupe existent : les guides de coupe mécaniques, les guides de coupe spécifiques au patient (Patient Specific Instrumentation, PSI), la navigation, la robotique et les prothèses sur mesure. De nombreux essais thérapeutiques ou méta-analyses ont comparé deux à deux ces différents guides de coupes avec des résultats parfois contradictoires. Néanmoins, aucune étude n'a comparé simultanément l’ensemble de ces 5 techniques. L’objectif de ce travail était de comparer les résultats subjectifs de ces différents guides de coupe en confrontant leurs Patient Reported Outcomes Measures (PROMs) sur une période de 6 mois post-opératoire.

    Material and methods : Les patients opérés d’une PTG entre mars 2023 et décembre 2024 ont été identifiés dans RENACOT. Un total de 1 774 PTG a été inclus : 1 076 avec guides de coupe mécaniques (60,7%), 337 avec robots (19,0%), 227 naviguées (12,8%), 111 PSI (6,2%) et 23 (1,3%) PTG sur mesure. L'âge moyen de la population était de 70,9 (DS, 8,9) ans, 62,8% (1 114/1 774) des patients étaient des femmes et l'indice de masse corporelle (IMC) moyen était de 29,5 (DS, 5.5) kg/m2. Les PROMs collectés était le Knee injury and Osteoarthritis Outcome Score (KOOS-PS), le Forgotten Joint Score (FJS) et l’Oxford Knee Score (OKS) à J14, 3 mois et 6 mois post-opératoires.

    Results : A J14, 17% (302/1 774) des patients avaient complété les scores : 189 (17,6%) dans le groupe mécanique, 59 (17,5%) dans le groupe robot, 30 (13,2%) dans le groupe navigation, 19 (17,1%) dans le groupe PSI et 5 (21,7%) dans le groupe prothèse sur mesure. Le groupe navigation (26,8 [DS, 9,2]) obtenait un score OKS significativement plus élevé comparé au groupe mécanique (21,9 [DS, 8,5], p<0,01), au groupe robot (21,5 [DS, 8,2], p=0,01) et au groupe PSI (20,5 [DS, 9,1], p=0,02).

    A 3 mois, 13,5% (240/1 774) des patients avaient complété les scores : 143 (13,3%) dans le groupe mécanique, 51 (15,1%) dans le groupe robot, 28 (12,3%) dans le groupe navigation, 8 (7,2%) dans le groupe PSI et 10 (43,5%) dans le groupe prothèse sur mesure. Aucune différence n’a été observée.

    A 6 mois, 7% (124/1 774) des patients avaient complété les scores : 74 (6,9%) dans le groupe mécanique, 20 (5,9%) dans le groupe robot, 20 (8,8%) dans le groupe navigation, 5 (4,5%) dans le groupe PSI et 5 (21,7%) dans le groupe prothèse sur mesure. Aucune différence n’a été observée.

    Conclusion : Dans cette étude prospective basée sur les données de RENACOT, aucune différence significative sur le résultat subjectif des interventions basé sur les PROMs n’a été observée entre les différents guides de coupe au décours des six premiers mois postopératoires. Il s’agit de la première étude utilisant la base genou de RENACOT, illustrant tout son potentiel.

    Conflits d’intérêts : Pas de conflit déclaré

    Validation des chatbots basés sur l’IA en soins post-opératoires : un cadre rigoureux pour une assistance patient sûre, empathique et cliniquement pertinente
    Orateur(s) : Julien Lebleu (BELGIQUE)
    11h34 / 11h41
    Afficher abstract
    

    Communications orales

     

    Intelligence artificielle

    ABSTRACT N° SOFCOT25-853

    Validation des chatbots basés sur l’IA en soins post-opératoires : un cadre rigoureux pour une assistance patient sûre, empathique et cliniquement pertinente

     

    Julien Lebleu* 1, Gabriel Van Fraeyenhoven2, Florian gysen2, Mathieu Joncheere3, Charles-Eric Winandy1, Ward Servaes1, Philippe Vanoverschelde 4, Andries Pauwels1

    1moveUP, Bruxelles, 2UClouvain, Louvain la neuve, 3Ugent, 4Hip and Knee Unit, Gent, Belgium

    Introduction : La rééducation post-opératoire nécessite un suivi structuré, mais le manque de ressources entraîne des lacunes dans l’accompagnement des patients. Les chatbots basés sur l’intelligence artificielle (IA) offrent une solution évolutive, mais leur intégration clinique repose sur la validation de leur pertinence, sécurité et exactitude.

    Cette étude propose un cadre d’évaluation rigoureux pour valider les chatbots utilisant des modèles de langage (LLM) en soins post-opératoires. En évaluant leurs réponses avant leur transmission, nous garantissons leur conformité à des critères de justesse, empathie, sécurité, pertinence et fiabilité.

    Material and methods : Un cadre d’évaluation a été développé autour de six dimensions : exactitude, application médicale, fiabilité, empathie, expérience utilisateur et conformité éthique. L’analyse repose sur cinq critères : G-EVAL (précision), intelligence émotionnelle, évaluation de la sécurité, bases de données spécialisées (NarrativeQA, MedQA) et détection des biais.

    Le chatbot a été testé sur 6 000 patients opérés d’une prothèse totale de hanche ou de genou, avec comparaison aux réponses de professionnels. Lorsque les données réelles étaient limitées, des interactions simulées ont complété l’évaluation. Les réponses ont été notées (échelle 0–1) et comparées à des seuils définis.

    Un mécanisme d’amélioration continue a été intégré : les réponses non conformes déclenchaient une régénération ciblée, ajustant prompt, ton et exactitude factuelle. Des optimisations, telles que la réduction des cycles de régénération, des délais contrôlés et l’intégration du retour des patients, ont affiné progressivement la performance du chatbot.

    Results : Les premières analyses montrent que ce cadre différencie efficacement les réponses de qualité, garantissant des messages cliniquement pertinents et empathiques. L’étude en cours suggère que les chatbots validés peuvent améliorer l’accompagnement post-opératoire, réduire la charge des cliniciens et optimiser l’adhésion des patients.

    Discussion : Cette méthodologie permet d’établir une validation systématique des chatbots médicaux en fonction de critères cliniques stricts. L’approche adoptée garantit que l’IA ne remplace pas l’expertise humaine mais complète le suivi post-opératoire en améliorant la réactivité et la personnalisation des conseils aux patients.

    Conclusion : Ce cadre assure la conformité des chatbots aux normes cliniques et éthiques avant leur intégration hospitalière. Il représente une opportunité pour améliorer la prise en charge post-opératoire et optimiser les ressources médicales.

    Conflits d’intérêts : Pas de conflit déclaré

    Discussions avec l'auditoire
    11h41 / 11h49
  • Cliquez pour afficher le contenu
    IA & R&D – analyse des données, modélisation, prédiction
    11h50 / 12h40
    Keynote : Des données aux décisions : le pouvoir de la modélisation

    À l’ère du numérique, les données en santé sont de plus en plus nombreuses, variées et accessibles. Qu’il s’agisse de dossiers médicaux, d’images, de résultats biologiques ou de capteurs connectés, ces informations représentent une ressource précieuse pour mieux comprendre les maladies, anticiper les complications et guider les choix thérapeutiques. 

    La modélisation permet de faire le lien entre des données complexes et des actions concrètes. Elle repose sur des méthodes statistiques et des approches d’intelligence artificielle qui, bien utilisées, peuvent révéler des patterns, estimer des risques, ou proposer des scénarios personnalisés pour chaque patient. 

    Cette présentation propose une immersion dans les grandes étapes de cette transformation : depuis la collecte et la structuration des données jusqu’à leur interprétation à des fins cliniques. 


    Orateur(s) : Olivier Aubert (Paris), Thomas Aubert (Paris)
    11h50 / 12h10
    L'hallucination de l’intelligence artificielle en médecine ; de la confusion au consensus
    Orateur(s) : Jules Descamps (Paris)
    12h10 / 12h17
    Afficher abstract
    

    Communications orales

     

    Intelligence artificielle

    ABSTRACT N° SOFCOT25-1042

    L'hallucination de l’intelligence artificielle en médecine ; de la confusion au consensus

     

    Jules Descamps* 1, Diane Ghanem2, Remy, Nizard1, Matthieu Resche-Rigon3, Pierre-Alban Bouché1, Mikael Chelli4

    1Orthopedie, Hôpital Lariboisière, Paris, France, 2Orthopedic, John Hopkins, Baltimore, United States, 3SBMI, Université Paris Cité, Paris, 4Orthopedie, ICR Nice, Nice, France

    Introduction : L'intégration rapide des grands modèles de langage (LLM) dans le domaine médical soulève des préoccupations majeures concernant leur fiabilité. Malgré leurs performances, ces modèles sont confrontés au phénomène appelé hallucination, anthropomorphisme qui inquiète et apparait comme inévitable. Cette étude a pour objectif d’éclairer comment l'hallucination est définie, interprétée et évitée dans la littérature médicale.

    Material and methods : Une revue systématique a été menée sur trois bases de données (Medline, Embase, Cochrane). Les études évoquants les hallucinations des LLM dans un contexte médical ont été incluses. Sur 3 552 articles identifiés, 796 répondaient aux critères d'inclusion. L'extraction des données incluait les modèles utilisés, les cas d'usage, les définitions d'hallucination, les méthodologies d'évaluation et les stratégies d’évitement proposées.

    Results : La majorité des études provenaient d'Amérique du Nord (51%) et d'Europe (28%), avec une prédominance de ChatGPT (92,3%). Les applications médicales principales étaient l'aide à la décision (22,5%) et les chatbots destinés aux patients (21%). Les domaines médicaux étudiées étaient majoritairement la radiologie (9,4%), l’orthopédie (6,8%), l’oncologie (6,7%).

    Huit cadres conceptuels définissant les hallucinations ont été identifiés, l’erreur factuelle (76%) et la fabrication complète de données (49,5%) étant les plus fréquents. Seuls 27,4% des études distinguaient clairement les hallucinations des autres erreurs d'IA. Aucune définition ne faisait consensus.

    Les conséquences potentielles incluaient l'utilisation abusive des LLM (41,1%), la perte de confiance (37,1%), les erreurs dans la décision clinique (23,3%) et les préjudices directs aux patients (19,8%). Les stratégies d'atténuation proposées comprenaient la supervision humaine (61%), l'ajustement des modèles (47%), la génération basée sur des documents (RAG) (25%) et des évaluations des résultats (18%).

    Conclusion : Notre analyse propose une définition des hallucinations comme un phénomène où l'IA, utilisée comme base de connaissances, produit des résultats faux avec une confiance élevée. Ces hallucinations sont une conséquence inévitable du paradigme actuel de complétion forcée des LLM. Pour les prévenir, quatre conditions essentielles ont été identifiées : (1) restreindre le modèle aux données explicitement fournies, (2) implémenter des mécanismes d'abstention pour les réponses incertaines, (3) établir des limites contextuelles précises, et (4) maintenir une supervision humaine. Cette approche nécessite une distinction fondamentale entre l'IA comme base de connaissances et l'IA comme outil d'action spécifique.

    Conflits d’intérêts : Pas de conflit déclaré

    The Role of Artificial Intelligence in Pediatric Orthopedic Surgery: Current Applications and Future Perspectives
    Orateur(s) : Hedi Atig ()
    12h17 / 12h24
    Afficher abstract
    

    Communications orales

     

    Pediatrics

    ABSTRACT N° SOFCOT25-542

    The Role of Artificial Intelligence in Pediatric Orthopedic Surgery: Current Applications and Future Perspectives

     

    Ahmed Mohseni1, Romdhane Denguezli2, Hedi Atig* 1, Nizar aouinti1, Walid Saied1, Sami Bouchoucha1, Mohamed Nabil Nessib1, Mohamed Zairi1

    1Orthopedie, hopital Enfants, tunis, 2Orthopedie, hopital SAhloul, sousse, Tunisia

    Introduction : Artificial Intelligence (AI) is revolutionizing medical practice, offering new opportunities for diagnosis, treatment planning, and outcome prediction. In pediatric orthopedic surgery, AI-based tools have the potential to improve precision, optimize patient care, and enhance surgical decision-making. This study explores current applications of AI in pediatric orthopedics and discusses future directions

    Material and methods : A systematic review of recent literature and ongoing AI-driven innovations in pediatric orthopedic surgery was conducted. We analyzed AI applications in imaging interpretation, predictive analytics, surgical planning, and robotic-assisted procedures. Case studies and real-world implementations were reviewed to assess clinical impact and limitations.

    Results : AI has demonstrated significant potential in pediatric orthopedics, particularly in fracture classification and detection , scoliosis assessment, and growth prediction. Machine learning algorithms enhance diagnostic accuracy and automate radiological evaluations. Predictive models assist in forecasting disease progression and surgical outcomes, improving personalized treatment strategies. Robotic-assisted surgery and augmented reality-based navigation systems further contribute to precision and safety in complex pediatric procedures. However, challenges remain, including data availability, ethical concerns, and the need for clinical validation.

    Conclusion : AI is transforming pediatric orthopedic surgery, providing enhanced diagnostic tools and innovative treatment approaches. While promising, further research and validation are necessary to integrate AI safely and effectively into routine clinical practice. Multidisciplinary collaboration between orthopedic surgeons, data scientists, and engineers will be essential to harness the full potential of AI in pediatric orthopedic care.

    Conflits d’intérêts : Pas de conflit déclaré

    Un Algorithme pour détecter Automatiquement le Stade de Pied Plat grâce au Machine Learning sur Conebeam en Charge
    Orateur(s) : François Lintz (Saint-Jean)
    12h24 / 12h31
    Afficher abstract
    

    Communications orales

     

    Intelligence artificielle

    ABSTRACT N° SOFCOT25-913

    Un Algorithme pour détecter Automatiquement le Stade de Pied Plat grâce au Machine Learning sur Conebeam en Charge

     

    François Lintz* 1, 2, Victor Silvinskis2, Tommaso Forin Valvecchi2, Pierre-Henri Vermorel3, Enrico Pozzessere2, Wolfram Grün2, Cesar de Cesar Netto2

    1Chirurgie Orthopédique, Ramsay Santé Clinique de l'Union, Saint Jean Toulouse, France, 2Foot and Ankle Division, Duke University, Durham, United States, 3Chirurgie Orthopédique, CHU de Saint Etienne, Saint Etienne, France

    Introduction : Le pied plat est multifactoriel, impliquant les os et les tissus mous. La classification PCFD (Progressive Collapsing Foot Deformity) nécessite une évaluation initiale (staging): flexible (stade 1), rigide (stade 2), principalement sur l'examen clinique. Cela reste subjectif, influencé par l'expérience et le patient. Une approche objective sur des données d'imagerie pourrait améliorer sa précision. Des rapports automatisés comprenant de multiples mesures peuvent être générés à partir du conebeam en charge (WBCT) et l'apprentissage automatique (ML) offre une approche pour analyser ces jeux de données complexes. Cette étude vise à évaluer la précision du staging selon la classification PCFD par ML à partir de ces données. posant l'hypothèse d'une concordance avec le staging clinique

    Material and methods : Etude rétrospective de 73 pieds. 37 mesures par pied ont été générés par segmentation automatique. Les données démographiques ont également été recueillies. Les données ont été normalisé (moyenne 0, écart-type 1). Une analyse en composantes principales a réduit la dimensionnalité en retenant 17 variables, dont 9 expliquaient 95 % de la variance. Plusieurs modèles ont été testés : régression logistique, random forest, voting classifier et support vector classifier (SVC). Les données ont été divisées pour entraînement (80 %) et validation (20 %). Les modèles ont été évalués par: F1-score, précision, rappel, aire sous la courbe (AUC). Le critère principal était un F1-score supérieur à 0,80.

    Results : L'âge moyen était de 59,2 ans ± 15,6, l’IMC moyen de 32,6 kg/m² ± 6,4 et l'alignement (offset pied-cheville-FAO) de 10,6 % ± 4,9. L’étude comprenait 39 flexibles (stade 1) et 34 rigides (stade 2). Après réduction dimensionnelle, le jeu de données contenait 73 lignes et 17 colonnes, dont 6 catégorielles et 11 continues. Le modèle CatBoost présentait la meilleure performance globale, ( F1= 0,84, précision =0,89, rappel=0,80, AUC =0,76). Le modèle SVC affichait la meilleure AUC (0,82) et le meilleur rappel (1,0), suivi par LightGBM et NaiveBayes.

    Discussion : Les modèles d'apprentissage automatique permettent un staging du pied plat à partir de mesures WBCT. Cette approche montre une performance élevée des différents modèles, constante lors de la partition des données d’entraînement et des analyses secondaires. Ces résultats indiquent que les mesures 3D issues du WBCT contiennent des informations clés multidimensionnelles exploitables. Les limites de cette étude incluent un petit échantillon de validation, un faible ratio variables/population et l'utilisation de l’examen clinique comme référence.

    Conclusion : Le ML pourrait compléter l’évaluation clinique initiale en apportant une validation objective basée sur les données. Des études ultérieures devraient explorer des populations plus vastes avec validation multicentrique.

    Conflits d’intérêts :

    F. Lintz: Pas de conflit déclaré ,

    V. Silvinskis: Pas de conflit déclaré ,

    T. F. Valvecchi: Pas de conflit déclaré ,

    P.-H. Vermorel: Pas de conflit déclaré ,

    E. Pozzessere: Pas de conflit déclaré ,

    W. Grün: Pas de conflit déclaré ,

    C. de Cesar Netto Consultancy, Expert: CurvebeamAI Paragon28 Ossio Ty-Co Arthrex Smith&Nephew Stryker , Stock shareholder : CurvebeamAI

    Discussions avec l'auditoire
    12h31 / 12h40
  • Cliquez pour afficher le contenu
    Synthèse de la matinée et perspectives sur l’IA en chirurgie orthopédique
    12h40 / 12h50
    Orateur(s) : Julien Bardou-Jacquet (Bordeaux)
  • Cliquez pour afficher le contenu
    Assemblée Générale
    12h50 / 13h15
Envie d'en savoir plus ?
  • Sofcot