SAMOVA Team

Head : Julien PINQUIER

 

 

 
In the context of audio and video document indexing and retrieval, the main studies of the team deal with the correlated extraction of the audio and video information and its exploitation to propose intelligent access. This research implies studies on signal processing, on modeling and learning and also on audiovisual content structuring.

skills

Automatic speech processing (acoustic and prosodic), swallowing, music and environmental sounds
Audio and video segmentation, indexing and modeling
Automatic intelligibility and comprehensibility measurements
Multimodal conversational interaction
Speech pathologies: production and perception

team Members

Permanent members
Non-permanent members
External members

team publications

International journals articles
  • Sebastião Quintas, Robin Vaysse, Mathieu Balaguer, Vincent Roger, Julie Mauclair, Jérôme Farinas, Virginie Woisard, Julien Pinquier, Julien Pinquier

    SAMI: an M-Health application to telemonitor intelligibility and speech disorder severity in head and neck cancers

    Frontiers in Artificial Intelligence, 2024, 7, ⟨10.3389/frai.2024.1359094⟩

    Accès: https://hal.science/hal-04595273

  • Sebastião Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier

    Automatic modelling of perceptual judges in the context of head and neck cancer speech intelligibility

    International Journal of Language and Communication Disorders, 2024, pp.1–14. ⟨10.1111/1460-6984.13004⟩

    Accès: https://hal.science/hal-04405083

  • Renée Speyer, Mathieu Balaguer, Emmanuelle Cugy, Clémence Devoucoux, Sylvain Morinière, Gaëlle Soriano, Eric Vérin, Virginie Woisard

    Expert Consensus on Clinical Decision Making in the Disease Trajectory of Oropharyngeal Dysphagia in Adults: An International Delphi Study

    Journal of Clinical Medicine, 2023, 12 (20), pp.6572. ⟨10.3390/jcm12206572⟩

    Accès: https://hal.science/hal-04595268

  • Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard

    Development of a holistic communication score (HoCoS) in patients treated for oral or oropharyngeal cancer: Preliminary validation

    International Journal of Language and Communication Disorders, 2023, 58 (1), pp.39-51. ⟨10.1111/1460-6984.12766⟩

    Accès: https://hal.science/hal-03765649v2

  • Lionel Pibre, Jorge Francisco Madrigal Diaz, Cyrille Equoy, Frédéric Lerasle, Thomas Pellegrini, Julien Pinquier, Isabelle Ferrané

    Audio-video fusion strategies for active speaker detection in meetings

    Multimedia Tools and Applications, 2022, 2022, pp.1-26. ⟨10.1007/s11042-022-13746-7⟩

    Accès: https://hal.science/hal-03792965

  • Léo Cances, Etienne Labbé, Thomas Pellegrini

    Comparison of Semi-supervised Deep Learning Algorithms for Audio Classification

    EURASIP Journal on Audio, Speech, and Music Processing, 2022, 2022 (1, article 23), pp.1-14. ⟨10.1186/s13636-022-00255-6⟩

    Accès: https://hal.science/hal-03855042

  • Vincent Roger, Jérôme Farinas, Julien Pinquier

    Deep neural networks for automatic speech processing: a survey from large corpora to limited data

    EURASIP Journal on Audio, Speech, and Music Processing, 2022, article 19, pp.1-15. ⟨10.1186/s13636-022-00251-w⟩

    Accès: https://hal.science/hal-03755976

  • Timothy Pommée, Mathieu Balaguer, Julie Mauclair, Julien Pinquier, Virginie Woisard

    Criteria for creating new standard reading passages for the assessment of speech and voice: A Delphi consensus study

    Clinical Linguistics & Phonetics, 2022, 37 (8), pp.722-741. ⟨10.1080/02699206.2022.2080589⟩

    Accès: https://hal.science/hal-04595275

  • Mathieu Balaguer, Timothy Pommée, Julien Pinquier, Jérôme Farinas, Virginie Woisard, Florence Sordes

    Development and preliminary validation of the questionnaire ‘Evaluation of the constitution of social circles (ECSC)’ in patients treated for cancer of the upper aerodigestive tract

    Folia Phoniatrica et Logopaedica, 2022, 75 (1), pp.52-66. ⟨10.1159/000525352⟩

    Accès: https://hal.science/hal-03716864

  • Libio Gonçalves Braz, Lionel Fontan, Julien Pinquier, Michael A Stone, Christian Füllgrabe

    OPRA-RS: A Hearing-Aid Fitting Method Based on Automatic Speech Recognition and Random Search

    Frontiers in Neuroscience, 2022, 16, pp.779048. ⟨10.3389/fnins.2022.779048⟩

    Accès: https://ut3-toulouseinp.hal.science/hal-03582025

  • National journals articles
  • Jérôme Farinas

    La modélisation automatique de l’intelligibilité pour améliorer la qualité de vie des patients atteints de troubles de la parole : un exemple d’IA dans le domaine médical

    A.N.A.E. Approche neuropsychologique des apprentissages chez l’enfant, 2024, 36 (189), pp.137-141

    Accès: https://hal.science/hal-04602548v2

  • Mathieu Balaguer, Timothy Pommée, Jérôme Farinas, Julien Pinquier, Virginie Woisard

    Paramètres perceptifs expliquant la sévérité du trouble de parole mesurée automatiquement en cancérologie ORL

    Rééducation orthophonique, 2021, Chapitre : “De l’exploration à la prise en soins de la voix chez l’adulte : données actuelles.. sur la voie des voix”, 286, pp.1-13

    Accès: https://ut3-toulouseinp.hal.science/hal-03277422

  • Mathieu Balaguer, Josiane Percodani, Virginie Woisard

    Le Carcinologic Handicap Index (CHI) : questionnaire d’autoévaluation du handicap à destination des patients traités pour cancer des VADS

    Annales françaises d’Oto-rhino-laryngologie et de Pathologie Cervico-faciale, 2017, 134 (6), pp.382-387. ⟨10.1016/j.aforl.2016.07.021⟩

    Accès: https://hal.science/hal-02553232

  • National journals articles
    Special issues of journal
    International conferences articles
  • Modan Tailleur, Julien Pinquier, Laurent Millot, Corsin Vogel, Mathieu Lagrange

    EMVD dataset: a dataset of extreme vocal distortion techniques used in heavy metal

    21st International Conference on Content-based Multimedia Indexing (CBMI), Gylfi Þór Guðmundsson; Laurent Amsaleg; Omar Shahbaz Khan; Ralph Gasser; Shin’ichi Satoh; Maria Pegia; Aladine Chetouani; Björn Þór Jónsson; Claudio Gennaro; Ewa Kijak; Ilias Gialampoukidis; Liting Zhou; Jenny Benois-Pineau; Stevan Rudinac, Sep 2024, Reykjavik, Iceland

    Accès: https://hal.science/hal-04620072

  • Lila Gravellier, Maxime Le Coz, Jérôme Farinas, Julien Pinquier

    Detection of Pharyngolaryngeal Activities in Real-World Settings Using Wearable Sensors

    46th annual international conference of the IEEE engineering in medicine and biology society (EMBC 2024), EMBC: Engineering in Medicine and Biology Society, Jul 2024, Orlando (Florida), United States. à paraître

    Accès: https://hal.science/hal-04561003

  • Sebastião Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier

    Les représentations de locuteurs pour prédire l’intelligibilité de la parole lors de conversations médicales

    Actes de JEP-TALN-RECITAL 2024. Actes des 35èmes Journées d’Études sur la Parole, Jul 2024, Toulouse, France. pp.102-111

    Accès: https://inria.hal.science/hal-04623063

  • Romain Contrain, Julien Pinquier, Lionel Fontan, Isabelle Ferrané

    Erreurs de prononciation en L2 : comparaison de méthodes pour la détection et le diagnostic guidés par la didactique

    Actes de JEP-TALN-RECITAL 2024. Actes des 35èmes Journées d’Études sur la Parole, Jul 2024, Toulouse, France. pp.361-370

    Accès: https://inria.hal.science/hal-04623087

  • Adrien Lafore, Clément Pagès, Leila Moudjari, Sebastião Quintas, Isabelle Ferrané, Hervé Bredin, Thomas Pellegrini, Farah Benamara, Jérôme Bertrand, Marie-Françoise Bertrand, Véronique Moriceau, Jérôme Farinas

    Premier système IRIT-MyFamillyUp pour la compétition sur la reconnaissance des émotions Odyssey 2024

    Actes de JEP-TALN-RECITAL 2024. Actes des 35èmes Journées d’Études sur la Parole, Jul 2024, Toulouse, France. pp.502-511

    Accès: https://inria.hal.science/hal-04623100

  • Lucas Block Medin, Lucile Gelin, Thomas Pellegrini

    Adaptation de modèles auto-supervisés pour la reconnaissance de phonèmes dans la parole d’enfant

    Actes de JEP-TALN-RECITAL 2024. Actes des 35èmes Journées d’Études sur la Parole, Jul 2024, Toulouse, France. pp.231-241

    Accès: https://inria.hal.science/hal-04623075

  • Verdiana De Fino, Isabelle Ferrané, Julien Pinquier, Lionel Fontan

    Peut-on évaluer la compréhensibilité de la parole sans référence quant aux intentions de communication du locuteur ? Une étude auprès d’apprenants germanophones de FLE

    Actes de JEP-TALN-RECITAL 2024. Actes des 35èmes Journées d’Études sur la Parole, Jul 2024, Toulouse, France. pp.492-501

    Accès: https://inria.hal.science/hal-04623099

  • Adrien Lafore, Clément Pagés, Leila Moudjari, Sebastião Quintas, Isabelle Ferrané, Hervé Bredin, Thomas Pellegrini, Farah Benamara, Jérôme Bertrand, Marie-Françoise Bertrand, Véronique Moriceau, Jérôme Farinas

    Premier système IRIT-MyFamillyUp pour la compétition sur la reconnaissance des émotions Odyssey 2024

    35ème Journées d’Études sur la Parole (JEP 2024), Université Toulouse 3 Paul Sabatier; Université Toulouse Jean Jaurès, Jul 2024, Toulouse, France. à paraître

    Accès: https://hal.science/hal-04594251

  • Taissir Fekih Romdhane, Mohamed Ibn Khedher, Mounim A El-Yacoubi

    PredictStr: A Balanced Benchmark Dataset for Improve Stroke Prediction

    International Conference on Human System Interaction (HSI), Jul 2024, Paris, France

    Accès: https://hal.science/hal-04622267

  • Mathieu Balaguer, Lucile Gelin, Clémence Devoucoux, Camille Galant, Muriel Lalain, Alain Ghio, Jérôme Farinas, Julien Pinquier, Virginie Woisard

    Étude des liens acoustico-moteurs après cancer oral ou oropharyngé, via la réalisation d’un inventaire phonémique automatique des consonnes

    Actes de JEP-TALN-RECITAL 2024. Actes des 35èmes Journées d’Études sur la Parole, Jul 2024, Toulouse, France. pp.61-70

    Accès: https://inria.hal.science/hal-04623060

  • National conferences articles
  • Romain Contrain, Julien Pinquier, Lionel Fontan, Isabelle Ferrané

    Détection et classification automatiques d’erreurs de prononciation en L2 : approche basée sur les connaissances didactiques

    Journée commune AFIA-TLH / AFCP “Extraction de connaissances interprétables pour l’étude de la communication parlée” (2023), Association Française pour l’Intelligence Artificielle (AFIA), collège Technologies du Langage Humain (TLH); Association Francophone de la Communication Parlée (AFCP), Dec 2023, Avignon, France

    Accès: https://hal.science/hal-04331354

  • Verdiana De Fino, Isabelle Ferrané, Lionel Fontan, Julien Pinquier

    Prédiction de la compréhensibilité de la parole d’apprenants de français

    Journée commune AFIA-TLH / AFCP “Extraction de connaissances interprétables pour l’étude de la communication parlée” (2023), Association Française pour l’Intelligence Artificielle (AFIA), collège Technologies du Langage Humain (TLH); Association Francophone de la Communication Parlée (AFCP), Dec 2023, Avignon, France

    Accès: https://hal.science/hal-04329163

  • Lila Gravellier, Maxime Le Coz, Jérôme Farinas, Julien Pinquier

    Evaluation de la détection automatique des activités pharyngolaryngées dans les signaux d’auscultation cervicale à haute résolution chez les personnes âgées

    3ème journée de la Société Française de Déglutition et de Dysphagie (SF2D 2023), Société Française de Déglutition et de Dysphagie, Nov 2023, Toulouse, France

    Accès: https://hal.science/hal-04560917

  • Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard

    Mesure du trouble de parole dans le suivi cancérologique grâce à la reconnaissance automatique de la parole

    55e Congrès de la Société Française de Chirurgie Cervico-Faciale (SFCCF 2023), Université de Nantes; Société Française de Chirurgie Cervico-Faciale, Nov 2023, Nantes, France

    Accès: https://hal.science/hal-04297963

  • Mathieu Balaguer

    Parole et communication après cancer oral ou oropharyngé : l’évaluation clinique au cours du suivi du patient

    58e Congrès Société Française de Stomatologie, Chirurgie Maxillo-Faciale et Chirurgie orale (2023), Société Française de Stomatologie, Chirurgie Maxillo-Faciale et Chirurgie orale, Oct 2023, Toulouse, France

    Accès: https://hal.science/hal-04230870

  • Jérôme Farinas, Corine Astesano, Robin Vaysse

    Caractérisation automatique du rythme de la parole

    Journée scientifique de Toulouse Mind and Brain Institute (TMBI 2023), Toulouse Mind and Brain Institute, May 2023, Toulouse, France

    Accès: https://hal.science/hal-04096036

  • Verdiana De Fino, Lionel Fontan, Sylvain Detey, Isabelle Ferrané, Julien Pinquier

    Corpus de parole non-native et prédiction automatique du niveau de performance en expression orale : application à CLIJAF

    Journées Interphonologie du Français Contemporain (IPFC 2022), Dec 2022, Paris, France

    Accès: https://hal.science/hal-03946408

  • Vincent Roger, Jérôme Farinas, Virginie Woisard, Julien Pinquier

    Création d’une mesure entropique de la parole pour évaluer l’intelligibilité de patients atteints de cancers des voies aérodigestives supérieures

    34èmes Journées d’Études sur la Parole (JEP 2022), Association Française de la Communication Parlée, Jun 2022, Ile de Noirmoutier, France. pp.117-125, ⟨10.21437/JEP.2022-13⟩

    Accès: https://hal.science/hal-03739691

  • Robin Vaysse, Alain Ghio, Corine Astésano, Jérôme Farinas, François Viallet

    Analyse macroscopique des variations et modulations de F0 en lecture dans la maladie de Parkinson : données sur 320 locuteurs

    34èmes Journées d’Études sur la Parole (JEP 2022), Association Française de la Communication Parlée, Jun 2022, Noirmoutier, France. pp.307–315, ⟨10.21437/JEP.2022-33⟩

    Accès: https://hal.science/hal-03726999v2

  • Jérôme Farinas

    Evaluation automatique de l’intelligibilité pour des patients présentant une atteinte de la voix

    Premier webinaire de Start in Lab Santé 2021, Digital 113, Nov 2021, Toulouse, France

    Accès: https://hal.science/hal-03464163

  • Books
  • Etienne Sicard, Anne Menin-Sicard, Marie Daumet, Stéphanie Perriere, Océane Barbera

    Evaluation de la voix avant/après suivi orthophonique -à propos de la méthodologie d’évaluation et de la fiabilité des mesures chiffrées

    Ortho Editions. Efficacité des thérapies, Ortho Editions, pp.233-264, 2017, 978-2-36235-100-6

    Accès: https://hal.science/hal-02424850

  • Alexandre Boyer, Etienne Sicard

    Basis of Electromagnetic Compatibility of Integrated Circuits – A modeling approach using IC-EMC

    Presses Universitaires du Midi – Collection Pour l’ingénieur. Presses universitaires du Midi (PUM), 390p., 2017, 978-2-8107-0522-1

    Accès: https://hal.science/hal-01951651

  • Books parts
    Proceedings
  • Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-Dac, Julie Mauclair, José G. Moreno, Julien Pinquier

    Actes de JEP-TALN-RECITAL 2024. Actes des 35èmes Journées d’Études sur la Parole

    35èmes Journées d’Études sur la Parole (JEP) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL), ATALA & AFPC, 2024

    Accès: https://inria.hal.science/hal-04623053

  • Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-Dac, Julie Mauclair, José G. Moreno, Julien Pinquier

    Actes de JEP-TALN-RECITAL 2024. 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position

    35èmes Journées d’Études sur la Parole (JEP) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL), ATALA & AFPC, 2024

    Accès: https://inria.hal.science/hal-04623005

  • Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-Dac, Julie Mauclair, José G. Moreno, Julien Pinquier

    Actes de JEP-TALN-RECITAL 2024. Actes de la 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues

    35èmes Journées d’Études sur la Parole (JEP) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL), ATALA & AFPC, 2024

    Accès: https://inria.hal.science/hal-04622982

  • Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-Dac, Julie Mauclair, José G. Moreno, Julien Pinquier

    Actes de JEP-TALN-RECITAL 2024. 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 2 : traductions d’articles publiés

    35èmes Journées d’Études sur la Parole (JEP) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL), ATALA & AFPC, 2024

    Accès: https://inria.hal.science/hal-04622991

  • Mathieu Balaguer, Lila Gravellier, Julien Pinquier

    Actes des 9èmes Journées de Phonétique Clinique

    Institut de Recherche en Informatique de Toulouse, 2023, 978-2-917490-35-8

    Accès: https://hal.science/hal-04126591v2

  • Mathieu Lagrange, Annamaria Mesaros, Thomas Pellegrini, Gael Richard, Romain Serizel, Dan Stowell

    Proceedings of the 7th Workshop on Detection and Classification of Acoustic Scenes and Events (DCASE 2022)

    Tampere University, pp.1-225, 2022, 978-952-03-2677-7

    Accès: https://inria.hal.science/hal-03850901

  • Conferences Proceedings
    Thesis and HDR
  • Verdiana De Fino

    Caractérisation et mesure de la compréhensibilité de la parole de locuteurs non natifs dans le cadre de l’apprentissage des langues

    Informatique. Université Paul Sabatier – Toulouse III, 2024. Français. ⟨NNT : ⟩

    Accès: https://hal.science/tel-04582745

  • Jérôme Farinas

    La parole : du traitement automatique à la mesure de l’intelligibilité

    Intelligence artificielle [cs.AI]. Université Paul Sabatier (Toulouse 3), 2023

    Accès: https://hal.science/tel-04381096

  • Benjamin Chamand

    Adaptation d’approches connexionnistes non supervisées pour l’analyse de contenus d’images et de sons

    Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2023. Français. ⟨NNT : 2023TOU30104⟩

    Accès: https://theses.hal.science/tel-04229622

  • Robin Vaysse

    Caractérisation automatique du rythme de la parole : application aux cancers des voies aéro-digestives supérieures et à la maladie de Parkinson

    Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2023. Français. ⟨NNT : 2023TOU30062⟩

    Accès: https://theses.hal.science/tel-04198849

  • Sebastião Quintas

    Deep learning approaches to assess speech intelligibility of head and neck cancer

    Artificial Intelligence [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. English. ⟨NNT : 2022TOU30272⟩

    Accès: https://theses.hal.science/tel-04094765

  • Estelle Randria

    Compréhensibilité de contenus audiovisuels : quelles approches pour une mesure objective ?

    Informatique [cs]. Université Paul Sabatier (Toulouse 3), 2022. Français. ⟨NNT : 2022TOU30258⟩

    Accès: https://theses.hal.science/tel-04064038

  • Vincent Roger

    Modélisation de l’indice de sévérité du trouble de la parole à l’aide de méthodes d’apprentissage profond : d’une modélisation à partir de quelques exemples à un apprentissage auto-supervisé via une mesure entropique

    Apprentissage [cs.LG]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30180⟩

    Accès: https://theses.hal.science/tel-03935738

  • Lucile Gelin

    Reconnaissance automatique de la parole d’enfants apprenant·e·s lecteur·ice·s en salle de classe : modélisation acoustique de phonèmes

    Intelligence artificielle [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30031⟩

    Accès: https://theses.hal.science/tel-03715653

  • Léo Cances

    Apprentissage profond faiblement supervisé et semi-supervisé pour la détection d’évènements sonores

    Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30262⟩

    Accès: https://theses.hal.science/tel-03683219

  • Timothy Pommée

    Les mesures d’intelligibilité : état de l’art, considérations pratiques pour l’applicabilité clinique et explorations acoustiques

    Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30141⟩

    Accès: https://theses.hal.science/tel-04136563

  • Reports
  • Etienne Sicard, Anne Menin-Sicard

    La diadococinésie et son application en orthophonique clinique

    [Rapport de recherche] INSA 2020, INSA : Institut National des Sciences Appliquées de Toulouse. 2020

    Accès: https://hal.science/hal-02512856

  • Etienne Sicard, Anne Menin-Sicard

    Analyse de la qualité des phrases pour un bilan objectif de la parole

    [Rapport de recherche] INSA Toulouse. 2019

    Accès: https://hal.science/hal-02389764v2

  • Thomas Pellegrini, Céline Manenti, Julien Pinquier

    The IRIT-UPS system @ ZeroSpeech 2017

    [Research Report] IRIT. 2017

    Accès: https://hal.science/hal-03131886

  • Maëlys Salingre, Jérôme Farinas, Stéphane Rabant

    Automatic identification of French regional accent

    [Rapport de recherche] IRIT. 2017

    Accès: https://hal.science/hal-03120304

  • Reports

    team Contracts

    AcronymTitleResp. scStart-End year
    VOICE4PD – MSA anr Diagnostic différentiel entre la maladie de Parkinson et l’atrophie multisystématisée par analyse numérique de la parole

    Julie MAUCLAIR
    2016 – 2024
    PhLEs-NID anr Dispositif non invasif evaluant l’éfficacité pharyngo-laryngée

    Jérôme FARINAS
    2022 – 2026
    CHICA-AI Training CHIldren reading Comprehension skills with Adapted Artificial Intelligence

    Thomas PELLEGRINI
    2023 – 2027
    ANR CONNECTS RUGBI Convention de reversement de fonds dans le cadre du projet ANR CONNECTS – Projet RUGBI

    Jérôme FARINAS
    2024 – 2025
    ADAPT
    [Contract completed]
    AAP Carnot Cognition : Aide à l’Analyse et au DiAgnostic de la Parole pathologique pour les Thérapeutes

    Julien PINQUIER
    2023 – 2023
    PATY
    [Contract completed]
    AAP Carnot Cognition : Plateforme de traitement de parole atypique

    Jérôme FARINAS
    2021 – 2021
    Park-MSA
    [Contract completed]
    AAP Carnot Cognition : Park-MSA

    Julie MAUCLAIR
    2020 – 2021
    2018382
    [Contract completed]
    Google Faculty Research Award : Low-latency online speakerdiarization

    Hervé BREDIN
    2020 – 2022
    ALAIA
    [Contract completed]
    anr Apprentissage des Langues Assisté par Intelligence Artificielle

    Isabelle FERRANÉ
    2019 – 2023
    LinTo
    [Contract completed]
    Assistant vocal open-source respectueux des données personnelles pour l’entreprise

    Isabelle FERRANÉ
    2018 – 2021
    LUDAU
    [Contract completed]
    anr Découverte peu et non-supervisée d’unités audio à l’aide d’apprentissage profond

    Thomas PELLEGRINI
    2018 – 2023
    RUGBI
    [Contract completed]
    anr Recherche d’unités linguistiques pertinentes pour améliorer la mesure de l’intelligibilité de la parole altérée par des troubles de production pathologique

    Jérôme FARINAS
    2018 – 2023
    CIESS
    [Contract completed]
    anr Contribution, indexation, et enrichissement d’un corpus de sons de l’environnement

    Régine ANDRÉ-OBRECHT
    2013 – 2016
    DIADEMS
    [Contract completed]
    anr Description, Indexation, Accés aux Documents Ethnomusicologiques et Sonores

    Régine ANDRÉ-OBRECHT
    2013 – 2016
    AcronymTitleResp. scStart-End year
    pyannote.mobile autre On-device streaming speaker diarization

    Hervé BREDIN
    2024 – 2024
    TAPAS
    [Contract completed]
    Training Network on Automatic Processing of PAthological Speech

    Julie MAUCLAIR
    2017 – 2022
    VICTORIA
    [Contract completed]
    Video analysis for Investigation of Criminal and TerrORIst Activities

    Philippe JOLY
    2017 – 2020
    AcronymTitleResp. scStart-End year
    AUDIOCAP
    [Contract completed]
    Audition et handicap dans le bruit – vers la restauration de l’intelligibilité de la parole

    Julien PINQUIER
    2019 – 2022
    EVOLEX2
    [Contract completed]
    Apport de la reconnaissance vocale pour le diagnostic de dysfonctionnements cognitifs légers

    Julien PINQUIER
    2019 – 2021
    INGPRO
    [Contract completed]
    Recherche et Sociétés : Incidence des gestes sur la prononciation

    Isabelle FERRANÉ
    2019 – 2021
    SAMI
    [Contract completed]
    Allocation Doctorale : Système automatisé de mesure de l’intelligibilité

    Julien PINQUIER
    2018 – 2021
    ECREME
    [Contract completed]
    Allocation Doctorale : Expertises Musicale et Cognitive pour Recommandation Musicale personnaliséE

    Julien PINQUIER
    2017 – 2020
    PHONICS
    [Contract completed]
    CLE : Intelligent Electronic Device for Measuring Speech Comprehension

    Jérôme FARINAS
    2014 – 2018
    Monday 8 July 2024 – Friday 12 July 2024
    Conférence francophone JEP-TALN-RECITAL 2024
    UT2 Jean Jaurès
    #congres Know more
    Wednesday 3 April 2024, 9h00
    Description automatique des événements sonores par des méthodes d’apprentissage profond – CoNeTTE, un système d’Audio Captioning générique
    Etienne LABBÉ – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Friday 15 March 2024, 9h00
    Dilated Convolution with Learnable Spacings (DCLS)
    Ismail KHALFAOUI HASSANI – Team SAMOVA, IRIT Centre de Recherche Cerveau et Cognition (CerCo), Toulouse
    #these
    Monday 11 March 2024, 14h00
    Caractérisation et mesure de la compréhensibilité de la parole de locuteurs non natifs dans le cadre de l’apprentissage des langues
    Verdiana DE FINO – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Tuesday 16 May 2023, 10h00
    Adaptation d’approches connexionnistes non supervisées pour l’analyse de contenus d’images et de sons
    Benjamin CHAMAND – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Tuesday 21 March 2023, 9h00
    Automatic characterisation of speech rhythm: application to Head and Neck cancers and Parkinson’s disease
    Robin VAYSSE – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Wednesday 30 November 2022, 14h00
    Deep Learning Approaches to Assess Speech Intelligibility of Head and Neck Cancers
    Sebastiao QUINTAS – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Monday 17 October 2022, 14h00
    Comprehensibility of audiovisual contents: which approaches for an objective measurement?
    Estelle RANDRIA – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Thursday 29 September 2022, 14h00
    Modeling the severity index of speech impairment using deep learning methods A modeling from few examples to an entropic measure via self-supervised learning
    Vincent ROGER – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Wednesday 2 February 2022, 14h00
    Reconnaissance automatique de la parole d’enfants apprenant·e·s lecteur·ice·s en salle de classe : modélisation acoustique de phonèmes
    Lucile GELIN – Team SAMOVA, IRIT UT3 Paul Sabatier, IMT, Bât 1R3, Amphi. Schwartz
    #these
    Tuesday 14 December 2021, 14h00
    Apprentissage profond faiblement et semi-supervisé pour la détection d’évènements sonores
    Leo CANCES – Team SAMOVA, IRIT UT3 Paul Sabatier, IMT, Bât 1R3, Amphi. Schwartz
    #these
    Monday 8 July 2024 – Friday 12 July 2024
    Conférence francophone JEP-TALN-RECITAL 2024
    UT2 Jean Jaurès
    #congres Know more
    Thursday 9 January 2020 – Friday 10 January 2020
    12th Speech In Noise Workshop
    Hôtel-Dieu Saint-Jacques, Toulouse
    #congres Know more
    Monday 4 July 2016 – Friday 8 July 2016
    Journées d’Etudes sur la Parole
    INALCO, 75013 Paris
    #congres Know more
    Thursday 21 February 2019, 11h00 – 12h00
    Weakly-supervised approaches for sound event detection
    Thomas PELLEGRINI – Team SAMOVA – IRIT (France) INP-ENSEEIHT, Salle des thèses
    #seminaire
    Wednesday 31 August 2016, 10h00 – 12h00
    Advanced human robot social interaction: goals, challenges and approaches
    Sarah COSENTINO – Waseda University (Japon) UT3 Paul Sabatier, IRIT, Salle des Thèses
    #seminaire
    Monday 20 April 2015, 13h30
    Analyse de signaux multi-composantes: avancées théoriques et applications musicales
    Dominique FOURER UT3 Paul Sabatier, IRIT, Salle des Thèses
    #seminaire
    Thursday 21 December 2023, 10h00
    La parole : du traitement automatique à la mesure de l’intelligibilité
    Jérôme FARINAS – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #hdr
    Thursday 15 June 2023 – Saturday 17 June 2023
    9es Journées de Phonétique Clinique (JPC2023)
    UT2 Jean Jaurès, Maison de la Recherche
    #journee
    Thursday 27 May 2021
    Séminaire AFCP — Phonétique Clinique (en remplacement de JPC2021)
    UT3 Paul Sabatier, En visioconférence
    #journee
    Wednesday 4 September 2019 – Friday 6 September 2019
    Training Network on Automatic Processing of PAthological Speech (TAPAS) TE3: Data Collection, Management and Ethical Practices
    UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #journee
    Thursday 4 October 2018
    2018 AIRBUS Air Traffic Control Challenge Workshop
    UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #journee
    Thursday 8 March 2018
    Traitement automatique de la parole et ressources pour la didactique de l’oral en L2 : variation, corpus, techniques
    UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #journee
    Wednesday 4 October 2017
    Workshop Language Didactics, Gestures & CALL
    UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #journee