Thesis: High-density surface electromyography as a method for estimating intrinsic laryngeal muscle activity
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
During speech, the activity and coordination of the intrinsic laryngeal muscles are essential for modulation and control, with the cricothyroid (CT) muscle being primarily responsible for regulating the fundamental frequency during phonation. Currently, methods exist for estimating the activity of these muscles; however, their applicability is limited by the invasive nature of intramuscular electromyography (iEMG) and by the spatial superposition inherent to conventional surface recordings. This thesis proposes and evaluates a non-invasive framework for estimating CT muscle activation using high-density surface electromyography (HDsEMG), supported by synchronized intramuscular recordings as a physiological reference. First, an initial experiment was conducted in which a dataset of simultaneous iEMG and acoustic recordings was established in healthy subjects at the Massachusetts General Hospital (MGH). In this experiment, an acoustic-based normalization strategy anchored to the fundamental frequency (f0) and sound pressure level (SPL) was developed to improve inter-session and inter-task consistency of EMG measurements. These data allowed the creation of a database that served as the gold standard for validating the subsequent results. Subsequently, in a second experiment, 13 patients were recorded at the VPLab laboratory of AC3E, acquiring simultaneous iEMG, HDsEMG, and acoustic signals. The HDsEMG and iEMG signals were decomposed into motor unit discharge trains and validated using a two-source approach with concurrent intramuscular decomposition, enabling the identification of motor units detected by both techniques. The spatial characterization of motor units was performed by estimating the center of gravity and inferring depth based on Gaussian surface fitting, which allowed the separation of superficial and deep activation regions within the CT muscle.For each spatial group, cumulative spike trains (CSTs) were computed and compared with intramuscular EMG envelopes using correlation, coherence, and error metrics. Although the CSTs reliably reproduced temporal trends and shared synaptic input with the iEMG activity, amplitude mismatches were observed, particularly during dynamic phonatory tasks. To address this limitation, a subject-specific neural network was implemented to estimate normalized CT activation by combining CST-derived features with acoustic correlates (f0 and SPL). This data-driven approach improved amplitude estimation while preserving physiologically meaningful temporal dynamics. Overall, the results demonstrate that HDsEMG, when combined with spatially informed processing, acoustic normalization, and machine learning, enables the non-invasive estimation of an intrinsic laryngeal muscle activation, providing a foundation for future studies in voice production modeling and potential clinical assessment.
Durante el habla, la actividad y coordinación de los músculos laríngeos intrínsecos son esenciales para la modulación y el control, siendo el músculo cricotiroideo (CT) el principal responsable de regular la frecuencia fundamental durante la fonación. Actualmente, existen métodos para estimar la actividad de estos músculos; sin embargo, su aplicabilidad se ve limitada por la naturaleza invasiva de la electromiografía intramuscular (iEMG) y por la superposición espacial inherente a los registros de superficie convencionales. Esta tesis propone y evalúa un marco no invasivo para estimar la activación del músculo CT utilizando electromiografía de superficie de alta densidad (HDsEMG), con el apoyo de registros intramusculares sincronizados como referencia fisiológica. En primer lugar, se realizó un experimento inicial en el que se estableció un conjunto de datos de registros acústicos y de iEMG simultáneos en sujetos sanos en el Hospital General de Massachusetts (MGH). En este experimento, se desarrolló una estrategia de normalización acústica anclada a la frecuencia fundamental (f0) y al nivel de presión sonora (SPL) para mejorar la consistencia entre sesiones y entre tareas de las mediciones de EMG. Estos datos permitieron la creación de una base de datos que sirvió como estándar de oro para validar los resultados subsiguientes. Posteriormente, en un segundo experimento, se registraron 13 pacientes en el laboratorio VPLab de AC3E, adquiriendo señales iEMG, HDsEMG y acústicas simultáneas. Las señales HDsEMG e iEMG se descompusieron en trenes de descarga de unidades motoras y se validaron utilizando un enfoque de dos fuentes con descomposición intramuscular concurrente, lo que permitió la identificación de unidades motoras detectadas por ambas técnicas. La caracterización espacial de las unidades motoras se realizó estimando el centro de gravedad e infiriendo la profundidad basada en el ajuste de superficie gaussiana, lo que permitió la separación de regiones de activación superficiales y profundas dentro del músculo CT. Para cada grupo espacial, se calcularon trenes de picos acumulativos (CST) y se compararon con envolventes EMG intramusculares utilizando métricas de correlación, coherencia y error. Aunque los CST reprodujeron de manera confiable las tendencias temporales y compartieron la entrada sináptica con la actividad iEMG, se observaron discrepancias de amplitud, particularmente durante tareas fonatorias dinámicas. Para abordar esta limitación, se implementó una red neuronal específica para cada sujeto con el fin de estimar la activación CT normalizada mediante la combinación de características derivadas de CST con correlatos acústicos (f0 y SPL). Este enfoque basado en datos mejoró la estimación de la amplitud, preservando al mismo tiempo la dinámica temporal fisiológicamente relevante. En general, los resultados demuestran que la HDsEMG, combinada con el procesamiento con información espacial, la normalización acústica y el aprendizaje automático, permite la estimación no invasiva de la activación intrínseca del músculo laríngeo, sentando las bases para futuros estudios en el modelado de la producción de la voz y su posible evaluación clínica.
