Thesis:
Evaluación de GPT como oráculo textual para clasificadores de tomografías computarizadas

datacite.subject.fosNatural sciences::Computer and information sciences::Computer sciences
datacite.subject.fosEngineering and technology::Medical engineering::Medical engineering
dc.contributor.correferenteAsin Acha, Roberto Javier
dc.contributor.departmentDepartamento de Informática
dc.contributor.guiaÑanculef Alegria, Juan Ricardo
dc.contributor.patrocinanteDunstan Escudero, Jocelyn Mariel
dc.coverage.spatialCampus Casa Central Valparaíso
dc.creatorDe Ferrari González, Joaquín
dc.date.accessioned2026-05-25T14:12:25Z
dc.date.available2026-05-25T14:12:25Z
dc.date.issued2026-04-15
dc.description.abstractLa escasez de tomografías computarizadas (TC) de tórax anotadas restringe el entrenamiento de sistemas diagnósticos. Esta investigación evalúa la supervisión débil mediante grandes modelos de lenguaje (LLM) para generar etiquetas clínicas a partir de informes radiológicos. El diseño desacopla la anotación del procesamiento visual. Un oráculo textual (gpt-5-nano) infiere etiquetas sobre un corpus masivo. Luego, clasificadores ligeros operan sobre características latentes extraídas por el codificador congelado de CT-CLIP, lo que elude el entrenamiento end-to-end. El estudio aplica linear probing e inferencia estadística emparejada con validación cruzada para mitigar sesgos de partición. El oráculo alcanzó alta fidelidad (F1-macro 0.8889) y estabilidad (κ = 0.947). En la clasificación visual, la supervisión manual lidera solo en regímenes reducidos (N = 50). Desde N = 100, la supervisión sintética supera estadísticamente a la manual en AUPRC (0.518 frente a 0.499) , y logra un techo asintótico de 0.568 en N = 10000. Al compensar el ruido del etiquetado con un mayor volumen de observaciones, la supervisión débil iguala y supera a la anotación experta bajo restricciones de hardware. No obstante, el estancamiento asintótico confirma un cuello de botella representacional inherente a la separabilidad lineal de las características estáticas de CT-CLIPes
dc.description.abstractThe scarcity of annotated chest computed tomography (CT) scans restricts the training of diagnostic systems. This research evaluates weak supervision using large language models (LLMs) to generate clinical labels from radiology reports. The design decouples annotation from visual processing. A text oracle (gpt-5-nano) infers labels on a massive corpus. Lightweight classifiers then operate on latent features extracted by the CT-CLIP frozen encoder, thus avoiding end-to-end training. The study applies linear probing and paired statistical inference with cross-validation to mitigate partitioning bias. The oracle achieved high fidelity (F1-macro 0.8889) and stability (κ = 0.947). In visual classification, manual supervision leads only in reduced regimes (N = 50). From N = 100, synthetic supervision statistically outperforms manual supervision in AUPRC (0.518 vs. 0.499), reaching an asymptotic ceiling of 0.568 at N = 10,000. By compensating for labeling noise with a larger volume of observations, weak supervision matches and surpasses expert annotation under hardware constraints. However, the asymptotic plateau confirms a representational bottleneck inherent in the linear separability of the static features of CT-CLIP.en_US
dc.description.degreeMagíster en Ciencias de la Ingeniería Informática
dc.description.sponsorshipUniversidad Técnica Federico Santa María
dc.description.sponsorshipANID-Basal Project AFB240002. (traslados)
dc.driverinfo:eu-repo/semantics/masterThesis
dc.format.extent47 páginas
dc.identifier.doi10.71959/daar-xm12
dc.identifier.urihttps://cris.usm.cl/handle/123456789/4402
dc.identifier.urihttps://doi.org/10.71959/daar-xm12
dc.language.isoes
dc.publisherUniversidad Técnica Federico Santa María
dc.rightsAttribution 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectInteligencia Artificial
dc.subjectRadiología
dc.subjectComputer Vision
dc.subjectNatural Language Processing
dc.subjectDeep Learning
dc.subject.ods3 Salud y bienestar
dc.subject.ods10 Reducción de las desigualdades
dc.titleEvaluación de GPT como oráculo textual para clasificadores de tomografías computarizadas
dspace.entity.typeTesis

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
MC_JD_2026.pdf
Size:
2.53 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: