Thesis:
Evaluación de GPT como oráculo textual para clasificadores de tomografías computarizadas

Simple item page

datacite.subject.fos	Natural sciences::Computer and information sciences::Computer sciences
datacite.subject.fos	Engineering and technology::Medical engineering::Medical engineering
dc.contributor.correferente	Asin Acha, Roberto Javier
dc.contributor.department	Departamento de Informática
dc.contributor.guia	Ñanculef Alegria, Juan Ricardo
dc.contributor.patrocinante	Dunstan Escudero, Jocelyn Mariel
dc.coverage.spatial	Campus Casa Central Valparaíso
dc.creator	De Ferrari González, Joaquín
dc.date.accessioned	2026-05-25T14:12:25Z
dc.date.available	2026-05-25T14:12:25Z
dc.date.issued	2026-04-15
dc.description.abstract	La escasez de tomografías computarizadas (TC) de tórax anotadas restringe el entrenamiento de sistemas diagnósticos. Esta investigación evalúa la supervisión débil mediante grandes modelos de lenguaje (LLM) para generar etiquetas clínicas a partir de informes radiológicos. El diseño desacopla la anotación del procesamiento visual. Un oráculo textual (gpt-5-nano) infiere etiquetas sobre un corpus masivo. Luego, clasificadores ligeros operan sobre características latentes extraídas por el codificador congelado de CT-CLIP, lo que elude el entrenamiento end-to-end. El estudio aplica linear probing e inferencia estadística emparejada con validación cruzada para mitigar sesgos de partición. El oráculo alcanzó alta fidelidad (F1-macro 0.8889) y estabilidad (κ = 0.947). En la clasificación visual, la supervisión manual lidera solo en regímenes reducidos (N = 50). Desde N = 100, la supervisión sintética supera estadísticamente a la manual en AUPRC (0.518 frente a 0.499) , y logra un techo asintótico de 0.568 en N = 10000. Al compensar el ruido del etiquetado con un mayor volumen de observaciones, la supervisión débil iguala y supera a la anotación experta bajo restricciones de hardware. No obstante, el estancamiento asintótico confirma un cuello de botella representacional inherente a la separabilidad lineal de las características estáticas de CT-CLIP	es
dc.description.abstract	The scarcity of annotated chest computed tomography (CT) scans restricts the training of diagnostic systems. This research evaluates weak supervision using large language models (LLMs) to generate clinical labels from radiology reports. The design decouples annotation from visual processing. A text oracle (gpt-5-nano) infers labels on a massive corpus. Lightweight classifiers then operate on latent features extracted by the CT-CLIP frozen encoder, thus avoiding end-to-end training. The study applies linear probing and paired statistical inference with cross-validation to mitigate partitioning bias. The oracle achieved high fidelity (F1-macro 0.8889) and stability (κ = 0.947). In visual classification, manual supervision leads only in reduced regimes (N = 50). From N = 100, synthetic supervision statistically outperforms manual supervision in AUPRC (0.518 vs. 0.499), reaching an asymptotic ceiling of 0.568 at N = 10,000. By compensating for labeling noise with a larger volume of observations, weak supervision matches and surpasses expert annotation under hardware constraints. However, the asymptotic plateau confirms a representational bottleneck inherent in the linear separability of the static features of CT-CLIP.	en_US
dc.description.degree	Magíster en Ciencias de la Ingeniería Informática
dc.description.sponsorship	Universidad Técnica Federico Santa María
dc.description.sponsorship	ANID-Basal Project AFB240002. (traslados)
dc.driver	info:eu-repo/semantics/masterThesis
dc.format.extent	47 páginas
dc.identifier.doi	10.71959/daar-xm12
dc.identifier.uri	https://cris.usm.cl/handle/123456789/4402
dc.identifier.uri	https://doi.org/10.71959/daar-xm12
dc.language.iso	es
dc.publisher	Universidad Técnica Federico Santa María
dc.rights	Attribution 4.0 International	en
dc.rights.uri	http://creativecommons.org/licenses/by/4.0/
dc.subject	Inteligencia Artificial
dc.subject	Radiología
dc.subject	Computer Vision
dc.subject	Natural Language Processing
dc.subject	Deep Learning
dc.subject.ods	3 Salud y bienestar
dc.subject.ods	10 Reducción de las desigualdades
dc.title	Evaluación de GPT como oráculo textual para clasificadores de tomografías computarizadas
dspace.entity.type	Tesis

Files

Original bundle

Now showing 1 - 1 of 1

Name:: MC_JD_2026.pdf
Size:: 2.53 MB
Format:: Adobe Portable Document Format

Download

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 1.71 KB
Format:: Item-specific license agreed to upon submission
Description:

Download

Collections

Tesis de Postgrado

Thesis:
Evaluación de GPT como oráculo textual para clasificadores de tomografías computarizadas

Files

Original bundle

License bundle

Collections

UNIVERSIDAD

CAMPUS Y SEDES

EXTENSIÓN Y CULTURA

SERVICIOS

Thesis: Evaluación de GPT como oráculo textual para clasificadores de tomografías computarizadas

Files

Original bundle

License bundle

Collections

UNIVERSIDAD

CAMPUS Y SEDES

EXTENSIÓN Y CULTURA

SERVICIOS

Thesis:
Evaluación de GPT como oráculo textual para clasificadores de tomografías computarizadas