Thesis: Evaluación de GPT como oráculo textual para clasificadores de tomografías computarizadas
| datacite.subject.fos | Natural sciences::Computer and information sciences::Computer sciences | |
| datacite.subject.fos | Engineering and technology::Medical engineering::Medical engineering | |
| dc.contributor.correferente | Asin Acha, Roberto Javier | |
| dc.contributor.department | Departamento de Informática | |
| dc.contributor.guia | Ñanculef Alegria, Juan Ricardo | |
| dc.contributor.patrocinante | Dunstan Escudero, Jocelyn Mariel | |
| dc.coverage.spatial | Campus Casa Central Valparaíso | |
| dc.creator | De Ferrari González, Joaquín | |
| dc.date.accessioned | 2026-05-25T14:12:25Z | |
| dc.date.available | 2026-05-25T14:12:25Z | |
| dc.date.issued | 2026-04-15 | |
| dc.description.abstract | La escasez de tomografías computarizadas (TC) de tórax anotadas restringe el entrenamiento de sistemas diagnósticos. Esta investigación evalúa la supervisión débil mediante grandes modelos de lenguaje (LLM) para generar etiquetas clínicas a partir de informes radiológicos. El diseño desacopla la anotación del procesamiento visual. Un oráculo textual (gpt-5-nano) infiere etiquetas sobre un corpus masivo. Luego, clasificadores ligeros operan sobre características latentes extraídas por el codificador congelado de CT-CLIP, lo que elude el entrenamiento end-to-end. El estudio aplica linear probing e inferencia estadística emparejada con validación cruzada para mitigar sesgos de partición. El oráculo alcanzó alta fidelidad (F1-macro 0.8889) y estabilidad (κ = 0.947). En la clasificación visual, la supervisión manual lidera solo en regímenes reducidos (N = 50). Desde N = 100, la supervisión sintética supera estadísticamente a la manual en AUPRC (0.518 frente a 0.499) , y logra un techo asintótico de 0.568 en N = 10000. Al compensar el ruido del etiquetado con un mayor volumen de observaciones, la supervisión débil iguala y supera a la anotación experta bajo restricciones de hardware. No obstante, el estancamiento asintótico confirma un cuello de botella representacional inherente a la separabilidad lineal de las características estáticas de CT-CLIP | es |
| dc.description.abstract | The scarcity of annotated chest computed tomography (CT) scans restricts the training of diagnostic systems. This research evaluates weak supervision using large language models (LLMs) to generate clinical labels from radiology reports. The design decouples annotation from visual processing. A text oracle (gpt-5-nano) infers labels on a massive corpus. Lightweight classifiers then operate on latent features extracted by the CT-CLIP frozen encoder, thus avoiding end-to-end training. The study applies linear probing and paired statistical inference with cross-validation to mitigate partitioning bias. The oracle achieved high fidelity (F1-macro 0.8889) and stability (κ = 0.947). In visual classification, manual supervision leads only in reduced regimes (N = 50). From N = 100, synthetic supervision statistically outperforms manual supervision in AUPRC (0.518 vs. 0.499), reaching an asymptotic ceiling of 0.568 at N = 10,000. By compensating for labeling noise with a larger volume of observations, weak supervision matches and surpasses expert annotation under hardware constraints. However, the asymptotic plateau confirms a representational bottleneck inherent in the linear separability of the static features of CT-CLIP. | en_US |
| dc.description.degree | Magíster en Ciencias de la Ingeniería Informática | |
| dc.description.sponsorship | Universidad Técnica Federico Santa María | |
| dc.description.sponsorship | ANID-Basal Project AFB240002. (traslados) | |
| dc.driver | info:eu-repo/semantics/masterThesis | |
| dc.format.extent | 47 páginas | |
| dc.identifier.doi | 10.71959/daar-xm12 | |
| dc.identifier.uri | https://cris.usm.cl/handle/123456789/4402 | |
| dc.identifier.uri | https://doi.org/10.71959/daar-xm12 | |
| dc.language.iso | es | |
| dc.publisher | Universidad Técnica Federico Santa María | |
| dc.rights | Attribution 4.0 International | en |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
| dc.subject | Inteligencia Artificial | |
| dc.subject | Radiología | |
| dc.subject | Computer Vision | |
| dc.subject | Natural Language Processing | |
| dc.subject | Deep Learning | |
| dc.subject.ods | 3 Salud y bienestar | |
| dc.subject.ods | 10 Reducción de las desigualdades | |
| dc.title | Evaluación de GPT como oráculo textual para clasificadores de tomografías computarizadas | |
| dspace.entity.type | Tesis |
