| Title: | Uma nova metodologia de aprendizado de máquina para detecção de displasia epitelial em lesões de leucoplasia oral |
| Author: | Rocha, Karoline da |
| Abstract: |
O carcinoma epidermóide de cavidade oral (OSCC, do inglês oral squamous cell carcinoma) é o câncer bucal mais comum e apresenta alta taxa de mortalidade, o que torna seu diagnóstico precoce fundamental para um prognóstico favorável e um tratamento eficaz. A transformação maligna é um processo gradual, geralmente precedido por desordens orais potencialmente malignas (OPMDs, do inglês oral potentially malignant disorders), sendo a leucoplasia oral a lesão mais prevalente. Histologicamente, essas lesões podem apresentar displasia epitelial (DE), cuja detecção é um fator crítico na avaliação do risco de progressão para OSCC. O diagnóstico da DE é realizado por patologistas orais com base na análise das imagens histopatológicas, em associação as informações clínicas e de anamnese presentes na ficha de biópsia. No entanto, esse processo é subjetivo, depende da experiência e do estado emocional do profissional. Assim, métodos baseados em aprendizado de máquina (ML, do inglês Machine Learning) surgem como ferramentas importantes para auxiliar o diagnóstico. Este estudo propõe uma nova metodologia baseada em ML que integra dados clínicos e de anamnese com a análise de imagens histopatológicas para a detecção de DE em lesões de leucoplasia. A abordagem envolve três etapas de classificação. Inicialmente, são extraídos recortes do epitélio selecionados com base na expertise do patologista, associadas a um fator de risco derivado dos dados complementares do paciente, compondo o conjunto de entrada utilizado para treinar uma RNA MLP. Esse modelo alcançou acurácia média de 88,05% e AUC superior a 0,93 na classificação dos casos. Na terceira etapa, um classificador baseado em k-NN é usado para reclassificar os recortes com base na sua localização espacial. Essa etapa demonstrou potencial de melhoria do desempenho, especialmente em cenários com classificações confiáveis. Além disso, comparou-se o desempenho do processo de classificação proposto com o de uma CNN pré-treinada (ResNet-50V2). Não foram encontradas diferenças estatisticamente significativas entre as duas abordagens, conforme o teste de McNemar, sendo que a metodologia proposta apresentou um tempo de inferência cerca de 9,7 vezes menor. Assim, com possíveis refinamentos no critério de confiança na segunda etapa de classificação, a metodologia proposta se mostra uma solução robusta, eficiente e de baixo custo computacional para o apoio ao diagnóstico de DE em lesões de leucoplasia oral. Abstract: The oral squamous cell carcinoma (OSCC) is the most common oral cancer with a high mortality rate, making early diagnosis essential for favorable prognosis and effective treatment. Malignant transformation is a gradual process, usually preceded by oral potentially malignant disorders (OPMDs), among which oral leukoplakia is the most prevalent lesion. Histologically, these lesions may present epithelial dysplasia (ED), the detection of which is a critical factor in assessing the risk of progression to OSCC. The diagnosis of ED is performed by oral pathologists based on the analysis of histopathological images, in association with clinical and anamnesis data available in the biopsy report. However, this process is subjective, dependent on the experience and emotional state of the professional. In this context, methods based on machine learning (ML) have emerged as valuable tools to support diagnosis. This study proposes a novel methodology based on ML that integrates clinical and anamnesis data with the analysis of histopathological images for the detection of ED in leukoplakia lesions. The approach involves three classification stages. Initially, image patches from the epithelium are extracted based on the expertise of a pathologist and associated with a risk factor derived from the patient?s complementary data, forming the input used to train an MLP neural network. This model achieved an average accuracy of 88.05% and an AUC greater than 0.93 in classifying the cases. In the third stage, a classifier based on k-NN is employed to reclassify the patches based on their spatial location. This step demonstrated potential for performance improvement, especially in scenarios with reliable classifications. In addition, the performance of the proposed classification process was compared to that of a pretrained CNN (ResNet-50V2). No statistically significant differences were found between the two approaches according to McNemar?s test, with the proposed methodology showing an inference time approximately 9.7 times faster. Therefore, with possible refinements in the confidence criterion used in the second classification stage, the proposed methodology proves to be a robust, efficient, and computationally inexpensive solution to support the diagnosis of ED in oral leukoplakia lesions. |
| Description: | Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2025. |
| URI: | https://repositorio.ufsc.br/handle/123456789/269445 |
| Date: | 2025 |
| Files | Size | Format | View |
|---|---|---|---|
| PEEL2251-T.pdf | 15.59Mb |
View/ |