Dados do Resumo
Título
Desenvolvimento de modelo preditivo para prognóstico de pacientes com câncer de mama
Introdução
O câncer de mama, responsável por 25% dos casos diagnosticados, apresenta alta mortalidade. O tratamento e prognóstico dependem de características tumorais, como subtipo histológico e estágio. Devido à variabilidade nas respostas ao tratamento, biomarcadores preditivos são essenciais. Este estudo analisou dados retrospectivos de pacientes (2008-2022), avaliando razões leucocitárias e suas implicações clínicas, além de desenvolver um modelo preditivo de recidiva com dados de hemograma.
Objetivo
Geral
Avaliar se os níveis de leucócitos no sangue periférico estão associados ao prognóstico de pacientes com câncer de mama.
Específicos
Avaliar se os níveis de leucócitos e suas razões no diagnóstico e ao longo do tratamento estão associados ao prognóstico de pacientes com câncer de mama.
Métodos
Este estudo retrospectivo analisou dados de pacientes diagnosticadas com câncer de mama no ICESP entre 2008 e 2022. Foram incluídas pacientes com hemogramas completos pré-tratamento e dados clínicos detalhados disponíveis. Critérios de exclusão abrangiam casos com registros incompletos ou inconsistentes, múltiplos tumores primários (exceto câncer de mama bilateral), e pacientes tratadas previamente em outras instituições. Utilizamos análises em Python, empregando bibliotecas como Pandas para manipulação de dados, Matplotlib e Seaborn para visualizações gráficas, e lifelines para análises de sobrevida. O estudo também envolveu o desenvolvimento de um modelo preditivo de ML, utilizando o pacote PyCaret para testar diferentes algoritmos e selecionar o modelo ótimo baseado na acurácia e capacidade de predição de desfechos clínicos.
Resultados
Foram analisados dados de 6.004 pacientes, após a exclusão de registros incompletos, para investigar as razões neutrófilo/linfócito (RNL), plaqueta/linfócito (PLR), monócito/linfócito (MLR) e basófilo/linfócito (BLR) como potenciais marcadores prognósticos. As razões RNL, PLR e MLR apresentaram correlação significativa com a sobrevida, sendo que valores elevados foram associados a um pior prognóstico. Em contraste, a BLR não demonstrou relevância estatística significativa.
Na modelagem preditiva, o algoritmo Gradient Boosting Classifier obteve o melhor desempenho, com AUC de 0.8108, F1 Score de 0.4888 e MCC de 0.4040, indicando um bom equilíbrio entre precisão e recall. O Ada Boost apresentou recall de 0.4706, essencial para minimizar falsos negativos, enquanto o Extra Trees Classifier destacou-se pela maior precisão (0.6678), reduzindo falsos positivos. Esses resultados apontam para a potencial utilidade das razões leucocitárias como marcadores prognósticos no câncer de mama.
Conclusões
Este estudo destacou a relevância das razões RNL, PLR e MLR como biomarcadores prognósticos em câncer de mama, associando suas elevações a pior sobrevida. O uso de modelos preditivos baseados em machine learning, como o Gradient Boosting, demonstrou ser eficaz na estratificação de risco. Esses achados sugerem que a incorporação das razões leucocitárias em modelos clínicos pode aprimorar a precisão prognóstica e apoiar decisões terapêuticas mais personalizadas no manejo do câncer de mama.
Palavras Chave
Cancer de mama; modelo preditivo; biomarcadores
Área
1.Ciência de dados
Autores
PATRICIA HONORATO MOREIRA, Luciana Rodrigues Carvalho Barros, Roger Chammas