• nós

Validação de um modelo de mineração de dados contra métodos tradicionais de estimativa de idade dentária entre adolescentes e adultos jovens coreanos

Obrigado por visitar Nature.com.A versão do navegador que você está usando tem suporte CSS limitado.Para obter melhores resultados, recomendamos usar uma versão mais recente do seu navegador (ou desativar o modo de compatibilidade no Internet Explorer).Enquanto isso, para garantir suporte contínuo, mostramos o site sem estilo ou JavaScript.
Os dentes são considerados o indicador mais preciso da idade do corpo humano e são frequentemente utilizados na avaliação forense da idade.Nosso objetivo foi validar estimativas de idade dentária baseadas em mineração de dados, comparando a precisão da estimativa e o desempenho da classificação do limite de 18 anos com métodos tradicionais e estimativas de idade baseadas em mineração de dados.Um total de 2.657 radiografias panorâmicas foram coletadas de cidadãos coreanos e japoneses com idades entre 15 e 23 anos.Eles foram divididos em um conjunto de treinamento, cada um contendo 900 radiografias coreanas, e um conjunto de teste interno contendo 857 radiografias japonesas.Comparamos a precisão e a eficiência da classificação dos métodos tradicionais com conjuntos de testes de modelos de mineração de dados.A precisão do método tradicional no conjunto de testes internos é ligeiramente superior à do modelo de mineração de dados, e a diferença é pequena (erro médio absoluto <0,21 anos, raiz do erro quadrático médio <0,24 anos).O desempenho da classificação para o corte de 18 anos também é semelhante entre métodos tradicionais e modelos de mineração de dados.Assim, os métodos tradicionais podem ser substituídos por modelos de mineração de dados ao realizar a avaliação forense da idade utilizando a maturidade dos segundos e terceiros molares em adolescentes e adultos jovens coreanos.
A estimativa da idade dentária é amplamente utilizada em medicina legal e odontopediatria.Em particular, devido à alta correlação entre idade cronológica e desenvolvimento dentário, a avaliação da idade por estágios de desenvolvimento dentário é um critério importante para avaliar a idade de crianças e adolescentes1,2,3.Porém, para os jovens, estimar a idade dentária com base na maturidade dentária tem suas limitações porque o crescimento dentário é quase completo, com exceção dos terceiros molares.O objetivo legal da determinação da idade de jovens e adolescentes é fornecer estimativas precisas e evidências científicas sobre se eles atingiram a maioridade.Na prática médico-legal de adolescentes e adultos jovens na Coreia, a idade foi estimada pelo método de Lee, e um limite legal de 18 anos foi previsto com base nos dados relatados por Oh e cols. 5 .
O aprendizado de máquina é um tipo de inteligência artificial (IA) que aprende e classifica repetidamente grandes quantidades de dados, resolve problemas por conta própria e orienta a programação de dados.O aprendizado de máquina pode descobrir padrões ocultos úteis em grandes volumes de dados6.Em contrapartida, os métodos clássicos, que são trabalhosos e demorados, podem ter limitações ao lidar com grandes volumes de dados complexos e difíceis de processar manualmente7.Portanto, muitos estudos foram realizados recentemente utilizando as mais recentes tecnologias computacionais para minimizar erros humanos e processar dados multidimensionais de forma eficiente8,9,10,11,12.Em particular, a aprendizagem profunda tem sido amplamente utilizada na análise de imagens médicas, e foi relatado que vários métodos para estimativa de idade através da análise automática de radiografias melhoram a precisão e a eficiência da estimativa de idade13,14,15,16,17,18,19,20 .Por exemplo, Halabi et al 13 desenvolveram um algoritmo de aprendizado de máquina baseado em redes neurais convolucionais (CNN) para estimar a idade do esqueleto usando radiografias das mãos de crianças.Este estudo propõe um modelo que aplica aprendizado de máquina a imagens médicas e mostra que esses métodos podem melhorar a precisão do diagnóstico.Li et al14 estimaram a idade a partir de imagens de raios X pélvicos usando uma CNN de aprendizagem profunda e compararam-nas com resultados de regressão usando estimativa do estágio de ossificação.Eles descobriram que o modelo CNN de aprendizagem profunda mostrou o mesmo desempenho de estimativa de idade que o modelo de regressão tradicional.O estudo de Guo et al. [15] avaliou o desempenho da classificação de tolerância à idade da tecnologia CNN com base em ortofotos dentárias, e os resultados do modelo CNN provaram que os humanos superaram o desempenho da classificação de idade.
A maioria dos estudos sobre estimativa de idade utilizando aprendizado de máquina utiliza métodos de aprendizagem profunda13,14,15,16,17,18,19,20.A estimativa de idade baseada no aprendizado profundo é considerada mais precisa do que os métodos tradicionais.No entanto, esta abordagem oferece poucas oportunidades para apresentar a base científica para estimativas de idade, tais como os indicadores de idade utilizados nas estimativas.Há também uma disputa legal sobre quem conduz as inspeções.Portanto, a estimativa da idade baseada na aprendizagem profunda é difícil de aceitar pelas autoridades administrativas e judiciais.A mineração de dados (DM) é uma técnica que pode descobrir não apenas informações esperadas, mas também inesperadas, como método para descobrir correlações úteis entre grandes quantidades de dados6,21,22.O aprendizado de máquina é frequentemente usado na mineração de dados, e tanto a mineração de dados quanto o aprendizado de máquina usam os mesmos algoritmos principais para descobrir padrões nos dados.A estimativa da idade utilizando o desenvolvimento dentário é baseada na avaliação do examinador sobre a maturidade dos dentes alvo, e esta avaliação é expressa como um estágio para cada dente alvo.O DM pode ser utilizado para analisar a correlação entre o estágio de avaliação odontológica e a idade real e tem potencial para substituir a análise estatística tradicional.Portanto, se aplicarmos técnicas de DM à estimativa de idade, podemos implementar o aprendizado de máquina na estimativa de idade forense sem nos preocupar com responsabilidade legal.Vários estudos comparativos foram publicados sobre possíveis alternativas aos métodos manuais tradicionais utilizados na prática forense e métodos baseados em EBM para determinar a idade dentária.Shen et al23 mostraram que o modelo DM é mais preciso que a fórmula tradicional de Camerer.Galibourg et al24 aplicaram diferentes métodos de DM para prever a idade segundo o critério Demirdjian25 e os resultados mostraram que o método DM superou os métodos Demirdjian e Willems na estimativa da idade da população francesa.
Para estimar a idade dentária de adolescentes e adultos jovens coreanos, o método 4 de Lee é amplamente utilizado na prática forense coreana.Este método utiliza análise estatística tradicional (como regressão múltipla) para examinar a relação entre os indivíduos coreanos e a idade cronológica.Neste estudo, os métodos de estimativa de idade obtidos por meio de métodos estatísticos tradicionais são definidos como “métodos tradicionais”.O método de Lee é um método tradicional e sua precisão foi confirmada por Oh et al.5;entretanto, a aplicabilidade da estimativa de idade baseada no modelo DM na prática forense coreana ainda é questionável.Nosso objetivo foi validar cientificamente a utilidade potencial da estimativa de idade baseada no modelo DM.O objetivo deste estudo foi (1) comparar a precisão de dois modelos de DM na estimativa da idade dentária e (2) comparar o desempenho de classificação de 7 modelos de DM aos 18 anos com aqueles obtidos por métodos estatísticos tradicionais. e terceiros molares em ambos os maxilares.
Médias e desvios padrão da idade cronológica por estágio e tipo de dente são mostrados on-line na Tabela Suplementar S1 (conjunto de treinamento), Tabela Suplementar S2 (conjunto de teste interno) e Tabela Suplementar S3 (conjunto de teste externo).Os valores kappa para confiabilidade intra e interobservador obtidos no conjunto de treinamento foram 0,951 e 0,947, respectivamente.Os valores de P e os intervalos de confiança de 95% para os valores kappa são mostrados na tabela suplementar online S4.O valor kappa foi interpretado como “quase perfeito”, consistente com os critérios de Landis e Koch26.
Ao comparar o erro médio absoluto (MAE), o método tradicional supera ligeiramente o modelo DM para todos os gêneros e no conjunto de teste externo masculino, com exceção do perceptron multicamadas (MLP).A diferença entre o modelo tradicional e o modelo DM no conjunto de testes internos do MAE foi de 0,12–0,19 anos para homens e 0,17–0,21 anos para mulheres.Para a bateria de testes externos, as diferenças são menores (0,001–0,05 anos para homens e 0,05–0,09 anos para mulheres).Além disso, a raiz do erro quadrático médio (RMSE) é ligeiramente inferior ao método tradicional, com diferenças menores (0,17–0,24, 0,2–0,24 para o conjunto de teste interno masculino e 0,03–0,07, 0,04–0,08 para o conjunto de teste externo).).O MLP apresenta desempenho ligeiramente melhor que o Single Layer Perceptron (SLP), exceto no caso do conjunto de teste externo feminino.Para MAE e RMSE, o conjunto de testes externos obteve pontuações superiores às do conjunto de testes internos para todos os géneros e modelos.Todos os MAE e RMSE são mostrados na Tabela 1 e na Figura 1.
MAE e RMSE de modelos de regressão tradicionais e de mineração de dados.Erro médio absoluto MAE, raiz do erro quadrático médio RMSE, perceptron SLP de camada única, perceptron multicamadas MLP, método CM tradicional.
O desempenho da classificação (com ponto de corte de 18 anos) dos modelos tradicional e DM foi demonstrado em termos de sensibilidade, especificidade, valor preditivo positivo (VPP), valor preditivo negativo (VPN) e área sob a curva característica de operação do receptor (AUROC) 27 (Tabela 2, Figura 2 e Figura Suplementar 1 online).Em termos de sensibilidade da bateria interna de testes, os métodos tradicionais tiveram melhor desempenho entre os homens e pior entre as mulheres.No entanto, a diferença no desempenho da classificação entre os métodos tradicionais e o SD é de 9,7% para os homens (MLP) e de apenas 2,4% para as mulheres (XGBoost).Entre os modelos de DM, a regressão logística (LR) apresentou melhor sensibilidade em ambos os sexos.Quanto à especificidade do conjunto de testes interno, observou-se que os quatro modelos SD tiveram bom desempenho no sexo masculino, enquanto o modelo tradicional teve melhor desempenho no sexo feminino.As diferenças no desempenho de classificação para homens e mulheres são de 13,3% (MLP) e 13,1% (MLP), respectivamente, indicando que a diferença no desempenho de classificação entre os modelos excede a sensibilidade.Entre os modelos DM, os modelos de máquina de vetores de suporte (SVM), árvore de decisão (DT) e floresta aleatória (RF) tiveram melhor desempenho entre os homens, enquanto o modelo LR teve melhor desempenho entre as mulheres.A AUROC do modelo tradicional e de todos os modelos SD foi superior a 0,925 (k-vizinho mais próximo (KNN) em homens), demonstrando excelente desempenho de classificação na discriminação de amostras de 18 anos28.Para o conjunto de testes externo, houve uma diminuição no desempenho da classificação em termos de sensibilidade, especificidade e AUROC em comparação com o conjunto de testes interno.Além disso, a diferença na sensibilidade e especificidade entre o desempenho da classificação dos melhores e piores modelos variou de 10% a 25% e foi maior que a diferença no conjunto de testes interno.
Sensibilidade e especificidade dos modelos de classificação de mineração de dados em comparação com métodos tradicionais com corte de 18 anos.KNN k vizinho mais próximo, máquina de vetores de suporte SVM, regressão logística LR, árvore de decisão DT, floresta aleatória RF, XGB XGBoost, perceptron multicamadas MLP, método CM tradicional.
O primeiro passo deste estudo foi comparar a acurácia das estimativas de idade dentária obtidas a partir de sete modelos de DM com aquelas obtidas por meio de regressão tradicional.O MAE e o RMSE foram avaliados em conjuntos de testes internos para ambos os sexos, e a diferença entre o método tradicional e o modelo DM variou de 44 a 77 dias para o MAE e de 62 a 88 dias para o RMSE.Embora o método tradicional tenha sido um pouco mais preciso neste estudo, é difícil concluir se uma diferença tão pequena tem significado clínico ou prático.Esses resultados indicam que a precisão da estimativa da idade dentária usando o modelo DM é quase a mesma do método tradicional.A comparação direta com resultados de estudos anteriores é difícil porque nenhum estudo comparou a precisão dos modelos de DM com métodos estatísticos tradicionais usando a mesma técnica de registro de dentes na mesma faixa etária deste estudo.Galibourg et al24 compararam MAE e RMSE entre dois métodos tradicionais (método Demirjian25 e método Willems29) e 10 modelos de DM em uma população francesa de 2 a 24 anos.Eles relataram que todos os modelos de DM foram mais precisos que os métodos tradicionais, com diferenças de 0,20 e 0,38 anos no MAE e 0,25 e 0,47 anos no RMSE em comparação aos métodos Willems e Demirdjian, respectivamente.A discrepância entre o modelo SD e os métodos tradicionais mostrada no estudo de Halibourg leva em consideração numerosos relatos30,31,32,33 de que o método Demirdjian não estima com precisão a idade dentária em populações que não sejam os franco-canadenses nos quais o estudo foi baseado.neste estudo.Tai et al 34 usaram o algoritmo MLP para prever a idade dentária a partir de 1.636 fotografias ortodônticas chinesas e compararam sua precisão com os resultados do método Demirjian e Willems.Eles relataram que o MLP tem maior precisão do que os métodos tradicionais.A diferença entre o método Demirdjian e o método tradicional é <0,32 anos, e o método Willems é de 0,28 anos, o que é semelhante aos resultados do presente estudo.Os resultados desses estudos anteriores24,34 também são consistentes com os resultados do presente estudo, e a acurácia da estimativa de idade do modelo de DM e do método tradicional são semelhantes.Contudo, com base nos resultados apresentados, só podemos concluir com cautela que a utilização de modelos de DM para estimar a idade pode substituir os métodos existentes devido à falta de estudos anteriores comparativos e de referência.Estudos de acompanhamento utilizando amostras maiores são necessários para confirmar os resultados obtidos neste estudo.
Entre os estudos que testaram a acurácia do DP na estimativa da idade dentária, alguns apresentaram maior acurácia que o nosso estudo.Stepanovsky et al 35 aplicaram 22 modelos SD a radiografias panorâmicas de 976 residentes checos com idades entre 2,7 e 20,5 anos e testaram a precisão de cada modelo.Avaliaram o desenvolvimento de um total de 16 dentes permanentes superiores e inferiores esquerdos utilizando os critérios de classificação propostos por Moorrees et al 36 .O MAE varia de 0,64 a 0,94 anos e o RMSE varia de 0,85 a 1,27 anos, que são mais precisos que os dois modelos de DM utilizados neste estudo.Shen et al23 utilizaram o método Cameriere para estimar a idade dentária de sete dentes permanentes na mandíbula esquerda em residentes do leste da China com idade entre 5 e 13 anos e compararam com idades estimadas por regressão linear, SVM e FR.Eles mostraram que todos os três modelos DM têm maior precisão em comparação com a fórmula tradicional de Cameriere.O MAE e o RMSE no estudo de Shen foram inferiores aos do modelo DM deste estudo.O aumento da precisão dos estudos de Stepanovsky et al.35 e Shen et al.23 pode ser devido à inclusão de indivíduos mais jovens nas amostras do estudo.Como as estimativas de idade para participantes com dentes em desenvolvimento tornam-se mais precisas à medida que o número de dentes aumenta durante o desenvolvimento dentário, a precisão do método de estimativa de idade resultante pode ser comprometida quando os participantes do estudo são mais jovens.Além disso, o erro do MLP na estimativa da idade é ligeiramente menor que o do SLP, o que significa que o MLP é mais preciso que o SLP.O MLP é considerado um pouco melhor para estimativa de idade, possivelmente devido às camadas ocultas do MLP38.Contudo, há uma exceção para a amostra externa de mulheres (SLP 1,45, MLP 1,49).A constatação de que o MLP é mais preciso que o SLP na avaliação da idade requer estudos retrospectivos adicionais.
O desempenho de classificação do modelo DM e do método tradicional no limiar de 18 anos também foi comparado.Todos os modelos SD testados e métodos tradicionais no conjunto de testes interno apresentaram níveis de discriminação praticamente aceitáveis ​​para a amostra de 18 anos.A sensibilidade para homens e mulheres foi superior a 87,7% e 94,9%, respectivamente, e a especificidade foi superior a 89,3% e 84,7%.O AUROC de todos os modelos testados também excede 0,925.Até onde sabemos, nenhum estudo testou o desempenho do modelo DM para classificação de 18 anos com base na maturidade dentária.Podemos comparar os resultados deste estudo com o desempenho de classificação de modelos de aprendizagem profunda em radiografias panorâmicas.Guo et al.15 calcularam o desempenho de classificação de um modelo de aprendizagem profunda baseado em CNN e de um método manual baseado no método de Demirjian para um determinado limite de idade.A sensibilidade e especificidade do método manual foram de 87,7% e 95,5%, respectivamente, e a sensibilidade e especificidade do modelo CNN ultrapassaram 89,2% e 86,6%, respectivamente.Eles concluíram que os modelos de aprendizagem profunda podem substituir ou superar a avaliação manual na classificação dos limites de idade.Os resultados deste estudo mostraram desempenho de classificação semelhante;Acredita-se que a classificação por meio de modelos de DM possa substituir os métodos estatísticos tradicionais para estimativa de idade.Dentre os modelos, o DM LR foi o melhor modelo em termos de sensibilidade para a amostra masculina e sensibilidade e especificidade para a amostra feminina.LR ocupa o segundo lugar em especificidade para homens.Além disso, o LR é considerado um dos modelos DM35 mais fáceis de usar e é menos complexo e difícil de processar.Com base nesses resultados, a LR foi considerada o melhor modelo de classificação de corte para jovens de 18 anos na população coreana.
No geral, a precisão da estimativa da idade ou do desempenho da classificação no conjunto de testes externo foi fraca ou inferior em comparação com os resultados do conjunto de testes interno.Alguns relatórios indicam que a precisão ou eficiência da classificação diminui quando estimativas de idade baseadas na população coreana são aplicadas à população japonesa5,39, e um padrão semelhante foi encontrado no presente estudo.Esta tendência de deterioração também foi observada no modelo DM.Portanto, para estimar a idade com precisão, mesmo utilizando o DM no processo de análise, devem ser preferidos métodos derivados de dados da população nativa, como os métodos tradicionais5,39,40,41,42.Como não está claro se os modelos de aprendizagem profunda podem mostrar tendências semelhantes, são necessários estudos que comparem a precisão e a eficiência da classificação usando métodos tradicionais, modelos de DM e modelos de aprendizagem profunda nas mesmas amostras para confirmar se a inteligência artificial pode superar essas disparidades raciais em idades limitadas.avaliações.
Demonstramos que os métodos tradicionais podem ser substituídos pela estimativa de idade baseada no modelo DM na prática forense de estimativa de idade na Coréia.Também descobrimos a possibilidade de implementar aprendizado de máquina para avaliação forense de idade.No entanto, existem limitações claras, como o número insuficiente de participantes neste estudo para determinar definitivamente os resultados e a falta de estudos anteriores para comparar e confirmar os resultados deste estudo.No futuro, estudos sobre DM deverão ser realizados com maior número de amostras e populações mais diversificadas para melhorar sua aplicabilidade prática em comparação com métodos tradicionais.Para validar a viabilidade do uso de inteligência artificial para estimar a idade em múltiplas populações, são necessários estudos futuros para comparar a precisão e a eficiência da classificação do DM e dos modelos de aprendizagem profunda com métodos tradicionais nas mesmas amostras.
O estudo utilizou 2.657 fotografias ortográficas coletadas de adultos coreanos e japoneses com idades entre 15 e 23 anos.As radiografias coreanas foram divididas em 900 conjuntos de treinamento (19,42 ± 2,65 anos) e 900 conjuntos de testes internos (19,52 ± 2,59 anos).O conjunto de treinamento foi coletado em uma instituição (Hospital St. Mary de Seul), e o próprio conjunto de teste foi coletado em duas instituições (Hospital Odontológico da Universidade Nacional de Seul e Hospital Odontológico da Universidade Yonsei).Também coletamos 857 radiografias de outros dados populacionais (Iwate Medical University, Japão) para testes externos.Radiografias de indivíduos japoneses (19,31 ± 2,60 anos) foram selecionadas como conjunto de teste externo.Os dados foram coletados retrospectivamente para analisar os estágios de desenvolvimento dentário em radiografias panorâmicas realizadas durante o tratamento odontológico.Todos os dados coletados foram anônimos, exceto sexo, data de nascimento e data da radiografia.Os critérios de inclusão e exclusão foram os mesmos de estudos publicados anteriormente 4 , 5 .A idade real da amostra foi calculada subtraindo a data de nascimento da data em que a radiografia foi tirada.O grupo amostral foi dividido em nove faixas etárias.As distribuições de idade e sexo são mostradas na Tabela 3. Este estudo foi conduzido de acordo com a Declaração de Helsinque e aprovado pelo Conselho de Revisão Institucional (IRB) do Hospital St. Mary de Seul da Universidade Católica da Coreia (KC22WISI0328).Devido ao desenho retrospectivo deste estudo, o consentimento informado não pôde ser obtido de todos os pacientes submetidos a exames radiográficos para fins terapêuticos.O Hospital St. Mary's (IRB) da Universidade da Coreia de Seul dispensou a exigência de consentimento informado.
Os estágios de desenvolvimento dos segundos e terceiros molares bimaxilares foram avaliados de acordo com os critérios de Demircan25.Apenas um dente foi selecionado se o mesmo tipo de dente fosse encontrado nos lados esquerdo e direito de cada mandíbula.Se os dentes homólogos de ambos os lados estivessem em diferentes estágios de desenvolvimento, o dente com o menor estágio de desenvolvimento seria selecionado para levar em conta a incerteza na idade estimada.Cem radiografias selecionadas aleatoriamente do conjunto de treinamento foram pontuadas por dois observadores experientes para testar a confiabilidade interobservador após a pré-calibração para determinar o estágio de maturidade dentária.A confiabilidade intraobservador foi avaliada duas vezes em intervalos de três meses pelo observador primário.
O sexo e o estágio de desenvolvimento dos segundos e terceiros molares de cada mandíbula no conjunto de treinamento foram estimados por um observador primário treinado com diferentes modelos de DM, e a idade real foi definida como valor alvo.Os modelos SLP e MLP, amplamente utilizados em aprendizado de máquina, foram testados em algoritmos de regressão.O modelo DM combina funções lineares utilizando os estágios de desenvolvimento dos quatro dentes e combina esses dados para estimar a idade.SLP é a rede neural mais simples e não contém camadas ocultas.O SLP funciona com base na transmissão de limite entre nós.O modelo SLP em regressão é matematicamente semelhante à regressão linear múltipla.Ao contrário do modelo SLP, o modelo MLP possui múltiplas camadas ocultas com funções de ativação não lineares.Nossos experimentos usaram uma camada oculta com apenas 20 nós ocultos com funções de ativação não lineares.Use gradiente descendente como método de otimização e MAE e RMSE como função de perda para treinar nosso modelo de aprendizado de máquina.O melhor modelo de regressão obtido foi aplicado aos conjuntos de testes internos e externos e a idade dos dentes foi estimada.
Foi desenvolvido um algoritmo de classificação que utiliza a maturidade de quatro dentes no conjunto de treinamento para prever se uma amostra tem 18 anos ou não.Para construir o modelo, derivamos sete algoritmos de aprendizado de máquina de representação6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost e (7) MLP .LR é um dos algoritmos de classificação mais utilizados44.É um algoritmo de aprendizagem supervisionada que utiliza regressão para prever a probabilidade de dados pertencentes a uma determinada categoria de 0 a 1 e classifica os dados como pertencentes a uma categoria mais provável com base nesta probabilidade;usado principalmente para classificação binária.KNN é um dos algoritmos de aprendizado de máquina mais simples45.Ao receber novos dados de entrada, ele encontra k dados próximos ao conjunto existente e então os classifica na classe com a frequência mais alta.Definimos 3 para o número de vizinhos considerados (k).SVM é um algoritmo que maximiza a distância entre duas classes usando uma função de kernel para expandir o espaço linear em um espaço não linear chamado campos46.Para este modelo, usamos polarização = 1, potência = 1 e gama = 1 como hiperparâmetros para o kernel polinomial.A DT tem sido aplicada em vários campos como um algoritmo para dividir um conjunto inteiro de dados em vários subgrupos, representando regras de decisão em uma estrutura em árvore47.O modelo é configurado com número mínimo de registros por nó igual a 2 e utiliza o índice de Gini como medida de qualidade.RF é um método conjunto que combina vários DTs para melhorar o desempenho usando um método de agregação bootstrap que gera um classificador fraco para cada amostra, extraindo aleatoriamente amostras do mesmo tamanho várias vezes do conjunto de dados original .Usamos 100 árvores, 10 profundidades de árvore, 1 tamanho mínimo de nó e índice de mistura de Gini como critérios de separação de nós.A classificação dos novos dados é determinada por maioria de votos.XGBoost é um algoritmo que combina técnicas de boosting usando um método que toma como dados de treinamento o erro entre os valores reais e previstos do modelo anterior e aumenta o erro usando gradientes49.É um algoritmo amplamente utilizado devido ao seu bom desempenho e eficiência de recursos, além de alta confiabilidade como função de correção de overfitting.O modelo está equipado com 400 rodas de apoio.MLP é uma rede neural na qual um ou mais perceptrons formam múltiplas camadas com uma ou mais camadas ocultas entre as camadas de entrada e saída38.Usando isso, você pode realizar uma classificação não linear onde, ao adicionar uma camada de entrada e obter um valor de resultado, o valor do resultado previsto é comparado ao valor do resultado real e o erro é propagado de volta.Criamos uma camada oculta com 20 neurônios ocultos em cada camada.Cada modelo que desenvolvemos foi aplicado a conjuntos internos e externos para testar o desempenho da classificação calculando sensibilidade, especificidade, VPP, VPN e AUROC.A sensibilidade é definida como a razão entre uma amostra estimada em 18 anos de idade ou mais e uma amostra estimada em 18 anos de idade ou mais.A especificidade é a proporção de amostras com menos de 18 anos de idade e aquelas estimadas como tendo menos de 18 anos de idade.
Os estágios odontológicos avaliados no conjunto de treinamento foram convertidos em estágios numéricos para análise estatística.Regressões lineares e logísticas multivariadas foram realizadas para desenvolver modelos preditivos para cada sexo e derivar fórmulas de regressão que possam ser utilizadas para estimar a idade.Usamos essas fórmulas para estimar a idade do dente para conjuntos de testes internos e externos.A Tabela 4 apresenta os modelos de regressão e classificação utilizados neste estudo.
A confiabilidade intra e interobservador foi calculada utilizando a estatística kappa de Cohen.Para testar a precisão do DM e dos modelos de regressão tradicionais, calculamos o MAE e o RMSE usando as idades estimadas e reais dos conjuntos de testes internos e externos.Esses erros são comumente usados ​​para avaliar a precisão das previsões do modelo.Quanto menor for o erro, maior será a precisão da previsão24.Compare o MAE e o RMSE de conjuntos de testes internos e externos calculados usando DM e regressão tradicional.O desempenho da classificação do ponto de corte de 18 anos nas estatísticas tradicionais foi avaliado usando uma tabela de contingência 2 × 2.A sensibilidade, especificidade, VPP, VPN e AUROC calculados do conjunto de teste foram comparados com os valores medidos do modelo de classificação do DM.Os dados são expressos como média ± desvio padrão ou número (%) dependendo das características dos dados.Valores de P bilateral <0,05 foram considerados estatisticamente significativos.Todas as análises estatísticas de rotina foram realizadas utilizando o SAS versão 9.4 (SAS Institute, Cary, NC).O modelo de regressão DM foi implementado em Python usando backend Keras50 2.2.4 e Tensorflow51 1.8.0 especificamente para operações matemáticas.O modelo de classificação DM foi implementado no Waikato Knowledge Analysis Environment e na plataforma de análise Konstanz Information Miner (KNIME) 4.6.152.
Os autores reconhecem que os dados que apoiam as conclusões do estudo podem ser encontrados no artigo e em materiais suplementares.Os conjuntos de dados gerados e/ou analisados ​​durante o estudo estão disponíveis no autor correspondente mediante solicitação razoável.
Ritz-Timme, S. et al.Avaliação de idade: estado da arte para atender às exigências específicas da prática forense.internacionalidade.J. Medicina legal.113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G., e Olze, A. Situação atual da avaliação forense da idade de sujeitos vivos para fins de processo criminal.Forense.medicamento.Patologia.1, 239–246 (2005).
Pan, J. et al.Um método modificado para avaliar a idade dentária de crianças de 5 a 16 anos no leste da China.clínico.Pesquisa oral.25, 3463–3474 (2021).
Lee, SS etc. Cronologia do desenvolvimento de segundos e terceiros molares em coreanos e sua aplicação para avaliação de idade forense.internacionalidade.J. Medicina legal.124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY e Lee, SS Precisão da estimativa de idade e estimativa do limite de 18 anos com base na maturidade dos segundos e terceiros molares em coreanos e japoneses.PLoS ONE 17, e0271247 (2022).
Kim, JY, et al.A análise de dados pré-operatória baseada em aprendizado de máquina pode prever o resultado do tratamento da cirurgia do sono em pacientes com AOS.a ciência.Relatório 11, 14911 (2021).
Han, M. et al.Estimativa precisa de idade por meio de aprendizado de máquina com ou sem intervenção humana?internacionalidade.J. Medicina legal.136, 821–831 (2022).
Khan, S. e Shaheen, M. Da mineração de dados à mineração de dados.J.Informação.a ciência.https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. e Shaheen, M. WisRule: O primeiro algoritmo cognitivo para mineração de regras de associação.J.Informação.a ciência.https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. e Abdullah U. Karm: Mineração de dados tradicional baseada em regras de associação baseadas no contexto.calcular.Matt.continuar.68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. e Habib M. Detecção de similaridade semântica baseada em aprendizagem profunda usando dados de texto.informar.tecnologias.ao controle.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. e Shahin, M. Um sistema para reconhecer atividades em vídeos esportivos.multimídia.Aplicativos de ferramentas https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS et al.Desafio de aprendizado de máquina RSNA na idade óssea pediátrica.Radiologia 290, 498–503 (2019).
Li, Y. et al.Estimativa de idade forense a partir de radiografias pélvicas usando aprendizado profundo.EURO.radiação.29, 2322–2329 (2019).
Guo, YC, et al.Classificação precisa da idade usando métodos manuais e redes neurais convolucionais profundas a partir de imagens de projeção ortográfica.internacionalidade.J. Medicina legal.135, 1589–1597 (2021).
Alabama Dalora et al.Estimativa da idade óssea usando diferentes métodos de aprendizado de máquina: uma revisão sistemática da literatura e meta-análise.PLoS ONE 14, e0220242 (2019).
Du, H., Li, G., Cheng, K., e Yang, J. Estimativa de idade específica da população de afro-americanos e chineses com base nos volumes da câmara pulpar dos primeiros molares usando tomografia computadorizada de feixe cônico.internacionalidade.J. Medicina legal.136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK e Oh KS Determinação de faixas etárias de pessoas vivas usando imagens de primeiros molares baseadas em inteligência artificial.a ciência.Relatório 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N., e Urschler, M. Estimativa automática de idade e classificação de idade maioritária a partir de dados multivariados de ressonância magnética.IEEE J. Biomédica.Alertas de saúde.23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. e Li, G. Estimativa de idade baseada na segmentação da câmara pulpar 3D dos primeiros molares a partir da tomografia computadorizada de feixe cônico, integrando aprendizado profundo e conjuntos de níveis.internacionalidade.J. Medicina legal.135, 365–373 (2021).
Wu, WT, et al.Mineração de dados em big data clínico: bancos de dados, etapas e modelos de métodos comuns.Mundo.medicamento.recurso.8, 44 (2021).
Yang, J. et al.Introdução aos bancos de dados médicos e tecnologias de mineração de dados na era do Big Data.J. Ávido.Medicina básica.13, 57–69 (2020).
Shen, S. et al.Método de Camerer para estimar a idade dos dentes usando aprendizado de máquina.Saúde Bucal BMC 21, 641 (2021).
Galliburg A. et al.Comparação de diferentes métodos de aprendizado de máquina para prever a idade dentária usando o método de estadiamento Demirdjian.internacionalidade.J. Medicina legal.135, 665–675 (2021).
Demirdjian, A., Goldstein, H. e Tanner, JM Um novo sistema para avaliar a idade dentária.bufar.biologia.45, 211–227 (1973).
Landis, JR e Koch, GG Medidas de concordância do observador em dados categóricos.Biometria 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK e Choi HK.Análise textural, morfológica e estatística de ressonância magnética bidimensional utilizando técnicas de inteligência artificial para diferenciação de tumores cerebrais primários.Informação de saúde.recurso.https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Horário da postagem: 04/01/2024