Árvores de Decisão como Método de Mineração de Dados: Análise de Prontuários de uma Clínica Escola de Nutrição

  • Ademir Roberto Freddo Universidade Federal da Fronteira Sul
  • Márcia Fernandes Nishiyama Universidade Federal da Fronteira Sul
  • Kesia Zanuzo Universidade Federal da Fronteira Sul
  • Eloa Koehnlein Universidade Federal da Fronteira Sul
Palavras-chave: Análise de dados, Aprendizado de Máquina, Registros Médicos, Identificação de doenças

Resumo

Este artigo descreve a aplicação de árvores de decisão como método de mineração de dados nos prontuários da Clínica Escola de Nutrição da Universidade Federal da Fronteira Sul (UFSS), campus Realeza. Árvores de decisão é uma técnica de aprendizado de máquina, utilizada para reconhecimento de padrões em inteligência artificial na análise de dados. Para que se possa aplicar esta técnica, se faz necessária a existência de uma massa de dados com diversos atributos significativos. Portanto, a Clínica Escola de Nutrição da UFFS, campus Realeza, possui uma grande quantidade de prontuários que foram utilizados na mineração de dados. Utilizou-se 1339 prontuários. Destes, foram selecionados apenas atributos ou variáveis que estavam preenchidos em todos os prontuários a fim de não comprometer os resultados e criação dos modelos. Assim aplicou-se a técnica de árvores de decisão aos prontuários para identificar como classe final as respectivas doenças: dislipidemia, diabetes e hipertensão. Portanto, para cada doença, a partir dos prontuários selecionados, foi criada uma árvore de decisão ou modelo. Este possui um conjunto de atributos ou variáveis mais significativas para a identificação e caracterização da doença. Além disso, a confiabilidade ou eficiência da árvore na identificação da doença foi definida com base nos 30% dos 1339 prontuários. Portanto, 402 registros foram utilizados para testar os modelos, sendo para dislipidemia a eficiência foi de aproximadamente 89%. Na hipertensão e diabetes obteve-se uma eficiência de aproximadamente 94%. Isto significa, o quanto as regras criadas a partir das árvores de decisão são eficientes na identificação das doenças. Estas regras podem ser utilizadas para o desenvolvimento de alguma ferramenta computacional para auxílio no diagnóstico e também para prever e classificar doenças.

Downloads

Não há dados estatísticos.

Biografia do Autor

Ademir Roberto Freddo, Universidade Federal da Fronteira Sul
Coordenação Acadêmica

Referências

Witten IH, Frank E. Data Mining–Practical Machine Learning Tools and Techniques. San Francisco: Morgan Kaufmann Publishers; 2005.

Berry MJA, Linoff G. Data Mining Techniques: For Marketing, Sales, and Customer Support. New York: Wiley Computer Publishing. 1997.

Russel S,N. Artificial Intelligence: A Modern Approach. 2nd ed.: Campus; 2004.

Mitchell TM. Machine Learning: McGraw–Hill Science/Engineering/Math; 1997.

Quinlan JR. C4.5 Programs for Machine Learning San Diego California: Morgan Kaufmann Publishers; 1993.

Fayyad U, Piatetsky-Shapiro G, Smyth P. From data mining to knowledge discovery in databases. AI magazine. 1996: p. 17.

Hall M, Frank E, Holmes G, Pfahringer B, Reutemann P, I.H. W. The WEKA Data Mining Software: An Update. SIGKDD Explorations. 2009.

Duda RHPSD. Pattern Classification. 2nd ed.: Willey Interscience; 2002.

Quinlan JR. Induction of Decision Trees. Machine Learning. 1986; 1.

Quinlan JR. Improved Use of Continuous Attributes in C4.5. Journal of Artificial Intelligence Research. 1996; 4.

Quinlan JR. Is C5.0 Better Than C4.5?. [Online].; 1997 [cited 2018 Maio 10. Available from: http://rulequest.com/see5-comparison.html.

Vijiyarani S. Sudha S. Disease Prediction in Data Mining Technique – A Survey. International Journal of Computer Applications & Information Technology. 2013.

Lavrac N. Keravnou E. Zupan B. Intelligent data analysis in medicine. Encyclopedia of computer science and technology, 42(9), 113-157, 2000.

Collazos K. Barreto JM. Pellegrini GF. Analise do Prontuário médico para a utilização com KDD. Congresso Brasileiro de Informática em Saúde–CBIS, 2000.

Steiner MTA. Soma NY. Shimizu T. Nievola JC. Lopes F. Smiderle A. Data-Mining como Suporte a Tomada de Decisões - uma Aplicação no Diagnostico Medico. XXXVI Simpósio Brasileiro de Pesquisa Operacional. 23, 96-107, 2004.

Soni J. Predictive data mining for medical diagnosis: an overview of heart disease prediction. International Journal of Computer Applications. New York. v. 17, n. 8, p. 43-48, 2011.

Marinov M. Data mining technologies for diabetes: a systematic review. Journal of Diabetes Science and Technology, Thousand Oaks, v. 5, n. 6, p. 1549-1556, 2011.

Toussi M. Lamy J. Le Toumelin P. Venot A. Using data mining techniques to explore physicians’ therapeutic decisions when clinical guidelines do not provide recommendations: methods and example for type 2 diabetes. BMC Med. Informat. Decis. Making 9–28, 2009.

Pham HNA. Triantaphyllou E. Prediction of Diabetes by Employing a New Data Mining Approach Which Balances Fitting and Generalization. Department of Computer Science, 298 Coates Hall, Louisiana State University, Baton Rouge, LA 70803, 2008.

Sapna S. Tamilarasi A. Data mining–Fuzzy Neural Genetic Algorithm in predicting diabetes. Department Of Computer Applications (MCA), K.S.R College of Engineering, Research Journal on Computer Engineering, March, 2008.

Costa AF. Traina AJM. Mineração de Imagens Médicas Utilizando Características de Forma. 2012.

Publicado
2020-03-17
Como Citar
Freddo, A. R., Nishiyama, M. F., Zanuzo, K., & Koehnlein, E. (2020). Árvores de Decisão como Método de Mineração de Dados: Análise de Prontuários de uma Clínica Escola de Nutrição. Revista Da Associação Brasileira De Nutrição - RASBRAN, 10(2), 31-37. Recuperado de https://rasbran.emnuvens.com.br/rasbran/article/view/1142
Seção
Artigos Originais