Árvores de Decisão como Método de Mineração de Dados: Análise de Prontuários de uma Clínica Escola de Nutrição
Palavras-chave:
Análise de dados, Aprendizado de Máquina, Registros Médicos, Identificação de doençasResumo
Este artigo descreve a aplicação de árvores de decisão como método de mineração de dados nos prontuários da Clínica Escola de Nutrição da Universidade Federal da Fronteira Sul (UFSS), campus Realeza. Árvores de decisão é uma técnica de aprendizado de máquina, utilizada para reconhecimento de padrões em inteligência artificial na análise de dados. Para que se possa aplicar esta técnica, se faz necessária a existência de uma massa de dados com diversos atributos significativos. Portanto, a Clínica Escola de Nutrição da UFFS, campus Realeza, possui uma grande quantidade de prontuários que foram utilizados na mineração de dados. Utilizou-se 1339 prontuários. Destes, foram selecionados apenas atributos ou variáveis que estavam preenchidos em todos os prontuários a fim de não comprometer os resultados e criação dos modelos. Assim aplicou-se a técnica de árvores de decisão aos prontuários para identificar como classe final as respectivas doenças: dislipidemia, diabetes e hipertensão. Portanto, para cada doença, a partir dos prontuários selecionados, foi criada uma árvore de decisão ou modelo. Este possui um conjunto de atributos ou variáveis mais significativas para a identificação e caracterização da doença. Além disso, a confiabilidade ou eficiência da árvore na identificação da doença foi definida com base nos 30% dos 1339 prontuários. Portanto, 402 registros foram utilizados para testar os modelos, sendo para dislipidemia a eficiência foi de aproximadamente 89%. Na hipertensão e diabetes obteve-se uma eficiência de aproximadamente 94%. Isto significa, o quanto as regras criadas a partir das árvores de decisão são eficientes na identificação das doenças. Estas regras podem ser utilizadas para o desenvolvimento de alguma ferramenta computacional para auxílio no diagnóstico e também para prever e classificar doenças.Downloads
Referências
Witten IH, Frank E. Data Mining–Practical Machine Learning Tools and Techniques. San Francisco: Morgan Kaufmann Publishers; 2005.
Berry MJA, Linoff G. Data Mining Techniques: For Marketing, Sales, and Customer Support. New York: Wiley Computer Publishing. 1997.
Russel S,N. Artificial Intelligence: A Modern Approach. 2nd ed.: Campus; 2004.
Mitchell TM. Machine Learning: McGraw–Hill Science/Engineering/Math; 1997.
Quinlan JR. C4.5 Programs for Machine Learning San Diego California: Morgan Kaufmann Publishers; 1993.
Fayyad U, Piatetsky-Shapiro G, Smyth P. From data mining to knowledge discovery in databases. AI magazine. 1996: p. 17.
Hall M, Frank E, Holmes G, Pfahringer B, Reutemann P, I.H. W. The WEKA Data Mining Software: An Update. SIGKDD Explorations. 2009.
Duda RHPSD. Pattern Classification. 2nd ed.: Willey Interscience; 2002.
Quinlan JR. Induction of Decision Trees. Machine Learning. 1986; 1.
Quinlan JR. Improved Use of Continuous Attributes in C4.5. Journal of Artificial Intelligence Research. 1996; 4.
Quinlan JR. Is C5.0 Better Than C4.5?. [Online].; 1997 [cited 2018 Maio 10. Available from: http://rulequest.com/see5-comparison.html.
Vijiyarani S. Sudha S. Disease Prediction in Data Mining Technique – A Survey. International Journal of Computer Applications & Information Technology. 2013.
Lavrac N. Keravnou E. Zupan B. Intelligent data analysis in medicine. Encyclopedia of computer science and technology, 42(9), 113-157, 2000.
Collazos K. Barreto JM. Pellegrini GF. Analise do Prontuário médico para a utilização com KDD. Congresso Brasileiro de Informática em Saúde–CBIS, 2000.
Steiner MTA. Soma NY. Shimizu T. Nievola JC. Lopes F. Smiderle A. Data-Mining como Suporte a Tomada de Decisões - uma Aplicação no Diagnostico Medico. XXXVI Simpósio Brasileiro de Pesquisa Operacional. 23, 96-107, 2004.
Soni J. Predictive data mining for medical diagnosis: an overview of heart disease prediction. International Journal of Computer Applications. New York. v. 17, n. 8, p. 43-48, 2011.
Marinov M. Data mining technologies for diabetes: a systematic review. Journal of Diabetes Science and Technology, Thousand Oaks, v. 5, n. 6, p. 1549-1556, 2011.
Toussi M. Lamy J. Le Toumelin P. Venot A. Using data mining techniques to explore physicians’ therapeutic decisions when clinical guidelines do not provide recommendations: methods and example for type 2 diabetes. BMC Med. Informat. Decis. Making 9–28, 2009.
Pham HNA. Triantaphyllou E. Prediction of Diabetes by Employing a New Data Mining Approach Which Balances Fitting and Generalization. Department of Computer Science, 298 Coates Hall, Louisiana State University, Baton Rouge, LA 70803, 2008.
Sapna S. Tamilarasi A. Data mining–Fuzzy Neural Genetic Algorithm in predicting diabetes. Department Of Computer Applications (MCA), K.S.R College of Engineering, Research Journal on Computer Engineering, March, 2008.
Costa AF. Traina AJM. Mineração de Imagens Médicas Utilizando Características de Forma. 2012.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
A Revista se reserva no direito de efetuar, se necessário, alterações de ordem normativa, ortográfica e gramatical, com vistas a manter o padrão culto da língua, respeitando, porém, o estilo dos autores.
Ao encaminhar os originais, os autores cedem os direitos de primeira publicação para a Revista da Associação Brasileira de Nutrição e aceitam que seu trabalho seja publicado de acordo com nossa Declaração de Direito Autoral.
Os documentos publicados serão atribuídos a licença
Este trabalho está licenciado com uma Licença Creative Commons - Atribuição 4.0 Internacional.