Research Article


DOI :10.26650/acin.882187   IUP :10.26650/acin.882187    Full Text (PDF)

Analysis of Autism Spectrum Disorder in Children with Data Mining Methods

Sümeyye ÇelikMelike Şişeci Çeşmeli

Data mining techniques aim to reveal hidden patterns in data. They are widely used in many fields, such as medicine. Autism spectrum disorder, whose diagnosis and treatment are difficult and lengthy, is a complex neurodevelopmental disorder that is congenital or occurs in the first years of life. Actual and current autism spectrum disorder data collected from 292 children were used in this study. The data set has 20 input attributes and 1 output attribute. The output attribute expresses whether autism is present or not. In the study, data preprocessing stages, such as completing missing data on the data set, digitizing categorical data, and normalization, were first carried out. Subsequently, the features were classified by artificial neural networks and linguistic strength neuro-fuzzy classifier and clustered with k-means and x-means. The results of each method were evaluated and the performances were compared. 

DOI :10.26650/acin.882187   IUP :10.26650/acin.882187    Full Text (PDF)

Çocuklar İçin Otizm Spektrum Bozukluğunun Veri Madenciliği Yöntemleri ile Analizi

Sümeyye ÇelikMelike Şişeci Çeşmeli

Veri madenciliği teknikleri, veriler arasında gizli kalmış olan örüntüleri ortaya çıkarmayı amaçlamaktadır. Bu kapsamda, tıp gibi birçok alanda yaygın bir biçimde kullanılmaktadır. Teşhis ve tedavisi oldukça zor ve uzun bir süreçten oluşan otizm spektrum bozukluğu doğuştan gelen ya da yaşamın ilk yıllarında ortaya çıkan karmaşık bir nöro-gelişimsel bozukluktur. Bu çalışmada 292 çocuktan toplanan gerçek ve güncel otizm spektrum bozukluğu verileri kullanılmıştır. Veri seti 20 girdi özniteliği ve 1 çıktı özniteliğine sahiptir. Çıktı özniteliği otizmin bulunup bulunmadığını ifade etmektedir. Çalışma da öncelikle veri seti üzerinde eksik verilerin tamamlanması, kategorik verilerin sayısallaştırılması, normalizasyon gibi veri ön işleme aşamaları gerçekleştirilmiştir. Devamında ise öznitelikler yapay sinir ağları ve dilsel kuvvetli sinir-bulanık sınıflayıcı ile sınıflandırılmış, k-means ve x-means ile kümelenmiştir. Her bir yöntemin sonuçları değerlendirilmiş ve performanslar karşılaştırılmıştır.


PDF View

References

  • Akçapınar, G., Altun, A. & Aşkar, P. (2016). Çevrimiçi Öğrenme Ortamındaki Benzer Öğrenci Gruplarının Kümeleme Yöntemi İle Belirlenmesi. Eğitim Teknolojisi Kuram ve Uygulama, 6(2), 46-64. DOI: 10.17943/etku.91440. google scholar
  • Akdemir, Ç. (2016), “Hilenin Veri Madenciliği İle Ortaya Çıkartılması ve Perakende Sektöründe Bir Uygulama”, (Yayınlanmamış Doktora Tezi), İstanbul: Marmara Üniversitesi Sosyal Bilimler Enstitüsü. google scholar
  • Akgöbek, Ö., ve Çakır, F. (2009). Veri Madenciliğinde Bir Uzman Sistem Tasarımı, Akademik Bilişim Konferansı, 9, 801-806. google scholar
  • Akkaya, G. C., Demireli, E., Yakut, Ü. H., & Yakut, H. (2009). İşletmelerde Finansal Başarısızlık Tahminlemesi: Yapay Sinir Ağları Modeli İle İmkb Üzerine Bir Uygulama. Eskişehir Osmangazi Üniversitesi Sosyal Bilimler Dergisi, 10(2), 187-216. google scholar
  • Akyılmaz, O., & Ayan, T. (2010). Esnek Hesaplama Yöntemlerinin Jeodezide Uygulamaları. İTÜ Dergisi, 5(1), 261-268. google scholar
  • Akyol, K., & Karaci, A. (2018). A Study on Autistic Spectrum Disorder For Children Based On Feature Selection And Fuzzy Rule, International Congress on Engineering and Life Science, 804-807. google scholar
  • Aydın, S. (2007), “Veri Madenciliği ve Anadolu Üniversitesi Uzaktan Eğitim Sisteminde Bir Uygulama”, (Yayımlanmamış Doktora Tezi). Eskişehir: Anadolu Üniversitesi Sosyal Bilimler Enstitüsü. google scholar
  • Bholowalia, P., & Kumar, A. (2014). EBK-Means: A Clustering Technique Based On Elbow Method And K-Means İn WSN. International Journal of Computer Applications, 105(9), 17-24. google scholar
  • Bradley, P. S., Fayyad, U. M., & Reina, C. (1998). Scaling Clustering Algorithms to Large Databases. KDD, 98, 9-15. google scholar
  • Brossette, S. E., Sprague, A. P., Hardin, J. M., Waites, K. B., Jones, W. T., & Moser, S. A. (1998). Association Rules and Data Mining in Hospital İnfection Control And Public Health Surveillance, Journal of The American Medical Informatics Association, 5(4), 373-381. google scholar
  • Budak, E. Ç., & Bozkurt, M. R. (2013). Vertebra Lomber Disklerde Meydana Gelen Bozulmaların Manyetik Rezonans Görüntüleme (Mrg) ile Analizi. AJIT-e: Online Academic Journal of Information Technology, 4(11), 125-144. google scholar
  • Çağlar, M. F., Çetişli, B., & Toprak, İ. B. (2010). Automatic Recognition of Parkinson’s Disease From Sustained Phonation Tests Using ANN and Adaptive Neuro-Fuzzy Classifier. Mühendislik Bilimleri ve Tasarım Dergisi, 1(2), 59-64. google scholar
  • Çalışkan, S. K., & Soğukpınar, İ. (2008). Kxknn: K-Means ve K En Yakin Komşu Yöntemleri İle Ağlarda Nüfuz Tespiti. EMO Yayınları, 120-24. google scholar
  • Çelik, S., Bozkurt, Ö. Ç., & Çeşmeli, M. Ş. (2018). İnsan Omurgası Veri Setinin Sinir-Bulanık Sınıflayıcı İle Öznitelik Tespiti ve Sınıflandırılması. Yönetim Bilişim Sistemleri Dergisi, 4(1), 39-52. google scholar
  • Çelik, S. (2020). Determination and Classification of Importance of Attributes Used in Diagnosing Pregnant Women’s Birth Method. Alphanumeric Journal, 8(2), 261-274. google scholar
  • Cetişli, B., & Kalkan, H. (2011). Classification of Multispectral Satallite Images By Using Adaptive Neuro-Fuzzy Classifier with Linguistic Hedges. Signal Processing and Communications Applications Conference, 19, 50-53. google scholar
  • Çetişli B. (2006). Öznitelik Seçiminde Dilsel Kuvvetli Sinir Bulanık Sınıflayıcı Kullanımı. Eskişehir Osmangazi Üniversitesi Mühendislik ve Mimarlık Fakültesi Dergisi, 19(2), 109-130. google scholar
  • Çınaroğlu, S., & Bulut, H. (2018). New Initialization Approaches for The K-Means And Particle Swarm Optimization Based Clustering Algorithms. Journal of the Faculty of Engineering and Architecture of Gazi University, 33(2), 413-423. google scholar
  • Deb, C., Lee, S. E., & Santamouris, M. (2018). Using Artificial Neural Networks to Assess HVAC Related Energy Saving in Retrofitted Office Buildings. Solar Energy, 163, 32-44. google scholar
  • Demiralay, M., & Çamurcu, A. Y. (2005). Cure, Agnes ve K-Means Algoritmalarındaki Kümeleme Yeteneklerinin Karşılaştırılması. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, 4(8), 1-18. google scholar
  • De Campos Souza, P. V., & Guimaraes, A. J. (2018). Using Fuzzy Neural Networks for Improving the Prediction of Children with Autism Through Mobile Devices. Symposium on Computers and Communications, 01086-01089. google scholar
  • Diler, S. (2016), “Veri Madenciliği Süreçleri ve Karar Ağaçları Algoritmaları ile Bir Uygulama”, (Yayımlanmamış Yüksek Lisans Tezi). Van: Yüzüncü Yıl Üniversitesi Fen Bilimleri Enstitüsü. google scholar
  • Doğan, B., Buldu, A., Demir, Ö., & Erol, B. (2018). Sigortacılık Sektöründe Müşteri İlişki Yönetimi İçin Kümeleme Analizi. Karaelmas Fen ve Mühendislik Dergisi, 8(1), 11-18. google scholar
  • Feng, Y., & Hamerly, G. (2007). PG-Means: Learning The Number of Clusters in Data. In Advances in neural information processing systems, 393-400. google scholar
  • Gülsöz, T., & Çıkılı, Y. (2018). Otizm Spektrum Bozukluğu Olan Öğrencilere Soğuk İçecek Hazırlama ve Sunma Becerisinin Video Model ile Öğretimin Etkililiği. Abant İzzet Baysal Üniversitesi Eğitim Fakültesi Dergisi, 18(1), 210-229. google scholar
  • Güner, S., Codal, K. S., Geçer, H. S., & Coşkun, E. (2018). Trafik Kaza Desenlerinin Tanımlanmasında K-Means Kümeleme Algoritmasının Kullanılması: Sakarya İli Uygulaması. İşletme Bilimi Dergisi, 6(3), 89-105. google scholar
  • Hamerly, G., & Elkan, C. (2004). Learning The K in K-Means. In Advances in Neural Information Processing Systems, 281-288. google scholar
  • Hong, T. P., & Wu, C. W. (2011). Mining Rules From an Incomplete Dataset with a High Missing Rate. Expert Systems with Applications, 38(4), 3931-3936. google scholar
  • Huang, D., & Chow, T. W. (2005). Efficiently Searching The Important Input Variables Using Bayesian Discriminant, IEEE Transactions on Circuits and Systems I: Regular Papers, 52(4), 8785-793. google scholar
  • Hutchinson, J., Schauer, I., & Seetan, R. (2019). A Comparatıve Study of Data Mınıng Technıques Used to Test Predıctıve Accuracy of Autısm Spectrum Dısorder Screenıng Process, In 34th Annual Conference of The Pennsylvania Association of Computer and Information Science Educators, 70-75. google scholar
  • Işık, M., & Çamurcu, A. Y. (2007). K-Means, K-Medoids ve Bulanık C-Means Algoritmalarının Uygulamalı Olarak Performanslarının Tespiti. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, 6(13), 31-45. google scholar
  • Işık M., & Çamurcu, A. Y. (2011). Document Clusterıng Usıng K-Means and Hyperspherıcal Fuzzy C-Means Algorıthms. Marmara Fen Bilimleri Dergisi, 22(1), 1-18. google scholar
  • Jain, A. K. (2010). Data Clustering: 50 Years Beyond K-Means. Pattern Recognition Letters, 31(8), 651-666. google scholar
  • Jayalakshmi, T., & Santhakumaran, A. (2011). Statistical Normalization and Back Propagation for Classification. International Journal of Computer Theory and Engineering, 3(1), 1793-8201. google scholar
  • Kalantar, B., Pradhan, B., Naghibi, S. A., Motevalli, A., & Mansor, S. (2018). Assessment of The Effects of Training Data Selection on The Landslide Susceptibility Mapping: A Comparison Between Support Vector Machine (SVM), Logistic Regression (LR) and Artificial Neural Networks (ANN), Geomatics, Natural Hazards and Risk, 9(1), 49-69. google scholar
  • Kalogeratos, A., & Likas, A. (2012). Dip-Means: an Incremental Clustering Method For Estimating The Number Oo Clusters. In Advances in Neural Information Processing Systems, 2393-2401. google scholar
  • Khaled, A., Sanjay, R., & Vineet, S. (1998). An Efficient K-Means Clustering Algorithm. In IPPS: 11th International Parallel Processing Symposium. google scholar
  • Bilgin, T. T., & Çamurcu, Y. (2005). Dbscan, Optıcs ve K-Means Kümeleme Algoritmalarının Uygulamalı Karşılaştırılması. Politeknik Dergisi, 8(2), 139-145. google scholar
  • Kılınç, G. E., & Söğüt, M. Ü. (2018). Mikrobiyotaya Güncel Bir Yaklaşım: Otizm ve Mikrobiyota, Turkiye Klinikleri Journal of Health Sciences, 3(1), 88-94. google scholar
  • Koçyiğit, Y., & Korürek, M. (2010). EMG İşaretlerini Dalgacık Dönüşümü ve Bulanık Mantık Sınıflayıcı Kullanarak Sınıflama. İTÜDERGİSİ/d, 4(3), 25-31. google scholar
  • Küçükkocaoğlu, G., Benli Keskin, Y., & Küçüksözen, C., (2005). Finansal Bilgi Manipülasyonunun Tespitinde Yapay Sinir Ağı Modelinin Kullanımı. IMKB Dergisi, 9(36), 1-23. google scholar
  • Liu, H., Dougherty, E. R., Dy, J. G., Torkkola, K., Tuv, E., Peng, H., ... & Zhao, Z. (2005). Evolving Feature Selection, IEEE Intelligent systems, 20(6), 64-76. google scholar
  • Mackinnon, M. J., & Glick, N. (1999). Applications: Data Mining and Knowledge Discovery in Databases-an Overview. Australian & New Zealand Journal of Statistics, 41(3), 255-275. google scholar
  • MacQueen, J. (1967). Some Methods for Classification and Analysis of Multivariate Observations. In Proceedings of The Fifth Berkeley Symposium on Mathematical Statistics and Probability, 1(14), 281-297. google scholar
  • Mehmet, D., & Akpınar, E. (2018). Sabit ve Hareketli Hava İle Isıtılan Güneş Kolektörlerinin Isıl Verimliliklerinin Karşılaştırılması ve Yapay Sinir Ağları İle Modellenmesi. Fırat Üniversitesi Mühendislik Bilimleri Dergisi, 30(1), 41-46. google scholar
  • Moskov, D. (2016), “Knowledge Extractıon From Publıshed Papers in Lıterature For The Catalytıc Methanol Productıon From Synthesıs Gas Usıng Data Mınıng Tools”, (Yayımlanmamış Yüksek Lisans Tezi). İstanbul: Boğaziçi Üniversitesi. Fen Bilimleri Enstitüsü. google scholar
  • Muhr, M., & Granitzer, M. (2009). Automatic Cluster Number Selection Using A Split and Merge K-Means Approach, In 20th International Workshop on Database and Expert Systems Application, 363-367. google scholar
  • Nilashi, M., Ibrahim, O., Dalvi, M., Ahmadi, H., & Shahmoradi, L. (2017). Accuracy Improvement For Diabetes Disease Classification: A Case on A Public Medical Dataset. Fuzzy Information and Engineering, 9(3), 345-357. google scholar
  • Oğuzlar, A. (2003). Veri Ön İşleme. Erciyes Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, 21, 67-76. google scholar
  • Olçay Gül, S., & Tekin İftar, E. (2012). Otizm Spektrum Bozukluğu Tanısı Olan Bireyler İçin Sosyal Öykülerin Kullanımı. Ankara Üniversitesi Eğitim Bilimleri Fakültesi Özel Eğitim Dergisi, 13(2), 1-24. google scholar
  • Özsoy, İ., & Fırat, M. (2004). Kirişsiz Döşemeli Betonarme Bir Binada Oluşan Yatay Deplasmanın Yapay Sinir Ağları İle Tahmini. Deü Mühendislik Fakültesi Fen ve Mühendislik Dergisi, 6(1), 51-63. google scholar
  • Pelleg, D., & Moore, A. W. (2000). X-Means: Extending K-Means with Efficient Estimation of The Number of Clusters, In Icml, 1, 727-734. google scholar
  • Pençe, İ., & Çetişli, B. (2013). El Yazı Karakterlerinin Kapalı Cebirsel Eğrilerle Modellenmesi ve Sınıflandırılması. Sigma, 5, 1-7. google scholar
  • Reddy, S. K., Kodali, S. R., & Gundabathina, J. L. (2012). Classification of Vertebral Column Using Naıve Bayes Technique. International Journal of Computer Applications, 58(7), 38-42. google scholar
  • Sabuncuoğlu, M., Cebeci, S., Rahbar, M. H., & Hessabi, M. (2015). Autism Spectrum Disorder and Attention Deficit Hyperactivity Disorder: Knowledge and Attitude of Family Medicine Residents in Turkey. Turkish Journal ofFamily Medicine & Primary Care, 9(2), 46-53. google scholar
  • Sariman, G. (2011). Veri Madenciliğinde Kümeleme Teknikleri Üzerine Bir Çalışma: K-Means ve K-Medoids Kümeleme Algoritmalarının Karşılaştırılması. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 15(3), 192-202. google scholar
  • Sebik, N. B., & Bülbül, H. İ. (2018). Veri Madenciliği Modellerinin Akciğer Kanseri Veri Seti Üzerinde Başarılarının İncelenmesi. TÜBAV Bilim Dergisi,11(3), 1-7. google scholar
  • Sezgin, E., & Çelik, Y. (2013). Veri Madenciliğinde Kayıp Veriler İçin Kullanılan Yöntemlerin Karşılaştırılması. Akademik Bilişim Konferansı, 23-25. google scholar
  • Steinley, D. (2006). K-Means Clustering: A Half-Century Synthesis, British Journal of Mathematical and Statistical Psychology. 59(1), 1-34. google scholar
  • Tsumoto, S., Kimura, T., Iwata, H., & Hirano, S. (2017). Mining Text For Disease Diagnosis. Procedia Computer Science, 122, 1133-1140. google scholar
  • Thabtah, F., Kamalov, F., & Rajab, K. (2018). A New Computational Intelligence Approach to Detect Autistic Features For Autism Screening. International Journal ofMedical Informatics, 117, 112-124. google scholar
  • Thabtah, F. (2017). Autism Spectrum Disorder Screening: Machine Learning Adaptation and Dsm-5 Fulfillment. In Proceedings of the 1st International Conference on Medical and Health Informatics, 1-6. google scholar
  • Thabtah, F. (2018). An Accessible and Efficient Autism Screening Method For Behavioural Data and Predictive Analyses. Health Informatics Journal, 25(4), 1739-1755. google scholar
  • Tekin, R., Kaya, Y., & Tağluk, M. E. (2011). K-Means ve Ysa Temelli Hibrit Bir Model İle Epileptik Eeg İşaretlerinin Sınıflandırılması. Elektrik Elektronik Bilgisayar Sempozyumu, 277-283. google scholar
  • Torun, Y. T., & İşeri, E. (2018). Bebeklik Döneminde Önemli Bir Psikopatoloji: Otizm. Turkiye Klinikleri Journal of Child Psychiatry-Special Topics, 4(1), 48-55. google scholar
  • Tsai, C. Y., & Chiu, C. C. (2008). Developing A Feature Weight Self-Adjustment Mechanism For A K-Means Clustering Algorithm. Computational Statistics & Data Analysis, 52(10), 4658-4672. google scholar
  • Tiryaki, A. E., & Kazan, R. (2007). Bulaşık Makinesinin Bulanık Mantık İle Modellenmesi. Mühendis ve Makine, 48(565), 3-8. google scholar
  • Tucker, C. S., Kim, H. M., Barker, D. E., & Zhang, Y. (2010). A Relieff Attribute Weighting and X-Means Clustering Methodology For Top-Down Product Family Optimization. Engineering Optimization, 42(7), 593-616. google scholar
  • Uğur, Ç., Sertçelik, M., Üneri, Ö., Dinç, G. Ş., Sekmen, E., & Solmaz, E. (2018). Evaluation of Serum Urotensin-II Levels of Children with ADHD and Autism Spectrum Disorder. Anadolu Psikiyatri Dergisi, 19(1), 80-86. google scholar
  • Uğur, Ç., & Göker, Z. (2018). Bir Çocuk Psikiyatrisi Ünitesine Başvuran Olgularda Otizm Spektrum Bozukluğu: Demografik ve Klinik Bulgular, Türkiye Çocuk Hastalıkları Dergisi, 13(3), 177-183. google scholar
  • Van den Bekerom, B. (2017). Using Machine Learning For Detection of Autism Spectrum Disorder. In Proc. 20th Student Conf, 1-7. google scholar
  • Yavuz, Ü., Ekim, U. & Köklü, M. (2011). Üniversite Öğrencilerin Ortak Zorunlu Derslerdeki Başarılarının K-Means Algoritması İle İncelenmesi. NWSA: Engineering Sciences, 6(1), 342-347. google scholar
  • Yavuz, S., & Deveci, M. (2012). İstatiksel Normalizasyon Tekniklerinin Yapay Sinir Ağin Performansina Etkisi. Erciyes Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, 40, 167-187. google scholar

Citations

Copy and paste a formatted citation or use one of the options to export in your chosen format


EXPORT



APA

Çelik, S., & Şişeci Çeşmeli, M. (2021). Analysis of Autism Spectrum Disorder in Children with Data Mining Methods. Acta Infologica, 5(1), 167-186. https://doi.org/10.26650/acin.882187


AMA

Çelik S, Şişeci Çeşmeli M. Analysis of Autism Spectrum Disorder in Children with Data Mining Methods. Acta Infologica. 2021;5(1):167-186. https://doi.org/10.26650/acin.882187


ABNT

Çelik, S.; Şişeci Çeşmeli, M. Analysis of Autism Spectrum Disorder in Children with Data Mining Methods. Acta Infologica, [Publisher Location], v. 5, n. 1, p. 167-186, 2021.


Chicago: Author-Date Style

Çelik, Sümeyye, and Melike Şişeci Çeşmeli. 2021. “Analysis of Autism Spectrum Disorder in Children with Data Mining Methods.” Acta Infologica 5, no. 1: 167-186. https://doi.org/10.26650/acin.882187


Chicago: Humanities Style

Çelik, Sümeyye, and Melike Şişeci Çeşmeli. Analysis of Autism Spectrum Disorder in Children with Data Mining Methods.” Acta Infologica 5, no. 1 (May. 2024): 167-186. https://doi.org/10.26650/acin.882187


Harvard: Australian Style

Çelik, S & Şişeci Çeşmeli, M 2021, 'Analysis of Autism Spectrum Disorder in Children with Data Mining Methods', Acta Infologica, vol. 5, no. 1, pp. 167-186, viewed 10 May. 2024, https://doi.org/10.26650/acin.882187


Harvard: Author-Date Style

Çelik, S. and Şişeci Çeşmeli, M. (2021) ‘Analysis of Autism Spectrum Disorder in Children with Data Mining Methods’, Acta Infologica, 5(1), pp. 167-186. https://doi.org/10.26650/acin.882187 (10 May. 2024).


MLA

Çelik, Sümeyye, and Melike Şişeci Çeşmeli. Analysis of Autism Spectrum Disorder in Children with Data Mining Methods.” Acta Infologica, vol. 5, no. 1, 2021, pp. 167-186. [Database Container], https://doi.org/10.26650/acin.882187


Vancouver

Çelik S, Şişeci Çeşmeli M. Analysis of Autism Spectrum Disorder in Children with Data Mining Methods. Acta Infologica [Internet]. 10 May. 2024 [cited 10 May. 2024];5(1):167-186. Available from: https://doi.org/10.26650/acin.882187 doi: 10.26650/acin.882187


ISNAD

Çelik, Sümeyye - Şişeci Çeşmeli, Melike. Analysis of Autism Spectrum Disorder in Children with Data Mining Methods”. Acta Infologica 5/1 (May. 2024): 167-186. https://doi.org/10.26650/acin.882187



TIMELINE


Submitted17.02.2021
Accepted08.04.2021
Published Online29.07.2021

LICENCE


Attribution-NonCommercial (CC BY-NC)

This license lets others remix, tweak, and build upon your work non-commercially, and although their new works must also acknowledge you and be non-commercial, they don’t have to license their derivative works on the same terms.


SHARE




Istanbul University Press aims to contribute to the dissemination of ever growing scientific knowledge through publication of high quality scientific journals and books in accordance with the international publishing standards and ethics. Istanbul University Press follows an open access, non-commercial, scholarly publishing.