The Journal of Neurobehavioral Sciences; 2015;2(3):102-104
Şizofreni Hastalarının Genomik Veri Kullanarak Klasifiye Edilmesi: Veri Madenciği Yaklaşımı
K Yilancioglu, M Konuk
Üsküdar Üniversitesi, İstanbul
Yeni nesil sekanslama ve mikrodizilim/çip analizlerinden elde edilen genomik veriler, çeşitli hastalıkların altında yatan moleküler sebepleri açığa
çıkarmakta ve potansiyel tanı biyomarkörlerinin tanımlanmasını olanaklı kılmaktadır. Ortaya çıktığından buyana klasifikasyon ve regresyon analizlerini
temel alan veri madenciliği metotları çeşitli çalışmalarda sıklıkla kullanılmaktadır. Bu çalışmada, NCBI GEO veri bankasından elde edilen, post-mortem
beyin dokularından elde edilmiş beyin dokularının mRNA transcript analiz verileri MLP nöral ağ algoritması kullanılarak incelenmiştir. Çalışmada,
dokular arasında ki transkripsiyon düzeyleri farkları analiz edilmiştir. Transkripsiyon düzeyleri farkı kullanılarak oluşturulan klasifikatör, şizofrenik ve
normal hasta gruplarını %82 kesinlikle tahmin etmiştir. Psikiyatrik hastalıkların altında yatan etmenlerin aydınlatılmasında genetik biyomarkörlerin rolü
günden güne önem kazanmaktadır. Ayrıca bu çalışmada kullanılan yöntemlere benzer yöntemlerin, genom temelli tanı yöntemlerinin bulunmasında katkı
sağlayacağı düşünülmektedir.
Classification of Schizophrenia Patients by Using Genomic Data: A Data Mining Approach
Genomic information obtained from robust analysis methods such as microarray and next generation sequencing reveals underlying
disease mediating factors and potential diagnostic biomarkers. Data mining methods have been widely chosen for classification and
regression studies of health sciences as well as other disciplines since the beginning. In the present study, public Gene Expression
Omnibus (GEO) genome wide expression dataset (ID: GSE12679) consisting of mRNA transcripts of post-mortem brain tissues in
schizophrenic and normal patients were analyzed by using Multilayer Perceptron Neural Network (MLP NN) algorithm. A set of most
differentially expressed genetic features (p<0.001) were used for creating the classifier which can predict disease states in test set with
~82% accuracy. Differentially expressed genes used as classifying biomarkers gain utmost importance for revealing hidden underlying
genetic factors associated with important psychiatric diseases. We could also suggest that such data mining tools might be applicable
for developing genome-based diagnostic tools.