Medical Informatics
Data Science
Serra ÇelikToday, data have found and secured its place in almost every field. It is vital to collect, store, and process data in nearly every area. Although data alone mean nothing, data only begin to speak when processed. The most important thing is to know how to process data. The goal of this chapter is to focus on improving decision-making through data analysis. In this context, this chapter first defines data and data science, and discusses the relationship among data science, machine learning, and data mining. Then, it explores data science problems. Data science problems can be grouped under three main titles, namely descriptive, predictive, and reinforcement, of which the first two are examined in this chapter. It would not be wrong to define data science as a process. This process comprises goal selection, data preprocessing, model construction, and analysis of results. Goal selection is the most crucial step of the data science process. The focus should be on understanding the need and solving problems. In contrast, data preprocessing is the most time consuming procedure and must be monitored throughout the process. At this step, the appropriate data set is obtained and prepared for the methods to be used in achieving the goal. The model construction step is the application of information extraction algorithms to the pre-processed data. The algorithms results are evaluated in the final step, which is the analysis of the results. Some data science problems may not be classified as either descriptive or predictive. These problems are called non-standard problems, which can be examined in two classes, namely derivative and hybrid problems. This chapter provides the examples of these problems. It also includes issues directly related to humanity, such as bias and ethics in data science. The chapter has been finalized with medical data science. In summary, this chapter takes a journey to transform data into meaningful information, and will guide those who will be newly discovering data science.
Veri Bilimi
Serra ÇelikGünümüzde veri kelimesi hemen her alanda kendine yer bulmuştur. Hemen hemen her alanda toplanması, saklanması ve işlenmesi hayati önem taşımaktadır. Veri tek başına hiçbir şey ifade etmez iken ancak işlenmeye başladığında konuşmaya başlar. Önemli olan nasıl işleneceğini bilmektir. Amaç; veri analizi yoluyla karar vermeyi geliştirmeye odaklanmaktır. Bu bağlamda bölümde ilk önce veri ve veri bilimi tanımları yapılmış, veri bilimi, makine öğrenmesi ve veri madenciliği arasındaki ilişki irdelenmiştir. Ardından veri bilimi problemleri ele alınmıştır. Veri bilimi problemleri tanımlayıcı, öngörücü ve pekiştirmeli olarak üç ana başlıkta toplanabilmekle beraber bu bölümde ilk ikisi incelenmiştir. Veri bilimini bir süreç olarak tanımlamak yanlış olmayacaktır. Bu süreç özetle, hedef seçimi, veri ön işleme, model oluşturma ve sonuçların analizi aşamalarından oluşur. Hedef seçimi veri bilimi sürecinin en önemli aşamasıdır. İhtiyacı anlamaya ve problem çözmeye odaklanılmalıdır. Veri ön işleme ise sürecin en çok zaman alan ve en çok dikkatli olunması gereken aşamasıdır. Uygun veri setinin elde edilerek amaca ulaşmada kullanılacak yöntemlere hazır hale getirilmesi bu aşamada gerçekleştirilir. Model oluşturma aşaması ön işlenmiş veriye bilgi çıkarım algoritmalarının uygulanması olup son aşama olan sonuçların analizi aşamasında algoritma sonuçları değerlendirilir. Bazı veri bilimi problemleri tanımlayıcı ya da öngörücü olarak sınıflandırılamayabilir. Standart dışı problemler olarak adlandırılan bu tarz problemler; türev problemler ve hibrit problemler olarak iki sınıfta incelenebilir. Bölümde bu problemlere örnekler de verilmiştir. Veri biliminde önyargı ve etik gibi insanlığı doğrudan ilgilendiren konulara da bölümde yer verilmiş olup, tıbbi veri bilimi ile bölüm sonlandırılmıştır. Bu bağlamda bu bölümde verinin anlamlı bilgiye dönüşmesi üzerine bir yolculuğa çıkılacak olup bu çalışma, veri bilimi ile yeni tanışacaklar için bir rehber olma özelliği taşımaktadır.