Medical Informatics III
Information Extraction from Discharge Reports: A Roadmap
Selin Şahin, Serra Çelik, Sevinç GülseçenDischarge reports are an essential and detailed data source in health. In order to information extraction from the discharge reports of patients, using the natural language processing method, which deals with the co-occurrence of words in learning the hidden meanings discussed in the text, gives more reliable results than other methods. Natural Language Processing can be defined as the language people speak to transfer to machines. Information extraction, which has become an increasingly important issue in recent years, is one of the application areas of natural language processing. By processing unstructured data with information extraction, entities in the text are found and stored in a database simultaneously. Thus, a text written in natural language becomes operable in computer language. If natural language processing methods are applied to electronic discharge notes, highly productive descriptive studies can be conducted and can guide future studies. Developments in information technologies allow the keeping and processing of discharge notes electronically. A lot of helpful information is obtained by information extraction from patient discharge notes, which are unstructured data kept in an electronic environment. Models created with natural language processing can allow doctors to classify patients and thus use appropriate treatment methods. Natural language processing studies with Python can be performed with three libraries (NLTK, SpaCy, Gensim). NLTK performs many operations such as classification, extracting sentences or words from the text, and tagging. SpaCy integrates easily with deep learning. Includes part of speech tagging, named entity recognition, and convolutional neural networks model. Gensim is a Python library for topic modeling, document indexing, and similarity to giant corpses. The study aims to reveal a roadmap for information extraction from the discharge notes of the patients using natural language processing methods and to reveal the hidden meanings in the texts (discharge reports-notes).
Taburcu Raporlarından Bilgi Keşfi: Bir Yol Haritası
Selin Şahin, Serra Çelik, Sevinç GülseçenTaburcu notları, sağlık alanında oldukça önemli ve ayrıntılı bir veri kaynağıdır. Hastalara ait taburcu notlarından bilgi çıkarımı yapmak, metinde tartışılan gizli anlamları öğrenmek için sözcüklerin birlikte oluşmasını ele alan doğal dil işleme yöntemini kullanmak diğer yöntemlere kıyasla daha güvenilir sonuçlar vermektedir. Doğal dil işleme, insanların konuştuğu dilin makinelere aktarılması olarak ifade edilebilir. Son yıllarda önemi artan bir konu olan bilgi çıkarımı doğal dil işlemenin uygulama alanlarından biridir. Bilgi çıkarımı ile yapılandırılmamış veriler işlenerek metindeki varlıkların bulunması ve aynı zamanda bir veritabanında depolanması gerçekleştirilir. Böylece doğal dilde yazılmış bir metin bilgisayar dilinde işlenebilir hale gelmektedir. Doğal dil işleme yöntemlerinin elektronik taburcu notlarına uygulanması halinde oldukça verimli tanımlayıcı çalışmalar yürütülebilir ve gelecekte yapılan çalışmalara yol gösterici olabilir. Bilgi teknolojileri alanında yaşanan gelişmeler taburcu notlarının elektronik ortamda tutulmasına ve işlenmesine olanak tanımaktadır. Elektronik ortamda tutulan ve yapılandırılmamış veriler olan hasta taburcu notlarından bilgi çıkarımı ile pek çok yararlı bilgi elde edilmektedir. Doğal dil işleme yöntemi ile oluşturulan modeller doktorların hastaları sınıflandırma ve bu sayede uygun tedavi yöntemleri kullanmasına olanak sağlayabilir. Python ile doğal dil işleme çalışmaları 3 kütüphane (NLTK, SpaCy, Gensim) ile gerçekleştirilebilmektedir. NLTK, sınıflama, metinden cümle veya kelime çıkarma etiketleme gibi pek çok işlemi gerçekleştirmektedir. SpaCy, derin öğrenme ile kolay entegre olmaktadır. Konuşma bölümü etiketleme, adlandırılmış varlık tanıma, evrişimli sinir ağları modeli içerir. Gensim, konu modelleme, belge indeksleme ve büyük derlemlerle benzerlik elde etmek için bir Python kütüphanesidir. Çalışmada amaçlanan hastalara ait taburcu notlarından doğal dil işleme yöntemlerini kullanarak bilgi çıkarımı yapılması ve metinlerde (taburcu raporları-notları) yer alan gizli anlamların ortaya çıkarılmasına dair bir yol haritası ortaya koymaktır.