Araştırma Makalesi


DOI :10.26650/acin.1258719   IUP :10.26650/acin.1258719    Tam Metin (PDF)

Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning

Murat KazançTolga EnsariMustafa Dağtekin

A few decades ago, people used printed resources such as books and magazines to learn. With the development of technology, digital documents have replaced printed resources. These documents can occur in the form of images or various text formats. Many different applications exist for preparing digital documents, one of these being LaTeX. LaTeX is a document preparation system and typesetting software that is used especially in the field of scientific publications and mathematics for preparing high quality documents. When preparing a document using LaTeX, the content is made ready using a markup language, which creates difficulties for some users. However, one of the main advantages of using the LaTeX system is that it distinguishes the document’s content from its formatting. Once the content is created, the formatting can be easily replaced. Generating LaTeX code from an image-formatted document requires both the use of computer vision and NLP. This study discovers the boundaries (blocks) of the places where text, tables, and figures are located on an image before making a text classification using the natural language processing methods of these blocks. The next stage of the study determines the reading order to enable meaningful flow. The final stage of the study produces a LaTeX code using the obtained information.

DOI :10.26650/acin.1258719   IUP :10.26650/acin.1258719    Tam Metin (PDF)

Resim Formatındaki Dokümanların Bilgisayarlı Görü, Doğal Dil İşleme ve Makine Öğrenmesi Kullanılarak Latex Formatına Dönüştürülmesi

Murat KazançTolga EnsariMustafa Dağtekin

Birkaç on yıl önce insanlar bilgi edinmek için kitap ve dergi gibi basılı kaynakları kullanmaktaydılar. Teknolojinin gelişmesi ile basılı kaynakların yerini dijital dokümanlar almıştır. Bu dokümanlar görüntü biçiminde veya farklı metin formatları şeklinde olabilmektedir. Dijital dokümanları hazırlamak için birçok farklı uygulama bulunmaktadır. Bunlardan bir tanesi LaTex’ tir. LaTex doküman hazırlama sistemi ve dizgi yazılımıdır. Yüksek kalitede dokümanlar hazırlamak için özellikle bilimsel yayınlar ve matematik alanında kullanılmaktadır. LaTex ile doküman hazırlanırken içerik bir işaretleme dili kullanılarak hazırlanılmaktadır. Bu durum bazı kullanıcılar için bir zorluk oluşturmaktadır. Ancak LaTex sistemini kullanmanın ana avantajlarından biri doküman içeriğini biçimlendirmeden ayırmasıdır. Bir kere içerik oluşturulduktan sonra biçimlendirme kolaylıkla değiştirilebilmektedir. Görüntü formatındaki bir dokümandan LaTex kodunun üretilmesi bilgisayarlı görü ve doğal dil işleme alanlarının birlikte kullanılmasını gerektirmektedir. Bu çalışmada öncelikle görüntü üzerinde metin, tablo ve şekillerin bulunduğu yerlerin sınırları (bloklar) tespit edilmiştir. Sonrasında bulunan bu blokların doğal dil işleme metotları kullanılarak metin sınıflama yapılmıştır. Bir sonraki aşamada anlam akışının bozulmaması için okuma sırası tespit edilmiştir. Son aşamada elde edilen bilgiler kullanılarak LaTex kodu üretilmiştir.


PDF Görünüm

Referanslar

Atıflar

Biçimlendirilmiş bir atıfı kopyalayıp yapıştırın veya seçtiğiniz biçimde dışa aktarmak için seçeneklerden birini kullanın


DIŞA AKTAR



APA

Kazanç, M., Ensari, T., & Dağtekin, M. (2023). Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning. Acta Infologica, 7(2), 253-266. https://doi.org/10.26650/acin.1258719


AMA

Kazanç M, Ensari T, Dağtekin M. Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning. Acta Infologica. 2023;7(2):253-266. https://doi.org/10.26650/acin.1258719


ABNT

Kazanç, M.; Ensari, T.; Dağtekin, M. Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning. Acta Infologica, [Publisher Location], v. 7, n. 2, p. 253-266, 2023.


Chicago: Author-Date Style

Kazanç, Murat, and Tolga Ensari and Mustafa Dağtekin. 2023. “Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning.” Acta Infologica 7, no. 2: 253-266. https://doi.org/10.26650/acin.1258719


Chicago: Humanities Style

Kazanç, Murat, and Tolga Ensari and Mustafa Dağtekin. Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning.” Acta Infologica 7, no. 2 (May. 2024): 253-266. https://doi.org/10.26650/acin.1258719


Harvard: Australian Style

Kazanç, M & Ensari, T & Dağtekin, M 2023, 'Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning', Acta Infologica, vol. 7, no. 2, pp. 253-266, viewed 3 May. 2024, https://doi.org/10.26650/acin.1258719


Harvard: Author-Date Style

Kazanç, M. and Ensari, T. and Dağtekin, M. (2023) ‘Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning’, Acta Infologica, 7(2), pp. 253-266. https://doi.org/10.26650/acin.1258719 (3 May. 2024).


MLA

Kazanç, Murat, and Tolga Ensari and Mustafa Dağtekin. Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning.” Acta Infologica, vol. 7, no. 2, 2023, pp. 253-266. [Database Container], https://doi.org/10.26650/acin.1258719


Vancouver

Kazanç M, Ensari T, Dağtekin M. Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning. Acta Infologica [Internet]. 3 May. 2024 [cited 3 May. 2024];7(2):253-266. Available from: https://doi.org/10.26650/acin.1258719 doi: 10.26650/acin.1258719


ISNAD

Kazanç, Murat - Ensari, Tolga - Dağtekin, Mustafa. Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning”. Acta Infologica 7/2 (May. 2024): 253-266. https://doi.org/10.26650/acin.1258719



ZAMAN ÇİZELGESİ


Gönderim01.03.2023
Kabul19.09.2023
Çevrimiçi Yayınlanma26.10.2023

LİSANS


Attribution-NonCommercial (CC BY-NC)

This license lets others remix, tweak, and build upon your work non-commercially, and although their new works must also acknowledge you and be non-commercial, they don’t have to license their derivative works on the same terms.


PAYLAŞ




İstanbul Üniversitesi Yayınları, uluslararası yayıncılık standartları ve etiğine uygun olarak, yüksek kalitede bilimsel dergi ve kitapların yayınlanmasıyla giderek artan bilimsel bilginin yayılmasına katkıda bulunmayı amaçlamaktadır. İstanbul Üniversitesi Yayınları açık erişimli, ticari olmayan, bilimsel yayıncılığı takip etmektedir.