Research Article


DOI :10.26650/acin.1258719   IUP :10.26650/acin.1258719    Full Text (PDF)

Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning

Murat KazançTolga EnsariMustafa Dağtekin

A few decades ago, people used printed resources such as books and magazines to learn. With the development of technology, digital documents have replaced printed resources. These documents can occur in the form of images or various text formats. Many different applications exist for preparing digital documents, one of these being LaTeX. LaTeX is a document preparation system and typesetting software that is used especially in the field of scientific publications and mathematics for preparing high quality documents. When preparing a document using LaTeX, the content is made ready using a markup language, which creates difficulties for some users. However, one of the main advantages of using the LaTeX system is that it distinguishes the document’s content from its formatting. Once the content is created, the formatting can be easily replaced. Generating LaTeX code from an image-formatted document requires both the use of computer vision and NLP. This study discovers the boundaries (blocks) of the places where text, tables, and figures are located on an image before making a text classification using the natural language processing methods of these blocks. The next stage of the study determines the reading order to enable meaningful flow. The final stage of the study produces a LaTeX code using the obtained information.

DOI :10.26650/acin.1258719   IUP :10.26650/acin.1258719    Full Text (PDF)

Resim Formatındaki Dokümanların Bilgisayarlı Görü, Doğal Dil İşleme ve Makine Öğrenmesi Kullanılarak Latex Formatına Dönüştürülmesi

Murat KazançTolga EnsariMustafa Dağtekin

Birkaç on yıl önce insanlar bilgi edinmek için kitap ve dergi gibi basılı kaynakları kullanmaktaydılar. Teknolojinin gelişmesi ile basılı kaynakların yerini dijital dokümanlar almıştır. Bu dokümanlar görüntü biçiminde veya farklı metin formatları şeklinde olabilmektedir. Dijital dokümanları hazırlamak için birçok farklı uygulama bulunmaktadır. Bunlardan bir tanesi LaTex’ tir. LaTex doküman hazırlama sistemi ve dizgi yazılımıdır. Yüksek kalitede dokümanlar hazırlamak için özellikle bilimsel yayınlar ve matematik alanında kullanılmaktadır. LaTex ile doküman hazırlanırken içerik bir işaretleme dili kullanılarak hazırlanılmaktadır. Bu durum bazı kullanıcılar için bir zorluk oluşturmaktadır. Ancak LaTex sistemini kullanmanın ana avantajlarından biri doküman içeriğini biçimlendirmeden ayırmasıdır. Bir kere içerik oluşturulduktan sonra biçimlendirme kolaylıkla değiştirilebilmektedir. Görüntü formatındaki bir dokümandan LaTex kodunun üretilmesi bilgisayarlı görü ve doğal dil işleme alanlarının birlikte kullanılmasını gerektirmektedir. Bu çalışmada öncelikle görüntü üzerinde metin, tablo ve şekillerin bulunduğu yerlerin sınırları (bloklar) tespit edilmiştir. Sonrasında bulunan bu blokların doğal dil işleme metotları kullanılarak metin sınıflama yapılmıştır. Bir sonraki aşamada anlam akışının bozulmaması için okuma sırası tespit edilmiştir. Son aşamada elde edilen bilgiler kullanılarak LaTex kodu üretilmiştir.


PDF View

References

Citations

Copy and paste a formatted citation or use one of the options to export in your chosen format


EXPORT



APA

Kazanç, M., Ensari, T., & Dağtekin, M. (2023). Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning. Acta Infologica, 7(2), 253-266. https://doi.org/10.26650/acin.1258719


AMA

Kazanç M, Ensari T, Dağtekin M. Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning. Acta Infologica. 2023;7(2):253-266. https://doi.org/10.26650/acin.1258719


ABNT

Kazanç, M.; Ensari, T.; Dağtekin, M. Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning. Acta Infologica, [Publisher Location], v. 7, n. 2, p. 253-266, 2023.


Chicago: Author-Date Style

Kazanç, Murat, and Tolga Ensari and Mustafa Dağtekin. 2023. “Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning.” Acta Infologica 7, no. 2: 253-266. https://doi.org/10.26650/acin.1258719


Chicago: Humanities Style

Kazanç, Murat, and Tolga Ensari and Mustafa Dağtekin. Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning.” Acta Infologica 7, no. 2 (Apr. 2024): 253-266. https://doi.org/10.26650/acin.1258719


Harvard: Australian Style

Kazanç, M & Ensari, T & Dağtekin, M 2023, 'Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning', Acta Infologica, vol. 7, no. 2, pp. 253-266, viewed 28 Apr. 2024, https://doi.org/10.26650/acin.1258719


Harvard: Author-Date Style

Kazanç, M. and Ensari, T. and Dağtekin, M. (2023) ‘Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning’, Acta Infologica, 7(2), pp. 253-266. https://doi.org/10.26650/acin.1258719 (28 Apr. 2024).


MLA

Kazanç, Murat, and Tolga Ensari and Mustafa Dağtekin. Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning.” Acta Infologica, vol. 7, no. 2, 2023, pp. 253-266. [Database Container], https://doi.org/10.26650/acin.1258719


Vancouver

Kazanç M, Ensari T, Dağtekin M. Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning. Acta Infologica [Internet]. 28 Apr. 2024 [cited 28 Apr. 2024];7(2):253-266. Available from: https://doi.org/10.26650/acin.1258719 doi: 10.26650/acin.1258719


ISNAD

Kazanç, Murat - Ensari, Tolga - Dağtekin, Mustafa. Converting Image Files to LaTeX Format Using Computer Vision, Natural Language Processing, and Machine Learning”. Acta Infologica 7/2 (Apr. 2024): 253-266. https://doi.org/10.26650/acin.1258719



TIMELINE


Submitted01.03.2023
Accepted19.09.2023
Published Online26.10.2023

LICENCE


Attribution-NonCommercial (CC BY-NC)

This license lets others remix, tweak, and build upon your work non-commercially, and although their new works must also acknowledge you and be non-commercial, they don’t have to license their derivative works on the same terms.


SHARE




Istanbul University Press aims to contribute to the dissemination of ever growing scientific knowledge through publication of high quality scientific journals and books in accordance with the international publishing standards and ethics. Istanbul University Press follows an open access, non-commercial, scholarly publishing.