본문 바로가기
AI 입문/Kaggle | DACON

[모각소] 4 OCR 손글씨 인식 프로젝트

by jhwannabe 2023. 2. 10.

AI HUB 데이터 중 대용량 손글씨 OCR 데이터를 활용하여 OCR 모델을 적용함으로써, NAVER CLOVA의 CRAFT 모델과 SWIM-Transformer 모델을 자세하게 분석하고 공부한다.

 

NAVER CLOVA의 CRAFT 모델

원본 논문 : https://arxiv.org/abs/1904.01941

 

Character Region Awareness for Text Detection

Scene text detection methods based on neural networks have emerged recently and have shown promising results. Previous methods trained with rigid word-level bounding boxes exhibit limitations in representing the text region in an arbitrary shape. In this p

arxiv.org

논문 리뷰 : https://medium.com/@msmapark2/character-region-awareness-for-text-detection-craft-paper-%EB%B6%84%EC%84%9D-da987b32609c

 

Character Region Awareness for Text Detection — CRAFT paper 분석

딥러닝 기반 OCR 스터디 — CRAFT 논문 리뷰

medium.com

 

 

SWIM - Transformer 모델

원본 논문 : https://arxiv.org/abs/2103.14030

 

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

This paper presents a new vision Transformer, called Swin Transformer, that capably serves as a general-purpose backbone for computer vision. Challenges in adapting Transformer from language to vision arise from differences between the two domains, such as

arxiv.org

논문 리뷰 : https://heeya-stupidbutstudying.tistory.com/entry/DL-Swin-Transformer-%EB%85%BC%EB%AC%B8-%EB%A6%AC%EB%B7%B0-Hierarchical-Vision-Transformer-using-Shifted-Windows

 

[논문리뷰] Swin Transformer - Hierarchical Vision Transformer using Shifted Windows

ViT 논문 리뷰 포스트에 이어 트랜스포머를 이용해 image recognition task를 수행하는 딥러닝 모델들에 대해 계속 다뤄보려한다. 이번 주제는 Swin Transformer로, 2021년 3월 마이크로소프트(Microsoft Research A

heeya-stupidbutstudying.tistory.com

도커를 이용하여 모델을 적용시키는데 도커 파일을 불러와 이미지는 다운받았지만, 실행이 되지 않아 진행이 되지 않는다.

728x90
반응형