AI HUB 데이터 중 대용량 손글씨 OCR 데이터를 활용하여 OCR 모델을 적용함으로써, NAVER CLOVA의 CRAFT 모델과 SWIM-Transformer 모델을 자세하게 분석하고 공부한다.
NAVER CLOVA의 CRAFT 모델
원본 논문 : https://arxiv.org/abs/1904.01941
Character Region Awareness for Text Detection
Scene text detection methods based on neural networks have emerged recently and have shown promising results. Previous methods trained with rigid word-level bounding boxes exhibit limitations in representing the text region in an arbitrary shape. In this p
arxiv.org
Character Region Awareness for Text Detection — CRAFT paper 분석
딥러닝 기반 OCR 스터디 — CRAFT 논문 리뷰
medium.com
SWIM - Transformer 모델
원본 논문 : https://arxiv.org/abs/2103.14030
Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
This paper presents a new vision Transformer, called Swin Transformer, that capably serves as a general-purpose backbone for computer vision. Challenges in adapting Transformer from language to vision arise from differences between the two domains, such as
arxiv.org
[논문리뷰] Swin Transformer - Hierarchical Vision Transformer using Shifted Windows
ViT 논문 리뷰 포스트에 이어 트랜스포머를 이용해 image recognition task를 수행하는 딥러닝 모델들에 대해 계속 다뤄보려한다. 이번 주제는 Swin Transformer로, 2021년 3월 마이크로소프트(Microsoft Research A
heeya-stupidbutstudying.tistory.com
도커를 이용하여 모델을 적용시키는데 도커 파일을 불러와 이미지는 다운받았지만, 실행이 되지 않아 진행이 되지 않는다.
'AI 입문 > Kaggle | DACON' 카테고리의 다른 글
[모각소] 3 DACON 서울시 따릉이 대여량 예측 경진대회 (0) | 2023.01.27 |
---|---|
[모각소] 2 Titanic - Model 개발 (0) | 2023.01.20 |
[모각소] 1 Titanic - Data 분석 (0) | 2023.01.20 |