Craft Model 사용법

category AI 인공지능/AI Vision 2022. 12. 1. 13:39
728x90
반응형

환경설정

1. Conda 환경 생성

[root@server ~]$ conda create -n craft_model python=3.7 
[root@server ~]$ conda activate craft_model 
(craft_model) [root@server ~]$ conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=10.2 -c pytorch

2. CRAFT-pytorch 소스 다운로드

(craft_model) [root@server ~]$ git clone https://github.com/clovaai/CRAFT-pytorch.git
(craft_model) [root@server ~]$ cd CRAFT-pytorch

 

3. PIP 패키지 설치

(craft_model) [root@server CRAFT-pytorch] pip install -r requirements.txt

 

모델 다운로드

1. 모델 디렉토리 생성

(craft_model) [root@server CRAFT-pytorch]$ mkdir model
(craft_model) [root@server CRAFT-pytorch]$ cd model

2. 모델 파일 다운로드

해당 링크를 클릭하여 craft_mlt_25k.pth 파일을 다운로드하여 생성한 모델 경로에 넣어준다.

(craft_model) [root@server model]$ ls -al
total 81212
drwxrwxr-x  2 root root     4096 11월 29 15:00 .
drwxrwxr-x 10 root root     4096 11월 29 15:47 ..
-rw-rw-r--  1 root root 83152330 11월 29 15:00 craft_mlt_25k.pth

 

※ 참고 : 다운로드 할 수 있는 모델은 다음과 같다.

Model name Used datasets Languages PurposeModel  Link
General SynthText, IC13, IC17 Eng + MLT For general purpose Click
IC15 SynthText, IC15 Eng For IC15 only Click
LinkRefiner CTW1500 - Used with the General Model Click

 

사용법

1. 샘플 디렉토리 생성

(craft_model) [root@server CRAFT-pytorch]$ mkdir sample
(craft_model) [root@server CRAFT-pytorch]$ cd sample

2. 샘플 이미지

(craft_model) [root@server sample]$ ls -al
total 12
drwxrwxr-x  2 yscho02 yscho02 4096 11월 29 15:01 .
drwxrwxr-x 10 yscho02 yscho02 4096 11월 29 15:47 ..
-rw-rw-r--  1 yscho02 yscho02 2225 11월 29 15:01 sample.png

sample.png 파일

3. 실행

가장 기본적인 옵션으로 모델 파일과 테스트 폴더를 지정하여 생성해본다.

(craft_model) [root@server CRAFT-pytorch]$ python test.py --trained_model=model/craft_mlt_25k.pth --test_folder=sample

 

4. 결과

(craft_model) [root@server CRAFT-pytorch]$ cd result/
(craft_model) [root@server result]$ ls -al
total 48
drwxrwxr-x 2 root root 4096 11월 29 15:02 .
drwxrwxr-x 10 root root 4096 11월 29 15:47 ..
-rw-rw-r-- 1 root root 16335 11월 29 15:53 res_sample.jpg
-rw-rw-r-- 1 root root 60 11월 29 15:53 res_sample.txt
-rw-rw-r-- 1 root root 16756 11월 29 15:53 res_sample_mask.jpg
  디텍팅 된 이미지 마스크 이미지 좌표 영역
파일명 res_sample.jpg res_sample_mask.jpg res_sample.txt
 
37,42,316,42,316,194,37,194

5. 사용 옵션

옵션명 기본 값 설명
--trained_model: pretrained model

weights/craft_mlt_25k.pth 훈련된 모델 경로
--text_threshold: text confidence threshold

0.7 텍스트 상태 임계치
--low_text: text low-bound score

0.4 텍스트 바운더리 점수
(어느 정도 여유로 박스 바운딩을 할 것인가의 옵션이다.)
--link_threshold: link confidence threshold

0.4 링크 상태 임계치
(1이 가까울 수록 캐릭터 셋 단위로 디텍팅을 한다.)
--cuda: use cuda for inference (default:True)

true CUDA (GPU) 사용 여부의 옵션
--canvas_size

1280  
--mag_ratio

1.5  
--poly

false  
--show_time

false  
--test_folde

/data/  
--refine

false  
--refiner_model weights/craft_refiner_CTW1500.pth  
728x90
반응형