728x90
반응형
환경설정
1. Conda 환경 생성
[root@server ~]$ conda create -n craft_model python=3.7
[root@server ~]$ conda activate craft_model
(craft_model) [root@server ~]$ conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=10.2 -c pytorch
2. CRAFT-pytorch 소스 다운로드
(craft_model) [root@server ~]$ git clone https://github.com/clovaai/CRAFT-pytorch.git
(craft_model) [root@server ~]$ cd CRAFT-pytorch
3. PIP 패키지 설치
(craft_model) [root@server CRAFT-pytorch] pip install -r requirements.txt
모델 다운로드
1. 모델 디렉토리 생성
(craft_model) [root@server CRAFT-pytorch]$ mkdir model
(craft_model) [root@server CRAFT-pytorch]$ cd model
2. 모델 파일 다운로드
해당 링크를 클릭하여 craft_mlt_25k.pth 파일을 다운로드하여 생성한 모델 경로에 넣어준다.
(craft_model) [root@server model]$ ls -al
total 81212
drwxrwxr-x 2 root root 4096 11월 29 15:00 .
drwxrwxr-x 10 root root 4096 11월 29 15:47 ..
-rw-rw-r-- 1 root root 83152330 11월 29 15:00 craft_mlt_25k.pth
※ 참고 : 다운로드 할 수 있는 모델은 다음과 같다.
Model name | Used datasets | Languages | PurposeModel | Link |
General | SynthText, IC13, IC17 | Eng + MLT | For general purpose | Click |
IC15 | SynthText, IC15 | Eng | For IC15 only | Click |
LinkRefiner | CTW1500 | - | Used with the General Model | Click |
사용법
1. 샘플 디렉토리 생성
(craft_model) [root@server CRAFT-pytorch]$ mkdir sample
(craft_model) [root@server CRAFT-pytorch]$ cd sample
2. 샘플 이미지
(craft_model) [root@server sample]$ ls -al
total 12
drwxrwxr-x 2 yscho02 yscho02 4096 11월 29 15:01 .
drwxrwxr-x 10 yscho02 yscho02 4096 11월 29 15:47 ..
-rw-rw-r-- 1 yscho02 yscho02 2225 11월 29 15:01 sample.png
sample.png 파일
3. 실행
가장 기본적인 옵션으로 모델 파일과 테스트 폴더를 지정하여 생성해본다.
(craft_model) [root@server CRAFT-pytorch]$ python test.py --trained_model=model/craft_mlt_25k.pth --test_folder=sample
4. 결과
(craft_model) [root@server CRAFT-pytorch]$ cd result/
(craft_model) [root@server result]$ ls -al
total 48
drwxrwxr-x 2 root root 4096 11월 29 15:02 .
drwxrwxr-x 10 root root 4096 11월 29 15:47 ..
-rw-rw-r-- 1 root root 16335 11월 29 15:53 res_sample.jpg
-rw-rw-r-- 1 root root 60 11월 29 15:53 res_sample.txt
-rw-rw-r-- 1 root root 16756 11월 29 15:53 res_sample_mask.jpg
디텍팅 된 이미지 | 마스크 이미지 | 좌표 영역 | |
파일명 | res_sample.jpg | res_sample_mask.jpg | res_sample.txt |
37,42,316,42,316,194,37,194 |
5. 사용 옵션
옵션명 | 기본 값 | 설명 |
--trained_model: pretrained model |
weights/craft_mlt_25k.pth | 훈련된 모델 경로 |
--text_threshold: text confidence threshold |
0.7 | 텍스트 상태 임계치 |
--low_text: text low-bound score |
0.4 | 텍스트 바운더리 점수 (어느 정도 여유로 박스 바운딩을 할 것인가의 옵션이다.) |
--link_threshold: link confidence threshold |
0.4 | 링크 상태 임계치 (1이 가까울 수록 캐릭터 셋 단위로 디텍팅을 한다.) |
--cuda: use cuda for inference (default:True) |
true | CUDA (GPU) 사용 여부의 옵션 |
--canvas_size |
1280 | |
--mag_ratio |
1.5 | |
--poly |
false | |
--show_time |
false | |
--test_folde |
/data/ | |
--refine |
false | |
--refiner_model | weights/craft_refiner_CTW1500.pth |
728x90
반응형
'AI 인공지능 > AI Vision' 카테고리의 다른 글
deep-text-recognition-benchmark 학습 (1) | 2022.12.01 |
---|---|
YOLOv7에 대해 알아보자 (0) | 2022.11.22 |
YOLOv7를 활용한 Object Detection (0) | 2022.11.21 |
이미지 유사도 embedding (1) | 2021.12.29 |
패션 의류 분류 (Fashion Classification) (0) | 2021.09.15 |