Note
pytesseract 텍스트 추출 본문
728x90
from PIL import Image
from pytesseract import *
import re
import cv2
config = ('-l kor --oem 3 --psm 4')
im = cv2.imread('test.jpg')
print(pytesseract.image_to_string(im,config = config))
# gray scale
img_gray = cv2.imread('test.jpg',cv2.IMREAD_GRAYSCALE)
print('추출 한글 : ',pytesseract.image_to_string(im,config = config))
print('그레이 변환 후 추출 한글 : ' ,pytesseract.image_to_string(img_gray,config = config))
print('추출 영어 : ',pytesseract.image_to_string(im,config = config2))
print('그레이 변환 후 추출 영어 : ' ,pytesseract.image_to_string(img_gray,config = config2))
한글에 대한 성능은 좋지 않은 것을 볼 수 있었다.
'Deep Learning > Computer Vision' 카테고리의 다른 글
OpenCV (3) - 이미지 위치 변형 (0) | 2022.05.28 |
---|---|
OpenCV (2) - 이미지 크기 변형 (0) | 2022.05.27 |
OpenCV (1) - 튜토리얼 (0) | 2022.05.26 |
Find Color (0) | 2022.05.16 |
easyocr 텍스트 추출 (0) | 2022.05.12 |
Comments