Deep Learning/Computer Vision
pytesseract 텍스트 추출
Jun's N
2022. 5. 10. 20:13
from PIL import Image
from pytesseract import *
import re
import cv2
config = ('-l kor --oem 3 --psm 4')
im = cv2.imread('test.jpg')
print(pytesseract.image_to_string(im,config = config))
# gray scale
img_gray = cv2.imread('test.jpg',cv2.IMREAD_GRAYSCALE)
print('추출 한글 : ',pytesseract.image_to_string(im,config = config))
print('그레이 변환 후 추출 한글 : ' ,pytesseract.image_to_string(img_gray,config = config))
print('추출 영어 : ',pytesseract.image_to_string(im,config = config2))
print('그레이 변환 후 추출 영어 : ' ,pytesseract.image_to_string(img_gray,config = config2))
한글에 대한 성능은 좋지 않은 것을 볼 수 있었다.
728x90