Deep Learning/Computer Vision

pytesseract 텍스트 추출

Jun's N 2022. 5. 10. 20:13
from PIL import Image
from pytesseract import *
import re
import cv2

config = ('-l kor --oem 3 --psm 4')
im = cv2.imread('test.jpg')
print(pytesseract.image_to_string(im,config = config))

# gray scale
img_gray = cv2.imread('test.jpg',cv2.IMREAD_GRAYSCALE)

print('추출 한글 : ',pytesseract.image_to_string(im,config = config))
print('그레이 변환 후 추출 한글 : ' ,pytesseract.image_to_string(img_gray,config = config))
print('추출 영어 : ',pytesseract.image_to_string(im,config = config2))
print('그레이 변환 후 추출 영어 : ' ,pytesseract.image_to_string(img_gray,config = config2))

한글에 대한 성능은 좋지 않은 것을 볼 수 있었다.

 

 

 

728x90