본문 바로가기
전체보기/Python

pytesseract 에러 + tesseract-ocr-kor

by 피망우유 2020. 2. 10.

Ubuntu 16.04

ERROR

Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory. Failed loading language \'eng\' Tesseract couldn\'t load any languages! Could not initialize tesseract.')

 

환경변수를 추가해주자.

export TESSDATA_PREFIX="/usr/share/tesseract-ocr/"

 

$  source ~/.bashrc

 

한글을 검출하게 하고 싶다면...

 

$  sudo apt-get install tesseract-ocr-kor

 

usr/share/tesseract-ocr/tessdata 경로 내에 " kor.traineddata " 파일이 생성된 것을 확인할 수 있다.

 

import cv2
import pytesseract

img = cv2.imread("busan.jpg")
text = pytesseract.image_to_string(img, lang='kor')
print(text)

 

Tesseract Version 4

참고로 Ubuntu 16.04에서 install tesseract를 설치하면 다음 버전이 설치된다.

 

$  tesseract -v

tesseract 3.05.01
 leptonica-1.78.0
  libgif 5.2.1 : libjpeg 9c : libpng 1.6.37 : libtiff 4.1.0 : zlib 1.2.11 : libwebp 1.0.2 : libopenjp2 2.3.1

 

이미지 아무거나 가져와서 검출하는 걸 보면 드럽게 못 찾는다.

그런 여러분들을 위해 준비했읍니다 ^^7

 

>> https://www.pyimagesearch.com/2018/09/17/opencv-ocr-and-text-recognition-with-tesseract/

 

Tesseract 4로 설치할 경우 다음 명령어를 이용하여 langs 경로를 잘 찾는 지 확인하자.

 

# 사용가능한 언어 목록 확인하는 명령어

$  tesseract --list-langs

 

만약 다음과 같이 출력된다면 경로를 설정해줘야 한다.

 

Error opening data file /usr/share/tesseract-ocr/4.00/eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.

 

경로 설정~

export TESSDATA_PREFIX="/usr/share/tesseract-ocr/4.00/tessdata/"

 

$  source ~/.bashrc

 

Tesseract에서 지원하는 언어를 확인하고 싶다면...

 

>> https://github.com/tesseract-ocr/tessdoc/blob/master/Data-Files.md

 

tesseract-ocr/tessdoc

Tesseract documentation. Contribute to tesseract-ocr/tessdoc development by creating an account on GitHub.

github.com

해당 언어를 추가하고 싶다면

 

~.traineddata 파일을 다운로드 한 후 

 

/usr/share/tesseract-ocr/4.00/tessdata/ 경로에 넣어주자.

 

$  sudo mv kor.traineddata /usr/share/tesseract-ocr/4.00/tessdata/

 

 

 

'전체보기 > Python' 카테고리의 다른 글

[Tkinter] Python 폴더 선택 창 생성  (1) 2020.04.30
[tkinter + OpenCV] Python 비디오 재생 GUI 생성  (2) 2020.02.29
임시저장  (0) 2020.01.08
파이썬 GUI  (0) 2019.12.02

댓글