Ubuntu 16.04
ERROR
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory. Failed loading language \'eng\' Tesseract couldn\'t load any languages! Could not initialize tesseract.')
환경변수를 추가해주자.
export TESSDATA_PREFIX="/usr/share/tesseract-ocr/"
$ source ~/.bashrc
한글을 검출하게 하고 싶다면...
$ sudo apt-get install tesseract-ocr-kor
usr/share/tesseract-ocr/tessdata 경로 내에 " kor.traineddata " 파일이 생성된 것을 확인할 수 있다.
import cv2
import pytesseract
img = cv2.imread("busan.jpg")
text = pytesseract.image_to_string(img, lang='kor')
print(text)
Tesseract Version 4
참고로 Ubuntu 16.04에서 install tesseract를 설치하면 다음 버전이 설치된다.
$ tesseract -v
tesseract 3.05.01
leptonica-1.78.0
libgif 5.2.1 : libjpeg 9c : libpng 1.6.37 : libtiff 4.1.0 : zlib 1.2.11 : libwebp 1.0.2 : libopenjp2 2.3.1
이미지 아무거나 가져와서 검출하는 걸 보면 드럽게 못 찾는다.
그런 여러분들을 위해 준비했읍니다 ^^7
>> https://www.pyimagesearch.com/2018/09/17/opencv-ocr-and-text-recognition-with-tesseract/
Tesseract 4로 설치할 경우 다음 명령어를 이용하여 langs 경로를 잘 찾는 지 확인하자.
# 사용가능한 언어 목록 확인하는 명령어
$ tesseract --list-langs
만약 다음과 같이 출력된다면 경로를 설정해줘야 한다.
Error opening data file /usr/share/tesseract-ocr/4.00/eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
경로 설정~
export TESSDATA_PREFIX="/usr/share/tesseract-ocr/4.00/tessdata/"
$ source ~/.bashrc
Tesseract에서 지원하는 언어를 확인하고 싶다면...
>> https://github.com/tesseract-ocr/tessdoc/blob/master/Data-Files.md
tesseract-ocr/tessdoc
Tesseract documentation. Contribute to tesseract-ocr/tessdoc development by creating an account on GitHub.
github.com
해당 언어를 추가하고 싶다면
~.traineddata 파일을 다운로드 한 후
/usr/share/tesseract-ocr/4.00/tessdata/ 경로에 넣어주자.
$ sudo mv kor.traineddata /usr/share/tesseract-ocr/4.00/tessdata/
'전체보기 > Python' 카테고리의 다른 글
[Tkinter] Python 폴더 선택 창 생성 (1) | 2020.04.30 |
---|---|
[tkinter + OpenCV] Python 비디오 재생 GUI 생성 (2) | 2020.02.29 |
임시저장 (0) | 2020.01.08 |
파이썬 GUI (0) | 2019.12.02 |
댓글