W zasadzie, to należałoby się przyłączyć do projektu: http://code.google.com/p/tesseract-polish/ - wówczas istnieje szansa, że tesseract będzie rozpoznawał język polski.
Nadto istnieje - ale rozwiązanie dla deweloperów - pochodzące z FR. Niestety, w oparciu o ten silnik nikt, wliczając FR, nawet komercyjnego rozwiązania pod linuksa nie zaproponował.
OCR i Linux
Tom:-), ty na poważnie pytasz? Wystarczy wpisać w terminalu
i wcisnąć klawisz ENTER.
Kod: Zaznacz cały
gocrRaczej poważnie i wiem że tak trzeba... Wpisuję i nic się nie dzieje oprócz zwróconego komunikatu:ruun pisze:ty na poważnie pytasz?
Kod: Zaznacz cały
Optical Character Recognition --- gocr 0.45 20071126
Copyright (C) 2001-2007 Joerg Schulenburg
released under the GNU General Public License
use option -h for help
Tom:-), czytać komunikaty potrafisz?
Napisz w terminaluPóźniej jeszcze:
Najlepiej doinstaluj sobie nakładkę graficzną:
Napisz w terminalu
Kod: Zaznacz cały
gocr -hKod: Zaznacz cały
man gocrKod: Zaznacz cały
apt-cache search gocr
...
gocr-tk - A tcl/tk wrapper around gocr
...
Kod: Zaznacz cały
apt-get install gocr-tk