DE Wir können Tesseract entweder selber kompilieren, oder einfach über den Paketmanager installieren. Letzteres geht einfach über folgenden Befehl:sudo apt install tesseract-ocr
DE Wir können Tesseract entweder selber kompilieren, oder einfach über den Paketmanager installieren. Letzteres geht einfach über folgenden Befehl:sudo apt install tesseract-ocr
EN We can either compile Tesseract ourselves or simply install it via the package manager. The latter is easily done via the following command:sudo apt install tesseract-ocr
alemão | inglês |
---|---|
tesseract | tesseract |
kompilieren | compile |
über | via |
befehl | command |
sudo | sudo |
apt | apt |
wir | we |
können | can |
oder | or |
den | the |
DE Tesseract hat standardmäßig nur Englisch als Sprache installiert. Dies können wir hiermit prüfen:tesseract --list-langs
EN Tesseract has only English installed as language by default. We can check this with this:tesseract --list-langs
alemão | inglês |
---|---|
tesseract | tesseract |
installiert | installed |
prüfen | check |
nur | only |
englisch | english |
sprache | language |
können | can |
wir | we |
dies | this |
hat | has |
als | as |
DE Daher nutzen wir die Bibliothek Tesseract von Google. Diese beinhaltet bereits solche Modelle und wurde von vielen Entwicklern optimiert.
EN Therefore, we use the Tesseract library from Google. This already includes such models and has been optimized by many developers.
alemão | inglês |
---|---|
bibliothek | library |
tesseract | tesseract |
modelle | models |
entwicklern | developers |
optimiert | optimized |
nutzen | use |
beinhaltet | includes |
vielen | many |
wir | we |
und | and |
daher | therefore |
von | from |
DE Installation der Tesseract OCR Bibliothek
EN Installing the Tesseract OCR Library
alemão | inglês |
---|---|
installation | installing |
der | the |
tesseract | tesseract |
ocr | ocr |
bibliothek | library |
DE Ob die Installation geklappt hat, können wir ganz einfach mit tesseract -v prüfen.
EN We can easily check if the installation worked with tesseract -v.
alemão | inglês |
---|---|
installation | installation |
einfach | easily |
tesseract | tesseract |
prüfen | check |
ob | if |
können | can |
wir | we |
mit | with |
die | the |
DE Anschließend führen wir folgenden Befehl aus:tesseract coffee-ocr.jpg stdout
EN Then we execute the following command:tesseract coffee-ocr.jpg stdout
alemão | inglês |
---|---|
tesseract | tesseract |
jpg | jpg |
befehl | command |
folgenden | following |
wir | we |
anschließend | the |
DE Da wir gleich das Ganze in einem Pythonskript nutzen wollen, brauchen wir noch ein paar Bibliotheken, wie OpenCV und einen Python-Wrapper für Tesseract
EN Since we want to use the whole thing in a Python script, we require some libraries like OpenCV and a Python wrapper for Tesseract
alemão | inglês |
---|---|
bibliotheken | libraries |
tesseract | tesseract |
python | python |
in | in |
wir | we |
nutzen | use |
und | and |
da | since |
brauchen | to |
für | for |
wollen | want |
gleich | the |
ganze | whole |
DE Wenn du weitere Sprachen, in denen Texte erkannt werden sollen, hinzufügen möchtest, geht das folgendermaßen:sudo apt-get install tesseract-ocr-[lang]
EN If you want to add more languages in which texts should be recognized, this is done as follows:sudo apt-get install tesseract-ocr-[lang]
alemão | inglês |
---|---|
sprachen | languages |
texte | texts |
erkannt | recognized |
folgendermaßen | as follows |
install | install |
sudo | sudo |
lang | lang |
in | in |
möchtest | you want |
geht | this |
hinzufügen | add |
du | you |
DE Mit Tesseract haben wir ein starkes Tool, welches Out-of-the-Box eine Texterkennung für Bilder oder Frames mitbringt
EN With Tesseract we have a powerful tool that provides out-of-the-box text recognition for images or frames
alemão | inglês |
---|---|
tesseract | tesseract |
starkes | powerful |
tool | tool |
oder | or |
bilder | images |
frames | frames |
wir | we |
mit | with |
welches | the |
für | for |
haben | have |
ein | a |
DE Ich habepi@raspi41:~ $ tesseract coffee.jpg stdoutviele Male, mit verschiedenen Optionen probiert (den Dateinamen hatte ich auf coffee.jpg gekürzt)Resultat :
EN I get blank output with the suggested “tesseract coffee-ocr.jpg stdout” command.
alemão | inglês |
---|---|
tesseract | tesseract |
coffee | coffee |
jpg | jpg |
hatte | get |
resultat | output |
ich | i |
mit | with |
den | the |
DE viele Tests später dann, mitpi@raspi41:~ $ tesseract coffee.jpg stdout –dpi 600Resultat : COFFEEhatte ich den gewünschten ErfolgRechner : RASPI 4 mit 4 GB und Raspberry PI OS 32 bit
EN I found by specifying a page segmentation model parameter I could get some output. “tesseract coffee-ocr.jpg stdout –psm 6” gives meee COFFEEaoeen) o- . Lt . Pd we =.omy AE VayPa, ee pon , ”
Mostrando 11 de 11 traduções