- Mitglied seit
- 30.07.2000
- Beiträge
- 4.626
- Reaktionen
- 71
Moin.
Der Titel trifft's nicht ganz.
Ich scanne im Moment sehr viele Bücher und lass OCR drüberlaufen. Dabei scanne ich eigentlich immer in 600dpi s/w. 600 dpi, damit OCR richtig gut funktioniert - und schwarz-weiß, damit die Größe nicht exorbitant wird.
Allerdings habe ich auch öfter mal Bücher mit Grauskala-Bildern. Die Auflösung ist hoch genug, dass die einzelnen Punkte "auseinandergezogen" werden und für den Menschen alles problemlos erkennbar ist. Trotzdem ist das OCR verwirrt und damit blind. Siehe:
(Nach dem Laden nochmal draufklicken für volle Größe)
Stark verkleinert ist es dann wirklich eine ziemlch homogene, graue Fläche, die man mit Gimp auch ziemlich leicht (z.B. durch Schwellwertanpassung) in weiß konvertieren kann:
Gibt's ne Möglichkeit sehr schnell aus solchen Seiten das "graue Band" rauszukriegen? Gibt es Programme für Raster-Grafiken (Zeitung...), die das können? Sehr schnell muss es deswegen gehen, weil ich mehrere hundert Seiten täglich bearbeite und da keine Zeit für lange Kinkerlitzchen auf jeder 10. Seite ist...
Der Titel trifft's nicht ganz.
Ich scanne im Moment sehr viele Bücher und lass OCR drüberlaufen. Dabei scanne ich eigentlich immer in 600dpi s/w. 600 dpi, damit OCR richtig gut funktioniert - und schwarz-weiß, damit die Größe nicht exorbitant wird.
Allerdings habe ich auch öfter mal Bücher mit Grauskala-Bildern. Die Auflösung ist hoch genug, dass die einzelnen Punkte "auseinandergezogen" werden und für den Menschen alles problemlos erkennbar ist. Trotzdem ist das OCR verwirrt und damit blind. Siehe:
(Nach dem Laden nochmal draufklicken für volle Größe)
Stark verkleinert ist es dann wirklich eine ziemlch homogene, graue Fläche, die man mit Gimp auch ziemlich leicht (z.B. durch Schwellwertanpassung) in weiß konvertieren kann:
Gibt's ne Möglichkeit sehr schnell aus solchen Seiten das "graue Band" rauszukriegen? Gibt es Programme für Raster-Grafiken (Zeitung...), die das können? Sehr schnell muss es deswegen gehen, weil ich mehrere hundert Seiten täglich bearbeite und da keine Zeit für lange Kinkerlitzchen auf jeder 10. Seite ist...