Maestro Recognition Server OCR

Maestro Recognition Server OCR - Überblick

OCR-Software zum hocheffizienten Scannen, Speichern und Abrufen von Dokumenten

Große Unternehmen, Behörden und wachsende Organisationen nutzen Maestro Recognition Server, um gescannte Papiere und Bilddokumente in PDF-Dateien umzuwandeln, in denen nach Text gesucht werden kann. Maestro kombiniert eine Bildvorverarbeitung und eine proprietäre OCR-Engine mit Voting-Algorithmus, um ohne Anpassungen eine führende Präzision bei der Texterkennung zu liefern. Weiterhin bietet die OCR-Software Automatisierungstechniken sowie verschiedene Funktionen zur Verarbeitung großer Datenmengen. Somit können auch in Großunternehmen die Workflows zum Scannen, Speichern und Archivieren optimiert werden.

Präzision, Geschwindigkeit und Unkompliziertheit beim OCR

Der Maestro Recognition Server von Foxit wurde im Hinblick auf automatisiertes, hochvolumiges Scannen von Dokumenten mit anschließender OCR-Verarbeitung entwickelt. Maestro konvertierte Papierdokumente und gescannte Dokumente in PDF-Dateien, in denen nach Text gesucht werden kann. Zusätzlich automatisiert Maestro den OCR-Prozess, indem es automatisch jedes Dokument konvertiert, das in einem überwachten Ordner abgelegt wird. Dabei werden die vom Benutzer konfigurierten Einstellungen berücksichtigt. Neben der OCR-Automatisierung bietet Maestro unbeschränktes Multi-Threading und OCR-Verarbeitung im Stapelbetrieb bis zu mehreren Milliarden Seiten pro Jahr. Damit ist Maestro auch für Großunternehmen bestens geeignet.

Maestro ist auf hohe Präzision, Geschwindigkeit und Unkompliziertheit beim OCR ausgelegt. Es liefert sehr hohe Texterkennungsraten, da es sowohl hochentwickelte Techniken zur Bildvorverarbeitung als auch eine proprietäre OCR-Engine mit Voting-Algorithmus einsetzt. Wenn Maestro für den Hochgeschwindigkeitsbetrieb konfiguriert ist, können im Durchschnitt fast 6.000 Seiten pro Stunde und Prozessorkern verarbeitet werden. Schließlich ist Maestro eine flexible OCR-Lösung, die einfach in bestehende Dokument-Imaging-Workflows integriert werden kann. Da mehrere Workflows zur Verfügung stehen, können die Anwender viele Bildverarbeitungsfunktionen durchführen, die über das reine OCR hinausgehen.

  • Hochpräzise OCR-Lösung für das Scannen, Archivieren und Digitalisieren von Dokumenten in Unternehmen
  • "Überwachter Ordner" für bedienungsloses, automatisiertes OCR
  • OCR im Stapelbetrieb und uneingeschränktes Multi-Threading zur schnellen Verarbeitung großer Mengen
  • Robuste OCR-Funktionalität mit Fehlerprotokolldateien und Konfidenzeinstellungen
  • Unterstützt die OCR-Eingabe in 13 unterschiedlichen Dateiformaten einschl. TIFF und PDF
  • Ausgabe in 13 unterschiedlichen Dateiformaten einschl. PDF und PDF/A

OCR-Präzision und -Zuverlässigkeit im Maestro Recognition Server

Dank hochpräzisem OCR können wichtige Informationen mit einer einfachen und sofortigen Suche nach Schlüsselwörtern gefunden und müssen nicht stundenlang manuell gesucht werden. Die OCR-Engine von Maestro gehört zu den genauesten OCR-Produkten, die derzeit erhältlich sind. Die OCR-Funktion von Maestro wurde getestet und erkennt nachweislich schwierige Texte, die von Wettbewerbsprodukten oft nicht korrekt erkannt werden, darunter Text in Dokumenten, die mit niedriger Auflösung erfasst wurden, Dokumente mit Texten in unterschiedlichen Schreibrichtungen und Dokumente mit Texten in kontrastarmen Farben.

Genauere OCR-Ergebnisse führen zu einer größeren Effizienz bei der Indizierung, der Suche nach und der Arbeit mit gescannten Dokumenten. Sie sorgen auch für eine präzisere Textextraktion, ermöglichen Data-Mining in Big-Data-Anwendungen und machen die Mitarbeiter effizienter. Mit Maestro können die Anwender unverzüglich ein bestimmtes Wort innerhalb eines Dokuments finden, egal, ob es eine oder tausend Seiten umfasst – quasi die Nadel im Heuhaufen.

Schnellere Verarbeitung und höhere OCR-Präzision

Maestros OCR-Funktion hat in Tests gezeigt, dass sie präziser als führende OCR-Engines arbeitet. Die sehr hohen Erkennungsraten werden durch den Einsatz hochentwickelter Bildverarbeitungstechniken erreicht: Re-Sampling, Trennung von Vordergrund und Hintergrund, automatische Drehung und Erlernen von Schriften.

FOXIT FÜHRENDE OCR-ENGINE ERGEBNIS
25 Schwarzweiß-Dateien 11.650 Wörter 10.151 Wörter Foxit ist 15 %
besser
25 Farbdateien 4.905 Wörter 4.421 Wörter Foxit ist 11 %
besser

Hochentwickelte Bildverarbeitungstechnik

Maestro Recognition Server zeichnet sich durch eine höhere OCR-Genauigkeit aufgrund hochentwickelter Bildverarbeitungsfähigkeiten aus. Maestro kann Bilder entzerren und Störungen entfernen, um die Dokumentqualität zu erhöhen. Weiterhin unterstützt Maestro Bildverarbeitungsfunktionen wie automatische Drehung, automatische Farbumkehr, automatisches Zuschneiden und Farb-Re-Sampling. Die zuverlässigen Bildverarbeitungsfunktionen von Maestro verbessern die Bildqualität bereits vor der Verarbeitung, was zu genaueren OCR-Ergebnissen führt.

Erweiterte PDF-Steuerung

Maestro Recognition Server bietet überlegene PDF-Steuerungsfunktionen: PDF-Linearisierung, erweiterte Sicherheit, PDF/A-Kompatibilität, Einfügung von Metadaten, Steuerung der PDF-Anzeige, Bates-Stempelung sowie Kopf- und Fußzeilen. Maestro kann eine linearisierte PDF-Datei ausgeben, die im Web schneller betrachtet werden kann. Damit kann ein Benutzer augenblicklich eine bestimmte Seite innerhalb der PDF-Datei anzeigen lassen, während der Rest des Dokuments im Hintergrund geladen wird. Maestro bietet darüber hinaus leistungsfähige Sicherheitsfunktionen, darunter Optionen für den Bearbeitungs-, Druck- und Leseschutz. Mit Maestro können die Anwender ihre Dokumente PDF/A-kompatibel speichern.

  • Überwachte Ordner: Zur Automatisierung der OCR-Prozesse. Überwachte Ordner ermöglichen eine unbeaufsichtige OCR-Verarbeitung. Dateien werden nach Text durchsuchbar, indem sie einfach in einem bestimmten Ordner abgelegt werden.
  • OCR-Präzision: Maestro hat sich in Tests als eine der präzisesten OCR-Engines erwiesen, die auch schwierige Texte, die von Wettbewerbsprodukten oft nicht korrekt erkannt werden, verarbeitet. Genauere OCR-Ergebnisse führen zu effizienteren Mitarbeitern und zu Verbesserungen bei der Speicherung, beim Zugriff und bei der Verwaltung von Dokumenten.
  • Schnelles OCR: Verarbeitung von fast 6.000 Seiten pro Stunde und Prozessorkern.
  • OCR-Stapelbetrieb und Multi-Threading auf unbeschränkt vielen Prozessorkernen: Maestro ist auf große Datenmengen ausgelegt, wie sie in Großunternehmen anfallen, und eignet sich für tausende, aber auch bis zu mehreren Milliarden Seiten pro Jahr.
  • Konvertieren verschiedener Formate: Unterstützt die Konvertierung von PDF, TXT, RTF, JPG, TIFF u. a. in PDF-Dateien, die vollständig nach Text durchsucht werden können.
  • Fehlerüberwachungsmodul: Wenn Verarbeitungsfehler auftreten, kann das System den Job automatisch wiederholen und am Ende des Stapels ein Fehlerprotokoll erstellen.
  • Maestro unterstützt 118 Sprachen, unter anderem OCR für vereinfachtes und traditionelles Chinesisch, Japanisch, Koreanisch und Arabisch.

Systemanforderungen

Windows-Server
  • CPU - Intel Pentium-Prozessor oder kompatibel, 2,0 GHz und höher
  • Kerne - Es werden mindestens zwei Prozessorkerne empfohlen
  • RAM - 1 GB RAM pro Kern (mindestens 2 GB pro Kern werden empfohlen)
  • Betriebssystem - Windows 10 / 8.1 / 8 / 7 / 2012 / 2008
Linux-Benutzer
  • Verwenden Sie eine Windows-Emulation mit VirtualBox 3 oder höher (VirtualBox ist Freeware)
Mac-Benutzer
  • Mit den beiden folgenden Methoden können Sie Software von Foxit auf einem Mac verwenden:
  • Mac mit OS X, auf dem eine Windows-Emulation läuft (VM Fusion 2.0)
  • Mac, der auf einem Windows-Betriebssystem läuft (direkt oder über Bootcamp)