Design und Implementierung eines Multi-Classifier-Systems (MCS) für die Erkennung von gerendertem Text

Nonfiction, Computers, Programming
Cover of the book Design und Implementierung eines Multi-Classifier-Systems (MCS) für die Erkennung von gerendertem Text by Stefan Fleischer, GRIN Verlag
View on Amazon View on AbeBooks View on Kobo View on B.Depository View on eBay View on Walmart
Author: Stefan Fleischer ISBN: 9783640200832
Publisher: GRIN Verlag Publication: November 4, 2008
Imprint: GRIN Verlag Language: German
Author: Stefan Fleischer
ISBN: 9783640200832
Publisher: GRIN Verlag
Publication: November 4, 2008
Imprint: GRIN Verlag
Language: German

Diplomarbeit aus dem Jahr 2007 im Fachbereich Informatik - Programmierung, Note: 1,0, Westfälische Wilhelms-Universität Münster (Institut für Informatik (Computer Vision and Pattern Recognition Group)), 35 Quellen im Literaturverzeichnis, Sprache: Deutsch, Abstract: Ziel dieser Arbeit ist es, die Klassifikationskomponente des am Institut für Informatik entwickelten OCR-Systems zur Erkennung von gerendertem Text durch die Implementierung eines Multi-Classifier-Systems (MCS) weiter zu optimieren. Diese Arbeit befasst sich mit dem Design und der Implementierung eines Multi-Classifier-Systems, das mehrere verschiedene Klassifikatoren zur Erkennung gerenderter Schriftzeichen kombiniert. Das MCS wird schließlich in das existierende OCR-System integriert, um dessen Effektivität zu verbessern. Kapitel 2 befasst sich zunächst mit Analyse und Beurteilung des vorliegenden OCR-Systems. Kapitel 2.1 identifiziert hierzu konkrete Eigenschaften gerenderter Texte und die damit einhergehenden Herausforderungen bei der automatischen Texterkennung. Kapitel 2.2 stellt das bestehende OCR-Systems zur Erkennung von gerendertem Text vor, dessen Komponenten in Kapitel 2.3 analysiert werden, um das weitere Vorgehen im Hinblick auf das Ziel dieser Arbeit zu planen. Kapitel 3 befasst sich mit der Schaffung der für die Entwicklung des MCS notwendigen Voraussetzungen. Das betrifft insbesondere die dem OCR-System zu Grunde liegenden Trainingsdaten, auf deren Basis es entwickelt und getestet wurde. In Kapitel 3.1 wird dafür zun¨achst eine Kategorisierung von gerendertem Text vorgenommen, anhand der sich die Zusammensetzung bereits existierender Trainingsdaten untersuchen l¨asst. Damit die Trainingsdaten in einem sinnvollen Format vorliegen, wurde die Datenhaltung ¨uberarbeitet. Kapitel 3.2 stellt diese überarbeitung vor. Die identifizierten Kategorien werden dann herangezogen, um in Kapitel 3.3 eine strategische Erweiterung der Datenbasis vorzunehmen. Kapitel 4 leitet zum Kern der Arbeit über: Auf Basis der Trainingsdaten werden verschiedene Klassifikatoren konstruiert. Um qualifizierte Klassifikatoren konstruieren zu können, ist das Vorhandensein geeigneter Merkmale entscheidend, anhand der sich die Schriftzeichen klassifizieren lassen. Kapitel 4.1 identifiziert solche Merkmale und konstruiert auf deren Grundlage eine Reihe von Klassifikatoren. Kapitel 5 befasst sich schließlich mit einer gruppenweisen Kombination der konstruierten Klassifikatoren, um durch Ausnutzung der Vorteile verschiedener Klassifikatoren einen positiven Beitrag zur Erhöhung der Erkennungsgenauigkeit zu erhalten und somit die Effektivität des bestehenden OCR-Systems zu verbessern.

View on Amazon View on AbeBooks View on Kobo View on B.Depository View on eBay View on Walmart

Diplomarbeit aus dem Jahr 2007 im Fachbereich Informatik - Programmierung, Note: 1,0, Westfälische Wilhelms-Universität Münster (Institut für Informatik (Computer Vision and Pattern Recognition Group)), 35 Quellen im Literaturverzeichnis, Sprache: Deutsch, Abstract: Ziel dieser Arbeit ist es, die Klassifikationskomponente des am Institut für Informatik entwickelten OCR-Systems zur Erkennung von gerendertem Text durch die Implementierung eines Multi-Classifier-Systems (MCS) weiter zu optimieren. Diese Arbeit befasst sich mit dem Design und der Implementierung eines Multi-Classifier-Systems, das mehrere verschiedene Klassifikatoren zur Erkennung gerenderter Schriftzeichen kombiniert. Das MCS wird schließlich in das existierende OCR-System integriert, um dessen Effektivität zu verbessern. Kapitel 2 befasst sich zunächst mit Analyse und Beurteilung des vorliegenden OCR-Systems. Kapitel 2.1 identifiziert hierzu konkrete Eigenschaften gerenderter Texte und die damit einhergehenden Herausforderungen bei der automatischen Texterkennung. Kapitel 2.2 stellt das bestehende OCR-Systems zur Erkennung von gerendertem Text vor, dessen Komponenten in Kapitel 2.3 analysiert werden, um das weitere Vorgehen im Hinblick auf das Ziel dieser Arbeit zu planen. Kapitel 3 befasst sich mit der Schaffung der für die Entwicklung des MCS notwendigen Voraussetzungen. Das betrifft insbesondere die dem OCR-System zu Grunde liegenden Trainingsdaten, auf deren Basis es entwickelt und getestet wurde. In Kapitel 3.1 wird dafür zun¨achst eine Kategorisierung von gerendertem Text vorgenommen, anhand der sich die Zusammensetzung bereits existierender Trainingsdaten untersuchen l¨asst. Damit die Trainingsdaten in einem sinnvollen Format vorliegen, wurde die Datenhaltung ¨uberarbeitet. Kapitel 3.2 stellt diese überarbeitung vor. Die identifizierten Kategorien werden dann herangezogen, um in Kapitel 3.3 eine strategische Erweiterung der Datenbasis vorzunehmen. Kapitel 4 leitet zum Kern der Arbeit über: Auf Basis der Trainingsdaten werden verschiedene Klassifikatoren konstruiert. Um qualifizierte Klassifikatoren konstruieren zu können, ist das Vorhandensein geeigneter Merkmale entscheidend, anhand der sich die Schriftzeichen klassifizieren lassen. Kapitel 4.1 identifiziert solche Merkmale und konstruiert auf deren Grundlage eine Reihe von Klassifikatoren. Kapitel 5 befasst sich schließlich mit einer gruppenweisen Kombination der konstruierten Klassifikatoren, um durch Ausnutzung der Vorteile verschiedener Klassifikatoren einen positiven Beitrag zur Erhöhung der Erkennungsgenauigkeit zu erhalten und somit die Effektivität des bestehenden OCR-Systems zu verbessern.

More books from GRIN Verlag

Cover of the book Einflussfaktoren auf die individuelle Lebenserwartung in den USA by Stefan Fleischer
Cover of the book Kindersklaven in der Gesellschaft des antiken Rom by Stefan Fleischer
Cover of the book 'Briefe eines russischen Reisenden'. Nikolay Karamzin und sein Verhältnis zur Französischen Revolution by Stefan Fleischer
Cover of the book Die Lage der Christen im Osmanischen Reich in der Zeit von Fatih Sultan Mehmed by Stefan Fleischer
Cover of the book Zu den politischen Stellungnahmen von Pierre Bourdieu (der Jahre 1988 - 2001) - Wandel der politischen, ökonomischen und kulturellen Sphäre vor dem Hintergrund der Herrschaft des Neoliberalismus by Stefan Fleischer
Cover of the book Der homo oeconomicus in Bezug auf verkehrspolitische Engpässe am Beispiel der 'Billig-Flüge' unter Berücksichtigung der Theorie Joseph Schumpeters by Stefan Fleischer
Cover of the book Projektcontrolling. Methoden der Planung, Kontrolle und Steuerung by Stefan Fleischer
Cover of the book Sprachvergleich Deutsch-Türkisch by Stefan Fleischer
Cover of the book Wandlungstendenzen der Familie und sozialpolitische Reaktionsmuster by Stefan Fleischer
Cover of the book Der Wertewandel von 1950 bis heute - Begriffsdefinition und Problematik der Werterziehung by Stefan Fleischer
Cover of the book Der Beruf des/der Gemeindereferenten/-in - Geschichte, Ausbildung, Einsatzfelder by Stefan Fleischer
Cover of the book Kultur und Identität in Kate Chopins 'The Awakening' by Stefan Fleischer
Cover of the book Georg Simmel - Über Emotionen in Liebesbeziehungen: Darstellung und Kritik by Stefan Fleischer
Cover of the book Systemische Methoden im Fernberatungssetting by Stefan Fleischer
Cover of the book Lehrer, Schule und Unterricht im Nationalsozialismus by Stefan Fleischer
We use our own "cookies" and third party cookies to improve services and to see statistical information. By using this website, you agree to our Privacy Policy