Classification of Document Languages Using Low-Level Information

Nonfiction, Computers, Programming
Cover of the book Classification of Document Languages Using Low-Level Information by Kerim Galal, GRIN Verlag
View on Amazon View on AbeBooks View on Kobo View on B.Depository View on eBay View on Walmart
Author: Kerim Galal ISBN: 9783638389679
Publisher: GRIN Verlag Publication: June 22, 2005
Imprint: GRIN Verlag Language: German
Author: Kerim Galal
ISBN: 9783638389679
Publisher: GRIN Verlag
Publication: June 22, 2005
Imprint: GRIN Verlag
Language: German

Studienarbeit aus dem Jahr 2003 im Fachbereich Informatik - Angewandte Informatik, Note: 1,3, Westfälische Wilhelms-Universität Münster (Informatik), Veranstaltung: Document Analysis and Recognition, 13 Quellen im Literaturverzeichnis, Sprache: Deutsch, Abstract: Die heutige Welt ist geprägt ist von einer zunehmenden globalen Kommunikation. In Zeiten der weltweiten Vernetzung findet ein schneller Informationsaustausch statt. Vor allem das Internet bietet eine enorme Fülle an leicht zugänglichen Informationen. Um dieser Fülle an Informationen beizukommen, sind in den letzten Jahren verstärkt Bemühungen unternommen worden diese Informationsflut zu kontrollieren und zu kategorisieren. Das Kategorisieren von Informationen ist am effektivsten und effizientesten, wenn die zu ordnenden Dokumente in elektronischer Form vorliegen. Dies und allgemein die enorm gestiegene Bedeutung der elektronischen Datenverarbeitung haben dazu beigetragen, dass Organisationen aus allen Bereichen versucht sind, ihre Dokumenteausschließlich in digitaler Form zu verwalten. Das erklärte Ziel ist analoge Dokumente in elektronische zu konvertieren [2]. Dieses Bestreben führte zu der Entwicklung von Optical Character Recognition (OCR), Software die es ermöglicht eingescannte Dokumente in elektronische Textfiles zu konvertieren. Jedoch treffen die meisten OCR Systeme die implizite Prämisse, dass die Sprache des zu verarbeitenden Dokumentes im Voraus bekannt ist [2]. Zwar erkennen manche Programme unterschiedliche romanische Sprachen mit einer akzeptablen Zuverlässigkeit, doch sobald ein anderes Schriftsystem auftritt, werden die Dokumente nicht mehr zuverlässig konvertiert. Daher ist es von großem Vorteil, die Sprache eines Dokuments vor der Anwendung eines OCR Systems zu kennen. Die vorliegende Arbeit beschäftigt sich mit der Spracherkennung von Dokumenten basierend auf low- level Informationen. Im ersten Teil wird ein kurzer Überblick über verschiedene Sprach- und Schriftklassen gegeben. Der zweite Teil der Arbeit beschäftigt sich mit der Art und Weise wie ein zu untersuchendes Dokument vorbereitet wird und welche Merkmale zur anschließenden Schrift- und Spracherkennung dienen. Im Haup tteil der Arbeit werden einige Verfahren zur Schriftklassifizierung und zur Spracherkennung vorgestellt. Abschließend folgt ein Abschnitt über ausgewählte Testverfahren, die die Qualität der vorgestellten Systeme beleuchten.

View on Amazon View on AbeBooks View on Kobo View on B.Depository View on eBay View on Walmart

Studienarbeit aus dem Jahr 2003 im Fachbereich Informatik - Angewandte Informatik, Note: 1,3, Westfälische Wilhelms-Universität Münster (Informatik), Veranstaltung: Document Analysis and Recognition, 13 Quellen im Literaturverzeichnis, Sprache: Deutsch, Abstract: Die heutige Welt ist geprägt ist von einer zunehmenden globalen Kommunikation. In Zeiten der weltweiten Vernetzung findet ein schneller Informationsaustausch statt. Vor allem das Internet bietet eine enorme Fülle an leicht zugänglichen Informationen. Um dieser Fülle an Informationen beizukommen, sind in den letzten Jahren verstärkt Bemühungen unternommen worden diese Informationsflut zu kontrollieren und zu kategorisieren. Das Kategorisieren von Informationen ist am effektivsten und effizientesten, wenn die zu ordnenden Dokumente in elektronischer Form vorliegen. Dies und allgemein die enorm gestiegene Bedeutung der elektronischen Datenverarbeitung haben dazu beigetragen, dass Organisationen aus allen Bereichen versucht sind, ihre Dokumenteausschließlich in digitaler Form zu verwalten. Das erklärte Ziel ist analoge Dokumente in elektronische zu konvertieren [2]. Dieses Bestreben führte zu der Entwicklung von Optical Character Recognition (OCR), Software die es ermöglicht eingescannte Dokumente in elektronische Textfiles zu konvertieren. Jedoch treffen die meisten OCR Systeme die implizite Prämisse, dass die Sprache des zu verarbeitenden Dokumentes im Voraus bekannt ist [2]. Zwar erkennen manche Programme unterschiedliche romanische Sprachen mit einer akzeptablen Zuverlässigkeit, doch sobald ein anderes Schriftsystem auftritt, werden die Dokumente nicht mehr zuverlässig konvertiert. Daher ist es von großem Vorteil, die Sprache eines Dokuments vor der Anwendung eines OCR Systems zu kennen. Die vorliegende Arbeit beschäftigt sich mit der Spracherkennung von Dokumenten basierend auf low- level Informationen. Im ersten Teil wird ein kurzer Überblick über verschiedene Sprach- und Schriftklassen gegeben. Der zweite Teil der Arbeit beschäftigt sich mit der Art und Weise wie ein zu untersuchendes Dokument vorbereitet wird und welche Merkmale zur anschließenden Schrift- und Spracherkennung dienen. Im Haup tteil der Arbeit werden einige Verfahren zur Schriftklassifizierung und zur Spracherkennung vorgestellt. Abschließend folgt ein Abschnitt über ausgewählte Testverfahren, die die Qualität der vorgestellten Systeme beleuchten.

More books from GRIN Verlag

Cover of the book Die Bilanz des Europäischen Systems der Zentralbanken (ESZB). Eine desaggregierte Betrachtung by Kerim Galal
Cover of the book Darstellung und kritische Auseinandersetzung mit Peter Singers 'Praktischer Ethik' by Kerim Galal
Cover of the book Mitarbeiterorientierte Anreize in der Pflege by Kerim Galal
Cover of the book Kongenitale linksventrikuläre Aneurysmata und Divertikel. Eine Übersicht by Kerim Galal
Cover of the book Braucht die Partnerschaft noch die Ehe? by Kerim Galal
Cover of the book Tod, Trauer und Hoffnung: Themen im Religionsunterricht der Grundschule? by Kerim Galal
Cover of the book Inwieweit können durch Maßnahmen des Supply Chain Management kostensteigernde Impulse aus dem Transportbereich gegengesteuert werden? by Kerim Galal
Cover of the book Berufsrisiko Traumatisierung - Die verletzten Seelen der Lokführer by Kerim Galal
Cover of the book Welche Bedeutung haben die Gestaltung von Schulgebäuden und die Ausstattung von Klassenräumen? Eine Untersuchung der Einschätzung von Lehramtstudierenden by Kerim Galal
Cover of the book Identifikation und Bewertung von Synergien bei Mergers & Acquisitions by Kerim Galal
Cover of the book Literatur- und Patentrecherche zu parallelkinematischen Werkzeugmaschinen by Kerim Galal
Cover of the book Soziale Strukturen: Gruppenkohäsion by Kerim Galal
Cover of the book Der Europäische Aktionsplan Umwelt und Gesundheit 2004-2010 by Kerim Galal
Cover of the book Basel III - Kritische Würdigung neuer Eigenkapitalvorschriften für Banken by Kerim Galal
Cover of the book Die Elbstromregulierung und die Anfänge der sächsischen Natur- und Heimatschutzbewegung 1871-1914 by Kerim Galal
We use our own "cookies" and third party cookies to improve services and to see statistical information. By using this website, you agree to our Privacy Policy