Latent Semantic Indexing (LSI) - ein kurzer Überblick

ein kurzer Überblick

Business & Finance, Industries & Professions, Information Management
Cover of the book Latent Semantic Indexing (LSI) - ein kurzer Überblick by Irene Götz, GRIN Verlag
View on Amazon View on AbeBooks View on Kobo View on B.Depository View on eBay View on Walmart
Author: Irene Götz ISBN: 9783638252065
Publisher: GRIN Verlag Publication: February 7, 2004
Imprint: GRIN Verlag Language: German
Author: Irene Götz
ISBN: 9783638252065
Publisher: GRIN Verlag
Publication: February 7, 2004
Imprint: GRIN Verlag
Language: German

Studienarbeit aus dem Jahr 2001 im Fachbereich Informationswissenschaften, Informationsmanagement, Note: 2,0, Universität Hildesheim (Stiftung) (Angewandte Sprachwissenschaft), Veranstaltung: Virtuelles Hauptseminar, Sprache: Deutsch, Abstract: Bei dieser Retrieval-Methode werden in einem n -dimensionalen Raum A nfragen und Dokumente in Form von Vektoren repräsentiert, wobei jeder Suchbegriff eine Dimension darstellt. Die gefundenen Dokumente werden aufgrund ihrer Deskriptoren als Vektoren in den Raum eingeordnet, ihre Position im R aum bezeichnet ihre Relevanz. Messbar wird die Ähnlichkeit zwischen Anfrage und Dokument anhand des Cosinus- Winkels zwischen Anfrage- und Dokumentvektor: Je kleiner das Cosinus-Maß des Winkels zwischen Anfrage und Dokument, desto größer die Ähnlichkeit zwischen Dokument und Anfrage. Die Vektor-Retrieval-Methode ist weit verbreitet, hat jedoch den Nachteil, dass sie Terme als voneinander unabhängig betrachtet. Wie bei den anderen 'klassischen' Retrieval-Techniken (Boolsches Retrieval, probabilistisches Retrieval, vgl. http://www.iud.fh-darmstadt.de/iud/wwwmeth/LV/ss97/wpai/grpTexte/textgr2.htm#Heading26) werden exakte Übereinstimmungen zwischen in der Anfrage enthaltenen und in den Dokumenten verwendeten Termen, unabhängig vom Kontext, in dem sie gebraucht werden gesucht. Diese Technik ist in der Hinsicht problematisch, dass es z.B. für ein und dieselbe Sache oft verschiedene Bezeichnungen gibt, und somit relevante Dokumente oft nicht ausgegeben werden, weil im Dokument eine andere Bezeichnung als in der Anfrage verwendet wurde. Hier setzt Latent Semantic Indexing an: Dokumente werden aufgrund von Wort-Assoziationen und kontextue llen Zusammenhängen indexiert, sodass auch relevante Dokumente, die mit der Anfrage keine Wörter gemeinsam haben gefunden werden.

View on Amazon View on AbeBooks View on Kobo View on B.Depository View on eBay View on Walmart

Studienarbeit aus dem Jahr 2001 im Fachbereich Informationswissenschaften, Informationsmanagement, Note: 2,0, Universität Hildesheim (Stiftung) (Angewandte Sprachwissenschaft), Veranstaltung: Virtuelles Hauptseminar, Sprache: Deutsch, Abstract: Bei dieser Retrieval-Methode werden in einem n -dimensionalen Raum A nfragen und Dokumente in Form von Vektoren repräsentiert, wobei jeder Suchbegriff eine Dimension darstellt. Die gefundenen Dokumente werden aufgrund ihrer Deskriptoren als Vektoren in den Raum eingeordnet, ihre Position im R aum bezeichnet ihre Relevanz. Messbar wird die Ähnlichkeit zwischen Anfrage und Dokument anhand des Cosinus- Winkels zwischen Anfrage- und Dokumentvektor: Je kleiner das Cosinus-Maß des Winkels zwischen Anfrage und Dokument, desto größer die Ähnlichkeit zwischen Dokument und Anfrage. Die Vektor-Retrieval-Methode ist weit verbreitet, hat jedoch den Nachteil, dass sie Terme als voneinander unabhängig betrachtet. Wie bei den anderen 'klassischen' Retrieval-Techniken (Boolsches Retrieval, probabilistisches Retrieval, vgl. http://www.iud.fh-darmstadt.de/iud/wwwmeth/LV/ss97/wpai/grpTexte/textgr2.htm#Heading26) werden exakte Übereinstimmungen zwischen in der Anfrage enthaltenen und in den Dokumenten verwendeten Termen, unabhängig vom Kontext, in dem sie gebraucht werden gesucht. Diese Technik ist in der Hinsicht problematisch, dass es z.B. für ein und dieselbe Sache oft verschiedene Bezeichnungen gibt, und somit relevante Dokumente oft nicht ausgegeben werden, weil im Dokument eine andere Bezeichnung als in der Anfrage verwendet wurde. Hier setzt Latent Semantic Indexing an: Dokumente werden aufgrund von Wort-Assoziationen und kontextue llen Zusammenhängen indexiert, sodass auch relevante Dokumente, die mit der Anfrage keine Wörter gemeinsam haben gefunden werden.

More books from GRIN Verlag

Cover of the book Führungsstile in der Wirtschaft. Ihr Einfluss auf die Zielerreichung by Irene Götz
Cover of the book Ehrenmorde. Töten im Namen der Religion? by Irene Götz
Cover of the book Das Kind Gottes und die kindliche Nähe zum Göttlichen. Das Motiv des Kindes in Gabriela Mistrals Dichtung by Irene Götz
Cover of the book Die Karte als Medium zwischen Objektivität und didaktischer Suggestion by Irene Götz
Cover of the book Bestimmungsgrößen bei der Lehrplanerstellung. Die curricularen Hauptdeterminanten nach Dubs und Reetz by Irene Götz
Cover of the book Spiritualität im populären Spielfilm Hollywoods by Irene Götz
Cover of the book Unterrichtsstunde: Mathematik - Arbeiten mit dem Geobrett by Irene Götz
Cover of the book Trainingsplanung und -steuerung eines Krafttrainings nach der ILB-Methode by Irene Götz
Cover of the book Schnell Radfahren - Die optimale Sitzposition für Rennrad-, Zeitfahrer und Triathleten by Irene Götz
Cover of the book Jesus zeigt einem Gelähmten, wie er sein Leben wieder lieben kann, Mk 2, 1-12 by Irene Götz
Cover of the book Faszination Videokunst by Irene Götz
Cover of the book Die Entwicklung der Jenseitsvorstellungen im Judentum und Christentum an Hand ausgewählter Schriften bis zur Mitte des zweiten nachchristlichen Jahrhunderts by Irene Götz
Cover of the book Welche Gründe führen dazu, dass Demokratien Kriege führen, obwohl sie das nach der Theorie des Demokratischen Friedens überhaupt nicht dürften? by Irene Götz
Cover of the book Wertklärung und Werteerziehung - Werte als Ideale unseres Handelns by Irene Götz
Cover of the book Die Discounted Cash Flow Methode zur Bewertung von Unternehmen und strategischen Geschäftseinheiten by Irene Götz
We use our own "cookies" and third party cookies to improve services and to see statistical information. By using this website, you agree to our Privacy Policy