Grin Verlag
Informationsextraktion von Webseiten via RoadRunner
Product Code:
9783640518647
ISBN13:
9783640518647
Condition:
New
$37.90
$37.25
Sale 2%
Informationsextraktion von Webseiten via RoadRunner
$37.90
$37.25
Sale 2%
Forschungsarbeit aus dem Jahr 2009 im Fachbereich Didaktik - Informatik, Note: 1, Ludwig-Maximilians-Universit?t M?nchen (Centrum f?r Informations- und Sprachverarbeitung), Veranstaltung: Web Data Mining, Sprache: Deutsch, Abstract: Das Web hat sich in den letzten Jahren zum gr? ten existierenden und frei verf?gbaren Daten- und Informationsbestand entwickelt. Im Netz, wo es ein absoluter Daten?berfluss und Informationenchaos herrscht, ist beinahe alles zu finden. Auf der Suche nach ben?tigten Informationen wird durch unz?hlige Dokumente gest?bert, die von unterschiedlicher Struktur und unterschiedlicher Relevanz sind. W?hrend die Suchmaschinen einen gewissen Teil des Webs crawlen und somit auch indexiert k?nnen, bleibt ein sehr gro er Teil des Webs verschlossen. Dieser Umstand wird auf die stets wachsende Anzahl von dynamisch generierten Webseiten zur?ckgef?hrt. Die gesuchten Informationen sind nicht mehr statisch verf?gbar sondern werden aufgrund von benutzerspezifischen Anfragen aus den relationalen Datenbanken dynamisch erzeugt. In diesem riesigen Dokumentenbestand, in den statischen und dynamisch generierten Webseiten, werden mit Information Retrieval Verfahren relevante Daten gesucht und nach dem Finden so abgespeichert, dass sie bequem weiterverarbeitet werden k?nnen. Im n?chsten Schritt wird es versucht, aus den semi-strukturierten Dokumenten relevante Informationen zu gewinnen.
| Author: Pawel Broda |
| Publisher: Grin Verlag |
| Publication Date: Feb 01, 2010 |
| Number of Pages: 28 pages |
| Binding: Paperback or Softback |
| ISBN-10: 3640518640 |
| ISBN-13: 9783640518647 |