Web Mining und Web Usage Mining mit dem RapidMiner

Classroom Schulung | deutsch | Anspruch

Schulungsdauer: 2 Tage

Ziele

In diesem Kurs erhalten Sie eine Einführung in Web Mining und Web Analytics. Sie befassen sich unter Anderem mit Themen wie Webcrawler, automatisierter Webseitenklassifikation und -clustering und Informationsextraktion aus Webseiten.

Zielgruppe

  • Administratoren
  • Analysten
  • Anwender
  • Entscheidungsträger
  • Entwickler

Voraussetzungen

  • Data Mining Grundkenntnisse sind vorteilhaft
  • Mathematik Grundkenntnisse sind vorteilhaft

Agenda

Übersicht

  • Data Mining mit RapidMiner
  • Data Mining für Texte oder Web
  • Verknüpfen eines Webcrawlers mit RapidMiner

Vorverarbeitung von Textdaten

  • Tokenizing
  • Tagging
  • Term Frequencies
  • Document Frequencies
  • TFIDF

Maschinelles Lernen für Text Mining

  • Naive Bayes
  • Support Vector Machines

Automatische Klassifikation von Texten

  • Klassifizierung von Webseiten, Blogs oder Diskussionsbeiträgen abhängig
    • von ihrem Inhalt
    • von Benutzerpräferenzen
    • von Stimmungen (Sentiment Classification)

Text Clustering

  • Automatische Segmentierung von Webseiten oder anderen Texten in Gruppen ähnlicher Dokumente
  • Informationsextraktion mittels XPath und regulären Ausdrücken
  • Integration
    • Amazon API
    • Google API
  • Analyse
    • Web Logs
    • Web Log Mining
  • Grundideen zum Aufbau eines Empfehlungssystems für Webanwendungen und Webshops

Ziele

In diesem Kurs erhalten Sie eine Einführung in Web Mining und Web Analytics. Sie befassen sich unter Anderem mit Themen wie Webcrawler, automatisierter Webseitenklassifikation und -clustering und Informationsextraktion aus Webseiten.

Zielgruppe

  • Administratoren
  • Analysten
  • Anwender
  • Entscheidungsträger
  • Entwickler

Voraussetzungen

  • Data Mining Grundkenntnisse sind vorteilhaft
  • Mathematik Grundkenntnisse sind vorteilhaft

Agenda

Übersicht

  • Data Mining mit RapidMiner
  • Data Mining für Texte oder Web
  • Verknüpfen eines Webcrawlers mit RapidMiner

Vorverarbeitung von Textdaten

  • Tokenizing
  • Tagging
  • Term Frequencies
  • Document Frequencies
  • TFIDF

Maschinelles Lernen für Text Mining

  • Naive Bayes
  • Support Vector Machines

Automatische Klassifikation von Texten

  • Klassifizierung von Webseiten, Blogs oder Diskussionsbeiträgen abhängig
    • von ihrem Inhalt
    • von Benutzerpräferenzen
    • von Stimmungen (Sentiment Classification)

Text Clustering

  • Automatische Segmentierung von Webseiten oder anderen Texten in Gruppen ähnlicher Dokumente
  • Informationsextraktion mittels XPath und regulären Ausdrücken
  • Integration
    • Amazon API
    • Google API
  • Analyse
    • Web Logs
    • Web Log Mining
  • Grundideen zum Aufbau eines Empfehlungssystems für Webanwendungen und Webshops

Diese Seite weiterempfehlen