Cloudera Search Entwickler-Kurs

Classroom Schulung | deutsch | Anspruch

Schulungsdauer: 3 Tage

Ziele

In diesem Kurs lernen Sie die Indizierung von Daten in Hadoop für Echtzeit-Abfragen, um mehr relevante Erkenntnisse aus Ihren Daten mithilfe von Cloudera Search zu erlangen.

Zielgruppe

Entwickler

Voraussetzungen

  • Besuch der Schulung Einstieg in Big Data mit Hadoop oder vergleichbare Kenntnisse
  • Erfahrung in der Programmierung mit Java, C, C++, Perl, oder Python.
  • Erfahrung im Umgang mit der Linux Command Line a

Agenda

Überblick

  • Überblick Cloudera Search
  • Funktionen
  • Einsatzszenarien
  • Architektur

Einfache Abfragen

  • Ausführen einer Abfrage in der Administrationsoberfläche
  • Syntax
  • Techniken zum ungefähren Matching
  • Ausgabekontrolle

Erweiterte Abfragen

  • Relevanz
  • Filter
  • Abfrage Parser
  • Funktionen
  • Geospatial Suche
  • Facettierung

Indizierung von Dokumenten vorbereiten

  • Überblick Indizierungsprozess
  • Morphlines
  • Generierung von Konfigurationsdateien
  • Schema Design
  • Collection Management

Batch Indizierung von HDFS Daten mit MapReduce

  • Überblick HDFS Batch Indizierungsprozess
  • Einsatz des MapReduce Indizierungs-Tools
  • Test und Troubleshooting

(Nahezu)-Echt-Zeit-Indizierung mit Flume

  • Einführung Apache Flume
  • Indizierung mit Flume durchführen
  • Test und Troubleshooting

Indizierung von HBase Daten mit Lily

  • Überblick über Apache HBase
  • Batch Indizierung für HBase
  • Schnelle Indizierung von HBase Tabellen

Daten in anderen Sprachen und Formaten indizieren

  • Feld-Typen und Analyzer Chains
  • Wordstamm
  • Zeichenzuordnung
  • Sprachunterstützung
  • Schema und Analysis Support in der Administrationsoberfläche
  • Metadaten- und Inhalts-Extraktion mit Apache Tika
  • Indizierung von binären Datei-Typen mit SolrCell

Ziele

In diesem Kurs lernen Sie die Indizierung von Daten in Hadoop für Echtzeit-Abfragen, um mehr relevante Erkenntnisse aus Ihren Daten mithilfe von Cloudera Search zu erlangen.

Zielgruppe

Entwickler

Voraussetzungen

  • Besuch der Schulung Einstieg in Big Data mit Hadoop oder vergleichbare Kenntnisse
  • Erfahrung in der Programmierung mit Java, C, C++, Perl, oder Python.
  • Erfahrung im Umgang mit der Linux Command Line a

Agenda

Überblick

  • Überblick Cloudera Search
  • Funktionen
  • Einsatzszenarien
  • Architektur

Einfache Abfragen

  • Ausführen einer Abfrage in der Administrationsoberfläche
  • Syntax
  • Techniken zum ungefähren Matching
  • Ausgabekontrolle

Erweiterte Abfragen

  • Relevanz
  • Filter
  • Abfrage Parser
  • Funktionen
  • Geospatial Suche
  • Facettierung

Indizierung von Dokumenten vorbereiten

  • Überblick Indizierungsprozess
  • Morphlines
  • Generierung von Konfigurationsdateien
  • Schema Design
  • Collection Management

Batch Indizierung von HDFS Daten mit MapReduce

  • Überblick HDFS Batch Indizierungsprozess
  • Einsatz des MapReduce Indizierungs-Tools
  • Test und Troubleshooting

(Nahezu)-Echt-Zeit-Indizierung mit Flume

  • Einführung Apache Flume
  • Indizierung mit Flume durchführen
  • Test und Troubleshooting

Indizierung von HBase Daten mit Lily

  • Überblick über Apache HBase
  • Batch Indizierung für HBase
  • Schnelle Indizierung von HBase Tabellen

Daten in anderen Sprachen und Formaten indizieren

  • Feld-Typen und Analyzer Chains
  • Wordstamm
  • Zeichenzuordnung
  • Sprachunterstützung
  • Schema und Analysis Support in der Administrationsoberfläche
  • Metadaten- und Inhalts-Extraktion mit Apache Tika
  • Indizierung von binären Datei-Typen mit SolrCell

Diese Seite weiterempfehlen