Cloudera Search Entwickler-Kurs

Classroom Schulung | Deutsch | Anspruch

Schulungsdauer: 3 Tage

Ziele

In diesem Kurs lernen Sie die Indizierung von Daten in Hadoop für Echtzeit-Abfragen, um mehr relevante Erkenntnisse aus Ihren Daten mithilfe von Cloudera Search zu erlangen.

Zielgruppe

Entwickler

Voraussetzungen

Besuch der Schulung Einstieg in Big Data mit Hadoop oder vergleichbare Kenntnisse
Erfahrung in der Programmierung mit Java, C, C++, Perl, oder Python.
Erfahrung im Umgang mit der Linux Command Line a

Agenda

Überblick

Überblick Cloudera Search
Funktionen
Einsatzszenarien
Architektur

Einfache Abfragen

Ausführen einer Abfrage in der Administrationsoberfläche
Syntax
Techniken zum ungefähren Matching
Ausgabekontrolle

Erweiterte Abfragen

Relevanz
Filter
Abfrage Parser
Funktionen
Geospatial Suche
Facettierung

Indizierung von Dokumenten vorbereiten

Überblick Indizierungsprozess
Morphlines
Generierung von Konfigurationsdateien
Schema Design
Collection Management

Batch Indizierung von HDFS Daten mit MapReduce

Überblick HDFS Batch Indizierungsprozess
Einsatz des MapReduce Indizierungs-Tools
Test und Troubleshooting

(Nahezu)-Echt-Zeit-Indizierung mit Flume

Einführung Apache Flume
Indizierung mit Flume durchführen
Test und Troubleshooting

Indizierung von HBase Daten mit Lily

Überblick über Apache HBase
Batch Indizierung für HBase
Schnelle Indizierung von HBase Tabellen

Daten in anderen Sprachen und Formaten indizieren

Feld-Typen und Analyzer Chains
Wordstamm
Zeichenzuordnung
Sprachunterstützung
Schema und Analysis Support in der Administrationsoberfläche
Metadaten- und Inhalts-Extraktion mit Apache Tika
Indizierung von binären Datei-Typen mit SolrCell

Ziele

In diesem Kurs lernen Sie die Indizierung von Daten in Hadoop für Echtzeit-Abfragen, um mehr relevante Erkenntnisse aus Ihren Daten mithilfe von Cloudera Search zu erlangen.

Zielgruppe

Entwickler

Voraussetzungen

Besuch der Schulung Einstieg in Big Data mit Hadoop oder vergleichbare Kenntnisse
Erfahrung in der Programmierung mit Java, C, C++, Perl, oder Python.
Erfahrung im Umgang mit der Linux Command Line a

Agenda

Überblick

Überblick Cloudera Search
Funktionen
Einsatzszenarien
Architektur

Einfache Abfragen

Ausführen einer Abfrage in der Administrationsoberfläche
Syntax
Techniken zum ungefähren Matching
Ausgabekontrolle

Erweiterte Abfragen

Relevanz
Filter
Abfrage Parser
Funktionen
Geospatial Suche
Facettierung

Indizierung von Dokumenten vorbereiten

Überblick Indizierungsprozess
Morphlines
Generierung von Konfigurationsdateien
Schema Design
Collection Management

Batch Indizierung von HDFS Daten mit MapReduce

Überblick HDFS Batch Indizierungsprozess
Einsatz des MapReduce Indizierungs-Tools
Test und Troubleshooting

(Nahezu)-Echt-Zeit-Indizierung mit Flume

Einführung Apache Flume
Indizierung mit Flume durchführen
Test und Troubleshooting

Indizierung von HBase Daten mit Lily

Überblick über Apache HBase
Batch Indizierung für HBase
Schnelle Indizierung von HBase Tabellen

Daten in anderen Sprachen und Formaten indizieren

Feld-Typen und Analyzer Chains
Wordstamm
Zeichenzuordnung
Sprachunterstützung
Schema und Analysis Support in der Administrationsoberfläche
Metadaten- und Inhalts-Extraktion mit Apache Tika
Indizierung von binären Datei-Typen mit SolrCell

Cloudera Search Entwickler-Kurs

Ziele

Zielgruppe

Voraussetzungen

Agenda

Überblick

Einfache Abfragen

Erweiterte Abfragen

Indizierung von Dokumenten vorbereiten

Batch Indizierung von HDFS Daten mit MapReduce

(Nahezu)-Echt-Zeit-Indizierung mit Flume

Indizierung von HBase Daten mit Lily

Daten in anderen Sprachen und Formaten indizieren

Ziele

Zielgruppe

Voraussetzungen

Agenda

Überblick

Einfache Abfragen

Erweiterte Abfragen

Indizierung von Dokumenten vorbereiten

Batch Indizierung von HDFS Daten mit MapReduce

(Nahezu)-Echt-Zeit-Indizierung mit Flume

Indizierung von HBase Daten mit Lily

Daten in anderen Sprachen und Formaten indizieren

Tags

Diese Seite weiterempfehlen