Cloudera Search Entwickler-Kurs
Classroom Schulung | Deutsch | Anspruch
Schulungsdauer: 3 Tage
Ziele
In diesem Kurs lernen Sie die Indizierung von Daten in Hadoop für Echtzeit-Abfragen, um mehr relevante Erkenntnisse aus Ihren Daten mithilfe von Cloudera Search zu erlangen.
Zielgruppe
Entwickler
Voraussetzungen
- Besuch der Schulung Einstieg in Big Data mit Hadoop oder vergleichbare Kenntnisse
- Erfahrung in der Programmierung mit Java, C, C++, Perl, oder Python.
- Erfahrung im Umgang mit der Linux Command Line a
Agenda
Überblick
- Überblick Cloudera Search
- Funktionen
- Einsatzszenarien
- Architektur
Einfache Abfragen
- Ausführen einer Abfrage in der Administrationsoberfläche
- Syntax
- Techniken zum ungefähren Matching
- Ausgabekontrolle
Erweiterte Abfragen
- Relevanz
- Filter
- Abfrage Parser
- Funktionen
- Geospatial Suche
- Facettierung
Indizierung von Dokumenten vorbereiten
- Überblick Indizierungsprozess
- Morphlines
- Generierung von Konfigurationsdateien
- Schema Design
- Collection Management
Batch Indizierung von HDFS Daten mit MapReduce
- Überblick HDFS Batch Indizierungsprozess
- Einsatz des MapReduce Indizierungs-Tools
- Test und Troubleshooting
(Nahezu)-Echt-Zeit-Indizierung mit Flume
- Einführung Apache Flume
- Indizierung mit Flume durchführen
- Test und Troubleshooting
Indizierung von HBase Daten mit Lily
- Überblick über Apache HBase
- Batch Indizierung für HBase
- Schnelle Indizierung von HBase Tabellen
Daten in anderen Sprachen und Formaten indizieren
- Feld-Typen und Analyzer Chains
- Wordstamm
- Zeichenzuordnung
- Sprachunterstützung
- Schema und Analysis Support in der Administrationsoberfläche
- Metadaten- und Inhalts-Extraktion mit Apache Tika
- Indizierung von binären Datei-Typen mit SolrCell
Ziele
In diesem Kurs lernen Sie die Indizierung von Daten in Hadoop für Echtzeit-Abfragen, um mehr relevante Erkenntnisse aus Ihren Daten mithilfe von Cloudera Search zu erlangen.
Zielgruppe
Entwickler
Voraussetzungen
- Besuch der Schulung Einstieg in Big Data mit Hadoop oder vergleichbare Kenntnisse
- Erfahrung in der Programmierung mit Java, C, C++, Perl, oder Python.
- Erfahrung im Umgang mit der Linux Command Line a
Agenda
Überblick
- Überblick Cloudera Search
- Funktionen
- Einsatzszenarien
- Architektur
Einfache Abfragen
- Ausführen einer Abfrage in der Administrationsoberfläche
- Syntax
- Techniken zum ungefähren Matching
- Ausgabekontrolle
Erweiterte Abfragen
- Relevanz
- Filter
- Abfrage Parser
- Funktionen
- Geospatial Suche
- Facettierung
Indizierung von Dokumenten vorbereiten
- Überblick Indizierungsprozess
- Morphlines
- Generierung von Konfigurationsdateien
- Schema Design
- Collection Management
Batch Indizierung von HDFS Daten mit MapReduce
- Überblick HDFS Batch Indizierungsprozess
- Einsatz des MapReduce Indizierungs-Tools
- Test und Troubleshooting
(Nahezu)-Echt-Zeit-Indizierung mit Flume
- Einführung Apache Flume
- Indizierung mit Flume durchführen
- Test und Troubleshooting
Indizierung von HBase Daten mit Lily
- Überblick über Apache HBase
- Batch Indizierung für HBase
- Schnelle Indizierung von HBase Tabellen
Daten in anderen Sprachen und Formaten indizieren
- Feld-Typen und Analyzer Chains
- Wordstamm
- Zeichenzuordnung
- Sprachunterstützung
- Schema und Analysis Support in der Administrationsoberfläche
- Metadaten- und Inhalts-Extraktion mit Apache Tika
- Indizierung von binären Datei-Typen mit SolrCell