Cod: EAS-016
Durata: 8 ore
Durata: 8 ore
Descriere
Acest training se adreseaza programatorilor si abordeaza subiecte legate de functionalitatile tehnice, arhitectura si performance tuning. Apache Hive permite analiza unor seturi de date mari stocate in Hadoop's HDFS si fisiere de sistem compatibile, oferind un limbaj asemanator SQL cu schema on read. De asemenea converteste interogarile in map/reduce. Alte functionalitati ale Hive sunt:- Indexare pentru a oferi viteze mai mari
- Diferite tipuri de stocare precum plain text, RCFile, HBase, ORC sau altele
- Metadata storage intr-un RDBMS
- Operarea pe baza datelor comprimate in ecosistemul Hadoop
- Built-in user defined functions (UDFs) pentru a manipula datele, strings si alte instrumente de data-mining
- Interogari asemanatoare cu SQL care sunt convertite implicit in MapReduce
Subiecte curs
a:2:{s:4:"TEXT";s:360:"- Ce este Hive
- Arhitectura
- Optiuni de autorizare Hive
- Tranzactii
- Tipuri de date
- Interogari “Select”
- DML / Export / Import
- Hive UDFs types
- Indexes
- Windowing si Analytics Functions
- Performance tuning
Obiective
- Dezvoltarea expertizei pe zona de BigData
- Data modal design in Hive
- Dezvoltarea scripturilor HSQL
- Experienta practica in interogarile HSQL si performance tuning
Public tinta
- Programatori
- QA
- Analisti
Cerinte curs
- Cunostinte de baza Hadoop
- ANSI SQL 92