Hive dispone di molte funzioni integrate per l'elaborazione e l'interrogazione dei dati. Alcune delle funzionalità fornite includono, ad esempio, la manipolazione di stringhe, la manipolazione di date, la conversione di tipo, gli operatori condizionali e le funzioni matematiche.
Vengono utilizzate principalmente per eseguire operazioni su dati di tipo data, come l'aggiunta del numero di giorni o simili.
Queste funzioni sono utilizzate principalmente per eseguire calcoli matematici.
Queste funzioni vengono utilizzate per valutare una condizione e restituiscono un valore in base al fatto che essa sia vera o falsa.
Vengono utilizzate per eseguire operazioni sulle stringhe, come ad esempio trovarne la lunghezza.
Queste funzioni vengono utilizzate per trovare la dimensione di tipi di dati complessi come array e mappe. L'unica funzione di raccolta è SIZE, utilizzata principalmente per trovare il numero di elementi in una matrice o mappa.
Questa funzione serve a convertire i dati da un tipo a un altro; l'unica funzione di conversione dei tipi è CAST.
Queste funzioni possono essere utilizzate per trasformare una singola riga in più righe. EXPLODE è l'unica funzione che genera una tabella, utilizzando un array come input e restituendo come output gli elementi dell'array in righe separate.
Sono altamente formattati: ogni valore di data contiene il secolo, l'anno, il mese, il giorno, l'ora, il minuto e il secondo. Queste funzioni sono utilizzate per eseguire operazioni sui dati di tipo data, come l'aggiunta del numero di giorni, la conversione da un tipo di data all'altra e così via. Di seguito sono riportate le funzioni DateTime di Hadoop Hive più comunemente utilizzate:
| Nome della funzione | Tipo di restituzione | Descrizione |
|---|---|---|
| Unix_Timestamp | BigInt | Restituisce il timestamp Unix corrente, espresso in secondi. |
| To_date(string timestamp) | String | Recupera e restituisce il componente data di una stringa di timestamp. |
| year(string date) | INT | Recupera e restituisce il componente anno di una data o di una stringa di timestamp. |
| quarter (date/timestamp/string) | INT | La funzione QUARTER, introdotta in Hive 1.3, recupera e restituisce il componente trimestre dell'anno di una data, un timestamp o una stringa nell'intervallo da 1 a 4. |
| month(string date) | INT | Restituisce il componente mese di una data o di una stringa di timestamp. |
| hour(string date) | INT | Recupera e restituisce il componente ora del timestamp. |
| minute(string date) | INT | Restituisce il componente minuti del timestamp. |
| Date_sub(string starting date, int days) | string | La funzione DATE_SUB sottrae il numero di giorni indicato dalla data specificata. |
| Current_date | date | Restituisce la data corrente all'inizio della valutazione della query. |
| LAST _day(string date) | string | Recupera e restituisce l'ultimo giorno del mese a cui la data appartiene. |
| trunc(string date, string format) | string | Rimuove i campi da un valore TIMESTAMP. |
