hive 2.1 | Soundmain

hive 2.1

Hive — система управления базами данных на основе платформы Hadoop с SQL-подобным языком запросов, позволяет выполнять запросы, агрегировать и анализировать данные; компонент экосистемы Hadoop.
Создан корпорацией Facebook, в 2011 году передан под открытой лицензией в фонд Apache.
Работает напрямую с HDFS и Apache HBase, поддерживает основные форматы Hadoop. Запросы могут выполняться через Tez, Spark или Hadoop MapReduce.
Язык запросов — HiveQL — приближен к SQL, при этом не реализует все возможности стандарта SQL-92. В язык встроены функции для работы с форматами XML и JSON, поддержка нескалярных типов данных, таких как массивы, структуры, ассоциативные массивы, реализован достаточно широкий набор агрегатных функций, поддерживаются определяемые пользователем функции, блокировки.
Пример сеанса работы с Hive с применением HiveQL — удаление таблицы, создание таблицы, загрузка в неё данных из текстового файла и запрос для подсчёта, сколько раз каждое слово встречалось в файле:

View More On Wikipedia.org
  • SoundMain
    1

    SoundMain

    Пользователь
    • Сообщения
      2,787
    • Статьи
      230
    • Комментарии к статье
      1
    • Ресурсы
      787
    • Медиа
      992
    • Review items
      4
    • Рецензии редактора
      2
    • Решения
      3
    • Реакции
      38
    Назад
    Сверху