资讯详情

Hive详解(附Hive安装及使用,MySQL的安装等)

Hive详解

链接:https://pan.baidu.com/s/1b9dzXpDGAFd2PIpyYOJrKA 提取码:5sdq

1. Hive的基本概念

(1) hive 简介

Hive:由 Facebook 开源用于解决海量问题日志的数据统计工具。

Hive 是基于 的一个,可以将,并提供查询功能。

(2) Hive 本质:将 转化成程序

1)Hive 存储处理的数据 HDFS
2)Hive 分析数据底层的实现是 MapReduce
3)执行程序在运行 Yarn 上(Hive类似于Hadoop上客户端)

(3)主要用途:直接使用离线数据分析MapReduce开发效率更高

优点:

(1)操作接口采用类型SQL语法,提供快速发展的能力(简单易用)。

(2)避免写作MapReduce,降低开发人员的学习成本。

(3)Hive因此,执行延迟相对较高,Hive常用于对实时性要求较低的数据分析场合。

(4)Hive优点是处理大数据,因为处理小数据没有优势Hive执行延迟相对较高。

(5)Hive支持用户自定义函数,用户可以根据自己的需要实现自己的函数。

缺点:

1)Hive的HQL表达能力有限

(1)迭代算法无法表达

(2)不擅长数据挖掘,因为MapReduce由于数据处理过程的限制,高效算法无法实现。SparkFlink

2)Hive效率相对较低

(1)Hive自动生成的MapReduce通常情况下,作业不够智能

(2)Hive调整难度大,粒度粗

CLI(command-lineinterface)即Shell命令行、JDBC/ODBC(java访问hive)、WEBUI(浏览器访问hive)

元数据包括:表名和表所属数据库(默认为default)、表的所有者、列/分区字段、表的类型(是否为外表)、表的数据目录等。

标签: 2sdq固态继电器

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台