하이브의 모든 데이터 타입은 아래와 같이 4가지로 분류된다.
Column Types
Literals
Null Values
Complex Types
Column Types
⦁Integral Types
⦁String Types
⦁Integral Types
⦁Timestamp
⦁Union Types
Integer type은 INT로 표기하고, INT보다 작은 타입은 SMALLINT, 그보다 작은건 TINYINT로 표기한다. 그리고 INT보다 큰 타입은 BIGINT라 표기한다.
Type | Postfix | Example |
TINYINT | Y | 10Y |
SMALLINT | S | 10S |
INT | - | 10 |
BIGINT | L | 10L |
String Types
String type는 single quotes (' ') 또는 double quotes (" ")로 표기할 수 있다. 그리고 VARCHAR와 CHAR가 있고, C유형 이스케이프 유형을 따른다.
Data Type | Length |
VARCHAR | 1 to 65355 |
CHAR | 255 |
Timestamp
It supports traditional UNIX timestamp with optional nanosecond precision. It supports java.sql.Timestamp format “YYYY-MM-DD HH:MM:SS.fffffffff” and format “yyyy-mm-dd hh:mm:ss.ffffffffff”.
Dates
DATA값은 year/month/day format으로 되어있다.
{{YYYY-MM-DD}}.
Union Types
Union은 이기종 데이터 유형의 모음입니다. create union을 사용하여 인스턴스를 만들 수 있습니다 . 구문과 예제는 다음과 같습니다.
UNIONTYPE<int,double, array<string>,struct<a:int,b:string>>
{0:1}
{1:2.0}
{2:["three","four"]}
{3:{"a":5,"b":"five"}}
{2:["six","seven"]}
{3:{"a":8,"b":"eight"}}
{0:9}
{1:10.0}
Literal
하이브에는 다음과 같은 리터럴이 사용됩니다.
부동 소수점
부동 소수점 유형은 소수점이있는 숫자입니다. 일반적으로이 유형의 데이터는 DOUBLE 데이터 유형으로 구성됩니다.
십진수
십진 형식 데이터는 DOUBLE 데이터 형식보다 높은 범위의 부동 소수점 값입니다. 십진 형식의 범위는 약 -10 -308 ~ 10 308 입니다.
Null Value
Missing values are represented by the special value NULL.
Complex Types
The Hive complex data types are as follows:
Arrays
JAVA의 배열과 비슷하다.
Syntax: ARRAY<data_type>
Maps
JAVA의 MAPS와 비슷하다.
Syntax: MAP<primitive_type, data_type>
Structs
Hive의 구조체는 주석이있는 복합 데이터를 사용하는 것과 유사하다.
Syntax: STRUCT<col_name : data_type [COMMENT col_comment],...>
'Hadoop ecosystem > Hive' 카테고리의 다른 글
Hive - Drop (0) | 2017.05.04 |
---|---|
Hive - Create (0) | 2017.05.04 |
Hive / Pig / Spark (0) | 2017.05.04 |
Hive - JOIN (0) | 2017.05.04 |
Hive - SELECT(WHERE / ORDER BY / GROUP BY) (0) | 2017.05.04 |