网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

hive SQL count时的'\N'

浏览数：27 / 时间：2015年06月12日

Hive中有种假NULL，它看起来和NULL一摸一样，但是实际却不是NULL。

例如如下这个查询：

hive> desc ljn004;

OK

a string

Time taken: 0.237 seconds

hive> select a from ljn004;

OK

NULL

Time taken: 46.232 seconds

看上去好像ljn004的a字段保存了一个 NULL，

但是换一个查询会发现它和NULL并不一样：

hive> select a from ljn004 where a is null;

OK

Time taken: 62.56 seconds

来看一下实际存储的是什么：

hive> select * from ljn004;

OK

\N

Time taken: 1.232 seconds

hive> select a from ljn004 where a = ‘\\N‘;

OK

NULL

Time taken: 72.933 seconds

ljn004的a字段实际存储的是一个‘\N‘，a = ‘\\N‘是因为Hive中‘\‘是转义字符，需要对‘\‘进行一次转义，所以变成‘\\N‘。

这种假NULL产生的原因实际上源于对表的错误操作。在Hive中，空值NULL在底层默认是用‘\N‘来存储的，看一个例子：

hive> create table ljn005 (col1 string);

OK

Time taken: 1.258 seconds

1 Rows loaded to ljn005

OK

Time taken: 63.727 seconds

hive> insert overwrite table ljn005 select NULL from dual;

然后看一下底层的数据存储：

$ hadoop fs -cat /group/hive/ljn005/attempt_201205041518_256192_m_000000_0

\N

可以看到底层数据将NULL存储成了‘\N‘ 。

这样的设计存在一个问题是如果实际想存储‘\N‘，那么实际查询出来的也是NULL而不是‘\N‘ 。

Hive给出一种并非完美的解决方法就是可以自定义底层用什么字符来表示NULL。

例如我想用字符‘a‘来表示NULL：

hive> alter table ljn005 SET SERDEPROPERTIES(‘serialization.null.format‘ = ‘a‘);

OK

Time taken: 0.175 seconds

hive> insert overwrite table ljn005 select NULL from dual;

1 Rows loaded to ljn005

OK

Time taken: 62.66 seconds

再看一下底层的存储：

$ hadoop fs -cat /group/hive/ljn005/attempt_201205041518_256764_m_000000_0

a

这时候底层的存储就变成了‘a‘ ，今后插入到这张表中的‘a‘查询出来就变成了NULL而不是‘a‘ 。

其实上面说的这个假NULL出现的原因就是在默认情况下（即用‘\N‘表示NULL），插入了NULL值，然后又用SET SERDEPROPERTIES语句修改了存储NULL的字符串。这时候表的属性修改了，但是底层存储的文件并没有修改。而‘\N‘显示为NULL在Hive中又是一个特例，于是就出现了这个假NULL，在开发过程中一定要注意！

hive SQL count时的'\N',古老的榕树,5-wow.com

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

hive SQL count时的'\N'

标签： des 问题文件数据方法 ha for sql des 问题文件数据方法 ha for sql

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

姚奠中书法

姚奠中书法

鲁迅的书法鉴赏

鲁迅的书法鉴赏

一场高校女生的比基尼秀

一场高校女生的比基尼秀

大学生全裸图书馆前静坐呼吁尊重身体

大学生全裸图书馆前静坐呼吁尊重身体

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

澳门赌场实拍美女

澳门赌场实拍美女

图揭全国校花排行榜清纯可爱美貌爆表

图揭全国校花排行榜清纯可爱美貌爆表

绝对罕见!目睹各国名人遗容照

绝对罕见!目睹各国名人遗容照

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

海边比基尼彰显苗条身材

海边比基尼彰显苗条身材

您可能还喜欢

更多

模特精选

模特精选

国际比基尼健美小姐冠军

国际比基尼健美小姐冠军

货车侧翻市民：不抢是傻子

货车侧翻市民：不抢是傻子

印象回到中国1993年

印象回到中国1993年

冯小刚24岁女儿近照曝光叼烟表情逗趣

冯小刚24岁女儿近照曝光叼烟表情逗趣

巴西男子头颈颠倒身残志坚

巴西男子头颈颠倒身残志坚

林彪的书法欣赏

林彪的书法欣赏

吴莫愁发新片谈李代沫动情落泪：等他回来

吴莫愁发新片谈李代沫动情落泪：等他回来

非礼勿视！日本如此变态的成人文化

非礼勿视！日本如此变态的成人文化

厦门旅游海边夜拍

厦门旅游海边夜拍