<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	
	>
<channel>
	<title>《Impala与HBase整合实践》的评论</title>
	<atom:link href="http://shiyanjun.cn/archives/526.html/feed" rel="self" type="application/rss+xml" />
	<link>http://shiyanjun.cn/archives/526.html</link>
	<description>简单之美，难得简单，享受简单的唯美。</description>
	<lastBuildDate>Wed, 19 Feb 2025 08:08:30 +0000</lastBuildDate>
		<sy:updatePeriod>hourly</sy:updatePeriod>
		<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.9.2</generator>
	<item>
		<title>作者：stars_dba</title>
		<link>http://shiyanjun.cn/archives/526.html#comment-59360</link>
		<dc:creator><![CDATA[stars_dba]]></dc:creator>
		<pubDate>Fri, 17 Nov 2017 09:32:31 +0000</pubDate>
		<guid isPermaLink="false">http://shiyanjun.cn/?p=526#comment-59360</guid>
		<description><![CDATA[那个impala是否可以跟hive server共用一台机器？它需要的内存大吗？]]></description>
		<content:encoded><![CDATA[<p>那个impala是否可以跟hive server共用一台机器？它需要的内存大吗？</p>
]]></content:encoded>
	</item>
	<item>
		<title>作者：胖哥</title>
		<link>http://shiyanjun.cn/archives/526.html#comment-58165</link>
		<dc:creator><![CDATA[胖哥]]></dc:creator>
		<pubDate>Sun, 22 Jan 2017 09:54:05 +0000</pubDate>
		<guid isPermaLink="false">http://shiyanjun.cn/?p=526#comment-58165</guid>
		<description><![CDATA[有个问题，如果我Hbase的群集与Impala的群集不在一起，这个要怎么配置？]]></description>
		<content:encoded><![CDATA[<p>有个问题，如果我Hbase的群集与Impala的群集不在一起，这个要怎么配置？</p>
]]></content:encoded>
	</item>
	<item>
		<title>作者：Yanjun</title>
		<link>http://shiyanjun.cn/archives/526.html#comment-57145</link>
		<dc:creator><![CDATA[Yanjun]]></dc:creator>
		<pubDate>Tue, 08 Mar 2016 13:56:52 +0000</pubDate>
		<guid isPermaLink="false">http://shiyanjun.cn/?p=526#comment-57145</guid>
		<description><![CDATA[要说简单查询，如果数据量超大，那么肯定是ES查询速度更快。至于复杂的聚合查询，我还真么有实践过，简单说下，使用ES构造负责查询也相对复杂，而且ES你需要预先对数据进行索引，还要实现客户端的一套调用解析逻辑，代价高一些；而Impala可以直接基于已有的Hive相关元数据，提供类似SQL的查询语法，构造复杂聚合SQL语句也相对容易一些。复杂聚合，建议使用Impala吧。]]></description>
		<content:encoded><![CDATA[<p>要说简单查询，如果数据量超大，那么肯定是ES查询速度更快。至于复杂的聚合查询，我还真么有实践过，简单说下，使用ES构造负责查询也相对复杂，而且ES你需要预先对数据进行索引，还要实现客户端的一套调用解析逻辑，代价高一些；而Impala可以直接基于已有的Hive相关元数据，提供类似SQL的查询语法，构造复杂聚合SQL语句也相对容易一些。复杂聚合，建议使用Impala吧。</p>
]]></content:encoded>
	</item>
	<item>
		<title>作者：Xigua</title>
		<link>http://shiyanjun.cn/archives/526.html#comment-57140</link>
		<dc:creator><![CDATA[Xigua]]></dc:creator>
		<pubDate>Mon, 07 Mar 2016 01:33:53 +0000</pubDate>
		<guid isPermaLink="false">http://shiyanjun.cn/?p=526#comment-57140</guid>
		<description><![CDATA[博主你好，对于Hive存储的数据，使用Impala和Elasticsearch分别进行聚合查询以及单项查询，哪一个效率要高些？]]></description>
		<content:encoded><![CDATA[<p>博主你好，对于Hive存储的数据，使用Impala和Elasticsearch分别进行聚合查询以及单项查询，哪一个效率要高些？</p>
]]></content:encoded>
	</item>
	<item>
		<title>作者：Yanjun</title>
		<link>http://shiyanjun.cn/archives/526.html#comment-56313</link>
		<dc:creator><![CDATA[Yanjun]]></dc:creator>
		<pubDate>Tue, 20 Oct 2015 05:39:51 +0000</pubDate>
		<guid isPermaLink="false">http://shiyanjun.cn/?p=526#comment-56313</guid>
		<description><![CDATA[这个...要么你等新的支持多个distinct子句特性的版本，要么你就变通地分多步计算，实现与你那个一个查询等价的多个查询。]]></description>
		<content:encoded><![CDATA[<p>这个&#8230;要么你等新的支持多个distinct子句特性的版本，要么你就变通地分多步计算，实现与你那个一个查询等价的多个查询。</p>
]]></content:encoded>
	</item>
	<item>
		<title>作者：dana</title>
		<link>http://shiyanjun.cn/archives/526.html#comment-55600</link>
		<dc:creator><![CDATA[dana]]></dc:creator>
		<pubDate>Mon, 03 Aug 2015 13:31:11 +0000</pubDate>
		<guid isPermaLink="false">http://shiyanjun.cn/?p=526#comment-55600</guid>
		<description><![CDATA[请问博主：我们现在使用impala用来做olap，但是impala在一条查询中本身不支持多个distinct子句，有没有什么好的解决方案？]]></description>
		<content:encoded><![CDATA[<p>请问博主：我们现在使用impala用来做olap，但是impala在一条查询中本身不支持多个distinct子句，有没有什么好的解决方案？</p>
]]></content:encoded>
	</item>
	<item>
		<title>作者：Yanjun</title>
		<link>http://shiyanjun.cn/archives/526.html#comment-55452</link>
		<dc:creator><![CDATA[Yanjun]]></dc:creator>
		<pubDate>Tue, 21 Jul 2015 02:47:18 +0000</pubDate>
		<guid isPermaLink="false">http://shiyanjun.cn/?p=526#comment-55452</guid>
		<description><![CDATA[理论上是都可以用的，用Cloudera的版本兼容性会更好一些，用其他的可能会出现各种兼容性的问题。]]></description>
		<content:encoded><![CDATA[<p>理论上是都可以用的，用Cloudera的版本兼容性会更好一些，用其他的可能会出现各种兼容性的问题。</p>
]]></content:encoded>
	</item>
	<item>
		<title>作者：夏天</title>
		<link>http://shiyanjun.cn/archives/526.html#comment-55441</link>
		<dc:creator><![CDATA[夏天]]></dc:creator>
		<pubDate>Mon, 20 Jul 2015 03:39:41 +0000</pubDate>
		<guid isPermaLink="false">http://shiyanjun.cn/?p=526#comment-55441</guid>
		<description><![CDATA[hadoop版本之类的只能用Cloudera的版本吗？]]></description>
		<content:encoded><![CDATA[<p>hadoop版本之类的只能用Cloudera的版本吗？</p>
]]></content:encoded>
	</item>
	<item>
		<title>作者：ljucas</title>
		<link>http://shiyanjun.cn/archives/526.html#comment-54773</link>
		<dc:creator><![CDATA[ljucas]]></dc:creator>
		<pubDate>Mon, 18 May 2015 06:10:52 +0000</pubDate>
		<guid isPermaLink="false">http://shiyanjun.cn/?p=526#comment-54773</guid>
		<description><![CDATA[恩，好的，谢谢您~]]></description>
		<content:encoded><![CDATA[<p>恩，好的，谢谢您~</p>
]]></content:encoded>
	</item>
	<item>
		<title>作者：Yanjun</title>
		<link>http://shiyanjun.cn/archives/526.html#comment-54771</link>
		<dc:creator><![CDATA[Yanjun]]></dc:creator>
		<pubDate>Mon, 18 May 2015 03:30:02 +0000</pubDate>
		<guid isPermaLink="false">http://shiyanjun.cn/?p=526#comment-54771</guid>
		<description><![CDATA[看你的实际需求了，如果你没有类似需要操作大表的需求，那完全可以存储到HDFS上，实际上Impala也是需要读取Hive元数据，而且是处理结构化数据，所以你还是要存储成Hive表。如果存储你的这些数据还需要实时访问，比如用户在线的数据的随机查询，一些状态的实时更新，这样的数据应该存放在一张大表中（HBase表），这时可以整合Impala+HBase，即可以对用户数据进行实时统计，同时又能满足在线访问数据的需求。]]></description>
		<content:encoded><![CDATA[<p>看你的实际需求了，如果你没有类似需要操作大表的需求，那完全可以存储到HDFS上，实际上Impala也是需要读取Hive元数据，而且是处理结构化数据，所以你还是要存储成Hive表。如果存储你的这些数据还需要实时访问，比如用户在线的数据的随机查询，一些状态的实时更新，这样的数据应该存放在一张大表中（HBase表），这时可以整合Impala+HBase，即可以对用户数据进行实时统计，同时又能满足在线访问数据的需求。</p>
]]></content:encoded>
	</item>
</channel>
</rss>
