@fumito_itoのHadoopブログ

Windows向けのHadoopディストリビューションについて書いていきます。現在のところはApache Hadoop on Azure CTPがメイン。リリースされ次第、Apache Hadoop for Windows Serverについても書く予定。

Hadoop on AzureのInteractive ConsoleからHiveを実行する

今回はInteractive ConsoleからHiveを実行してみます。

Hiveは今までと同じようにJavaScriptによる実行も可能ですが、Hive専用のコンソールが用意されているのでそちらを使ってみます。

 

Interactive Console上部のボタンをクリックして実行モードをJavaScriptからHiveに切り替えます。

f:id:weathercook:20120616120521p:plain

 

画面下部の入力エリアからHiveQLを打ち込んでEvaluateボタンで実行してみましょう。たとえばテーブル一覧を表示するには"show table;"と打ち込みます。

f:id:weathercook:20120616120544p:plain

hivesampletableというテーブルが最初から用意されていることがわかります。ではこのテーブルのカラム一覧を表示するためにHiveQLを実行してましょう"describe hivesampletable;"を実行します。

f:id:weathercook:20120616120602p:plain

カラム一覧が表示されましたね。どうやらアクセスログっぽいものが格納されているようです。では、集計関数などを用いた簡単な分析を行ってみます。マーケットごとに、どんなプラットフォームの端末からアクセスがあったのか集計してみましょう。

f:id:weathercook:20120616120611p:plain

iPhoneばっか…w

 

ついでなのでJavaScriptでも実行してみましょう。MapReduceを実行したときと同じようにQueryObjectを定義してrun()で実行します。QueryObjectの指定の仕方はhelp("hive")で確認することができます。

f:id:weathercook:20120616120621p:plain

Hive用のコンソールとJavaScriptの両方からHiveを実行することができました。今回は利用しませんでしたが、Hive用のコンソールでは画面上部のセレクトボックスからテーブル一覧やカラム一覧を取得できるため、HiveQLを組み立てるときに役立ってくれるでしょう。やりましたね。