@fumito_itoのHadoopブログ

Windows向けのHadoopディストリビューションについて書いていきます。現在のところはApache Hadoop on Azure CTPがメイン。リリースされ次第、Apache Hadoop for Windows Serverについても書く予定。

Interactive Consoleでpigとかhiveとか実行するときの小咄

今日は小咄。

 

Interactive Consoleでpigやhiveを実行するときは検索条件などをChainして設定していきます。ということは.where()は.mapReduce()はjQueryライクに同じオブジェクトを返していると考えられます。

Chainの例

pig.from("example/data/davinci.txt").mapReduce("wordcount.js").where(...)...

 

では具体的にどんなオブジェクトを返しているのか?それはhelp("pig")コマンドで確認することが出来ます。

f:id:weathercook:20120608103917p:plain

run()(とto())はpromiseオブジェクトを、それ以外はQueryObjectを返却するようです。

runやtoでpromiseオブジェクトを返すということは、前に実行されたpigの完了をトリガーにして次のpigを実行するなどのオペレーションも可能ということです。夢が広がりますね。