Hiveのベストプラクティス(かもしれないこと)をめもっておく - wyukawa's diary

Hiveの現場に来て4か月経ち回りのやり方を観察したり、他の事例を調べたりしているうちにHiveを使用する際のパターンというかベストプラクティスが見えてきた気がするので書いてみるよ。ユースケースはログ解析です。 1. ファイルフォーマットと圧縮ログは圧縮率高いので圧縮すべし。でもスプリット可能であるためにはって…