こんにちは、yoshitsuguです。 仕事でHadoopのプログラムをゴリゴリやっているわけなんですが、例えば「何か簡単なサンプルアプリを書け。word count以外で、だ。」と言われると結構困ってしまいます。 HadoopというよりMap/Reduceというアルゴリズムでできることとは、一体なんでしょうか? ある程度DBのシステムを組んだことがある人には、 Map≒WHERE + GROUP BY(※集約キー指定のみ) Reduce≒GROUP BY(※キーでデータが集約されてくる), COUNT(), SUM(), MAX(), MIN()などの集約関数であるという説明が案外わかりやすい気がします。 (私の業務では、DBに近い使い方が結構多いからかもしれません) 具体例で示します。 次のプログラムはApacheのアクセスログから404アクセスしたクライアントのIPアドレスとリクエス