NAVERまとめで奨励されるまとめとは?
昨日の夜中にこの記事(NAVERまとめのキュレーションの役割)を読んでメモした内容があるので、それをこちらのブログに書いておこうと思います。メモの書き下ろしなので、内容が乱れてますが、限られた時間で書くのでご容赦を。NAVERまとめの担当者がインタビューで語っているように、NAVERまとめが目指しているキュレーションとは、「人にしかできないようなまとめ」です。「人にしかできないまとめ」というのは、どのようなまとめなのでしょうか?
NAVERまとめの目指す方向性
検索エンジンではなくて、人間にしか分からないような情報というのは、どのようなものがあるでしょうか?例えば、検索エンジン最大手のGoogleにおいて東京の渋谷にあるレストランを探す時には、「渋谷」「レストラン」と探すかもしれません。「渋谷」のレストランであれば、「東京」「渋谷」「レストラン」と検索すれば、とりあえず渋谷にあるレストランの一覧を得る事は可能でしょう。(また、Google検索では、オプションのAdvance Searchにて「フィルター」をかける事ができるので、このフィルターを駆使すれば、かなりの精度の検索ができるかもしれません。実際には、面倒なので使う人は少ないですけど。)
しかし、このGoogleの検索においては、「おいしいお店」だけを抽出したり、「楽しい経験の遊園地」だけを抽出したりするのが難しいとされてきました。もちろん、「おいしいお店が掲載されたサイト」などというのは提示できるのですが、Google検索エンジン自体が「おいしいお店の一覧」であったり、「楽しい経験の遊園地」という結果で並べる事はできないのです。あくまでGoogleができるのは、キーワードに沿った「おいしいお店」の一覧が掲載されているかもしれないサイトの紹介になります。
Google Advance searchの例
機械が結果を表示するAPIの存在
人にしかできないまとめが重要になってきている理由については、検索エンジンは日々発達しているだけではなくて、検索エンジン以外の部分でも考える必要があります。例えば、多くの会社からWEB2.0として2005年頃から盛んに提供されるようになったAPIについて考える必要があるでしょう。APIというのは、アマゾンが持っている情報であったり、楽天が持っている商品データベースをそのままの形で呼び出す機能を、ユーザーに提供するというものです。例えば、楽天トラベルで提供されるホテル情報の数万件にも及ぶデーター、写真などをユーザーが利用してアフィリエイトを行う事が可能です。
NAVERまとめにおいても、アマゾンの提供するAPIを使って、アマゾンの膨大な商品情報を取り出してきて、表示しています。また、Google MapのAPIも同時に利用して、ユーザーに提供しています。こういったAPIの特徴を活かして、2006年から「マッシュアップ(Mashup)」というものも流行しはじめました。アフィリエイトのサイトなどで、複数の商品データベースから結果を取得して、マッシュアップが行われています。例えば、「渋谷」「レストラン」と検索した時には、Googleマップから位置情報を取得して表示、Yahoo画像検索からイメージを取得して表示、渋谷のレストランについての書籍をAmazonから表示するという方法です。
どうして人にしかできないまとめが大事なのか
NAVERまとめでは、APIを使ったような「まとめ」をキュレーションとは考えておらず、注目まとめに入れたり、カテゴリ化したりしていません。説明文が加えられているとはいえ、NAVERまとめは、人間が抽出する事に重点を置いていて、人間でしか抽出できない情報かどうか?という所を基にして、注目まとめやカテゴリを決めているように思います。実際には、「渋谷」「Wifiの使える店」というのは、人間にしか抽出できない情報ではないと思うのですが、そういった情報も混じってしまってはいますが、基本は「人間にしかできそうない選び方」を原則としているようです。
NAVERの責任者の1人である島村さんは、それを「楽しい」「面白い」などの人間にしか分からない感情と表現しています。例えば、ホテル情報をでAPIのように機械が得意とする情報は、「Wifiがあるかどうか」「トイレと風呂は別に設置されているか」「設備の大きさはどれほどか」というハード面の情報です。実際にNAVERまとめのように最近重視されているのは、ハード面ではなくて、「従業員は優しかったか」「接客レベルは高かったか」「急なお願いに応じてくれたか」「電話の対応は適切だったか」というソフト面の情報です。
日本の家電製品の会社が失敗している理由の1つとしては、ハード面(技術)にこだわるあまり、ソフト面(感情)が疎かになっている為だと分析する人もいます。二次産業であるハード産業での成長から、三次産業のソフトに切り替えが出来ない会社が多くなっているのです。
人間独自の視点の共有
宮崎駿さんの作品は、全国の人から愛されているわけですけど、宮崎さんの「独自の視点」というものは、アニメを通じて共有されています。コンピューターが出来ない最大の欠点は、情報を組み合わせる(これをキュレーションという?)独自の視点です。宮崎駿さんの作品をコンピューターが作り出すなんて、とても考えられないでしょう。宮崎駿さんの生き方を通じて独自の視点を入れた結果が1本の作品としてまとめあげられています。
NAVERまとめにおいても、責任者の1人の島村さんが「PVを重視するあまり没個性になってきた」(実際にはNAVERまとめ側が運営を成立させる為にそうしたんですけど)と言っていますが、個性的なキューレターが自分の独自性を共有する事によって社会が変わっていく(オタクが社会を変えるという人もいる)という事が重視されるようになってきています。
今までの大学受験まで教科書の中身を詰め込んで「頭が良い」というのとは、一線を画した人間の経験であったり、感情表現の豊かさなどが「本当の生活の豊かさ」につながって行く時代が第三次産業では求められるという事です。
口コミなどで重視されるデータマイニングスキル
データマイニング技術であれば、ゲームのユーザーの動きを感知して、それに合わせてデーターを調整するような事は、かなり高度な部分まで発達してきています。例えば、どこでユーザーが離脱したとか、ユーザーがどこで課金するかとか、そういったデーターを基本にして、ゲームの内容を調整するというようなデーターマイニング技術は、任天堂が得意とする従来のゲームに見られず、ソーシャルゲームならでわの動きです。ゲームだったら、小さな世界で動くのでそれでも良かったのですが、現実社会はゲームよりももう一段複雑に出来ているようです。
口コミなどで重視されるデータマイニング技術では、コンピューターを使って感情表現を抜き出そうという努力が続けられています。テキストベースによるものだと、テキストマイニングと言ったりしますけど、大手の会社が集めた「膨大なアンケート」について、それを解析するという事です。先ず、ユーザーが製品に対して「プラスの評価を下しているのか」「マイナス評価を下しているのか」、どのような感情を持っているのかなどを膨大なアンケートからテキストマイニングでまとめあげて、マーケティングに用いるという手法です。これは、大手のマーケティング会社などは、既に大学の教員などを採用して行っています。
ユーザーの声の収集
NAVERの社内においても、例えばこのブログがそうなのですが、NAVERまとめについての意見をブログ、Twitter、報道機関のニュースなどからNAVERまとめに関する膨大な情報(実際には、LINEの方が情報は出回っているでしょうけど)を収集して、それを「ユーザーの声」として、優先順位に並べるというような事を行っているという事です。それは、まるでMixiの「ユーザーの声」の投票のNAVER版に見えますが、ハンゲームというゲーム会社だけあって、データーを駆使したマイニング技術は、それなりのものを持っていると思います。
こうした情報収集を行って、ユーザーの声を素早くサービスに反映していく事で、ユーザーを満足させるサービスを提供していけるようになるのだと思います。