【最強のビッグデータ戦略】
ビル・フランクス (著), 長尾高弘 (翻訳)
https://www.amazon.co.jp/dp/4822285014/
○この本を一言で表すと?
技術的な裏付けで現実的なビッグデータについての本
○よかった点、興味深かった点
・「ビッグデータの正体」では技術的な裏付けや内容がほとんど書かれておらず、余計にビッグデータに対する考えがもやっとしてしまっていましたが、この本を読むことでかなり技術的な基礎も含めて理解できたように思います。
「ビッグデータの正体」でかなり下位に置かれていたデータ・サイエンティストのスキルやセンスをこの本では上位に置いていて、自分の実感にはこちらの方が合うなと思いました。
<第1部 ビッグデータの勃興>
第1章 ビッグデータとは何か、なぜ重要なのか
・ビッグデータの大切さは「どれくらい大きいのかではなく、どのように使うのかだ」というのは非常に納得できる話だと思いました。ツールとしての有用性を考えると当然の話だと思います。
・ビッグデータが実際には構造をもっていないのではなく、半ば構造化されているか複数の構造を持っているというのも自分の実感に合うなと思いました。
・ビッグデータを有用に使うために用途に応じて「大半は役に立たない」として切り捨て、「ホースから水をすする」ように加工するというのもやっぱり必要だなと思いました。
実際に捨てるのではなく、ある目的では切り捨て、ある目的では利用するということの方が実際的で「100%使う」というのはそれ専用の実際には取捨選択するロジックが必要になりそうな気がします。
・「ビッグ」の定義が年月が経てば変わるというのも納得できる話だなと思いました。
第2章 ウェブデータ―最初のビッグデータ
・ウェブから取得できる情報の幅を知ることができて勉強になりました。顧客が選択し、画面遷移時の情報を取るだけでなく、どのような流れでどのような行動をとったかを取得し、分析すること、購買顧客となる前の閲覧者の情報が束となれば匿名の消費者行動を表すものになるというのはなるほどなと思いました。
・HTML5やAjaxなどの技術で、例えばユーザーがどこにマウスまたはタッチポイントを置き、どう動かしたかなどもやり方によってはキャプチャできると聞きました。
第3章 ビッグデータの価値を高める
・ウェブデータよりもそれ以外の事例として出されているデータの方が個人的には面白く、有用だなと思いました。
リアルの行動のデータもこの章で書かれている例のようにキャプチャされていくというのは、企業にとっては本当に情報の宝庫になりえそうだと思いました。
・テキストデータ、時間+位置データ、RFID、スマートグリッドデータ、センサーデータ、テレメトリデータ、社会ネットワークデータなどは元々知っていましたが事例を知ることで今まで知らなかった方向の利用法などを知ることができ、自動車部品に情報を発信させるテレマティクスデータ、カジノのカジノチップのトラッキングデータはかなり興味深く、データの採取コストが落ちてきたからこその手法だなと思いました。
<第2部 ビッグデータを手なずける―テクノロジー、プロセス、メソッド>
第4章 アナリティクスのスケーラビリティの向上
・仕組みの理解に苦労し、さらになぜそれが有用なのかということが結局理解できなかったような難解な内容がある章でした。
・インデータベースアーキテクチャは昔は当たり前だったところをアプリケーションとデータベースを分離するようになり、また統合方面に逆戻りしたような印象を受けました。
・MPP(超並列処理)は、どう処理を分割するかということをかなり最適化しないと分割した処理環境の性能の合計に追い付かないように思いました。
逆に最適に分割できれば細かく分かれた処理はより効率的に処理できるからトータルとしては性能向上に繋がるということでしょうか。
その処理を分割するロジックが難解そうだなと思いました。
・クラウドコンピューティングやグリッドコンピューティングの話は割と一般論でしたが、グリッドコンピューティングのところで一部を酷使した場合に最適な選択肢ではなくなるという話は私がMPPの実現が難しそうだなと思ったことと繋がっていてより深く理解できたように思いました。
・MapReduceは読んで考えてみてもなかなか理解しきれませんでした。
処理を分割し、実行環境に配分するという意味ではMPPの一類型のような気もしますが、どういうことなのか、なぜ有用なのかを詳しく知りたいです。
第5章 アナリティクスプロセスの発展
・従来のADS(アナリティクスデータセット)の話は自身でもある程度関わっていたことで分かりやすいなと思いましたが、EADS(エンタープライズアナリティクスデータセット)のように、正規化したデータを全て繋いでしまって分析で使うというのは処理能力が十分にあれば確かにデータを節約できるしより幅広く分析が出来そうだなと思いました。
・予測するスコアリングをリアルタイムで生成することがウェブ上でできればウェブ上での顧客の利便性促進・購買促進がかなり進みそうな気がします。
第6章 アナリティクスツール、メソッドの進化
・この章で書かれているツールの進化、オープンソースソフトウェアの進化はビッグデータの威力ほどのインパクトはなくてもかなり有用で世の中に影響を与えているなと思いました。
・技術者が自分のスキルやセンスを発揮する上で、便利なツールが競合するのではなく、さらに効率的に結果を出せる味方となるというのは納得できるなと思いました。
そういった人が意外と便利なツールを避けそうだなということも含めて。
<第3部 ビッグデータを手なずける―人とアプローチ>
第7章 優れた分析を可能にするもの
・分析とレポーティングを区分して、分析は新しい視点を含めた創造的な作業、レポーティングを定型のフォーマットにおける結果の提供と定義しているのは混同しそうなこの2つの作業をうまく分けているなと思いました。
レポーティングに該当することを分析と主張する人は結構いそうです。
・優れた分析の要素G・R・E・A・Tというのは初めて知りました。「Guided(ニーズに導かれていること)」「Relevance(ポイントを押さえていること)」「Explainable(説明できること)」「Actionable(行動に繋げられること)」「Timely(タイムリーなこと)」というのは確かに分析が必要とされるための条件として正しいように思えます。
・標準的なレポートから情報を集めて分析する「コアアナリティクス」と、自ら必要なデータを求めて非定型的に分析する「アドバンストアナリティクス」の区分は分かりにくい気はしますが、日常的・定型的な分析と、不定期・非定型的な分析の差でしょうか。
・分析は真剣に受け取ってもらわないと意味がないこと、つまみ食いで相手の都合のいいようにだけ受け取られてしまってはいけないことは、コミュニケーション全般について言えそうです。
・面白いデータがあり、それに対する分析をしたとしてもそれがビジネス上の重要性に結びついていなければ意味がないというのは技術オタク的な人には耳が痛そうだなと思いました。
・ビッグデータの分析だからと言って常に全数分析が必要な訳ではないが、サンプルを抽出して分析するにしても全数からのサンプル抽出が必要で、分析対象によってサンプル抽出の手法も対象も異なるというのは当然ですが、「ビッグデータ」を全数分析のみと考えている人は意外とこの辺りの配慮を見逃しそうだなと思いました。
第8章 優れたアナリティクスのプロフェッショナルの特徴
・優れたアナリティクスのプロフェッショナルの特徴として該当しないもの「教育」「業界の経験」と、該当するもの「意欲、本気」「創造力」というのは、「アナリティクス」という言葉のイメージからすると逆のようにすら思えるなと思いました。さらに「プレゼンテーションとコミュニケーションのスキル」「直観力」も必要なのだそうです。
・定型的な作業ではなく非定型的な分析を行う上で、スキルだけでなく職人としての資質も求められること、右脳的なスキルも必要になることは、この本で言う「ビッグデータ」を取り扱うための資質としては確かに必要な気がします。
第9章 優れたアナリティクスチームの特徴
・アナリティクスのプロフェッショナルが組織のなかでどういう立ち位置に立つべきか、ということが書かれていました。
確かに立ち位置次第でできることや協力者との関係も大きく変わってきそうな気がします。
アナリティクス専門の部署をつくるか、業務部署の一員として所属するか、一時的なプロジェクトチームとして流動的に動くか、それぞれ役割自体も変わってきそうです。
・「優れた」アナリティクスを行える人は市場に不足していること、IT部門と対立しがちということも何となくわかる気がしました。
<第4部 包括的に考える―アナリティクスの企業文化>
第10章 アナリティクスのイノベーションを可能にするもの
・アナリティクスを定型業務ではなくイノベーティブな仕事にするための仕組みづくりについて書かれていました。
P.440のアナリティクスを行うイノベーションセンターは「最初の探求分析」「重点的な研究調査」「プロトタイプの作成」までを担当したらそれ以降は手を離し、「正式な開発」「本番」の実現に向けたプロセスは別の部署が担当し、イノベーティブな活動のみを行える仕組みというのは理想的ですが、かなりしっかり定義して社内のコンセンサスを得ないと、なし崩し的に平常業務にも携わってリソースを100%稼働させようという方向に流れそうな気がします。
第11章 イノベーションと発見を可能にするもの
・イノベーティブなアナリティクスを作りだし、ビッグデータを手なずけることができるイノベーションと企業文化を作るための3つの大原則「殻を破れ」「波及効果を拾いつくせ」「全員でターゲットを目指せ」はそれ以外のイノベーションにも該当しそうな内容だなと思いました。2番目の「波及効果を拾いつくせ」だけビッグデータのテーマにふさわしいような気もしますが。
○つっこみどころ
・「はじめに」でこの本は一般のビジネスパーソンも対象にしているように書かれていましたが、そこそこITについて知っているつもりでも読んで理解するのに苦労するような技術的な内容も書かれていたように思います。
・さらっと解説した専門用語を100ページ以上あとでさらっと使っていたりするので何度も巻末の索引を見て、そのページに立ち戻って用語の確認をする必要があり、読むのが余計に大変でした。
・サンドボックスと従来の開発環境と実行環境の切り分けとの違いがよく分かりませんでした。(第5章 アナリティクスプロセスの発展)