• 様々な本、様々な資格の話が盛りだくさん(の予定)

【ビッグデータの正体 情報の産業革命が世界のすべてを変える】レポート

【ビッグデータの正体 情報の産業革命が世界のすべてを変える】
ビクター・マイヤー=ショーンベルガー (著), ケネス・クキエ (著), 斎藤 栄一郎 (翻訳)
https://www.amazon.co.jp/dp/4062180618/

○この本を一言で表すと?

 技術の話にはそれほど触れない経営学者視点のビッグデータ入門本

○よかった点、興味深かった点

・現状利用されているビッグデータの事例等を幅広く知ることができて入門本としてはよかったです。

第1章 世界を変えるビッグデータ

・グーグルで検索をしようとした履歴のデータからインフルエンザの流行を予測したという事例は面白いなと思いました。
「結果がわかれば理由はいらない」という意見は極論ではありますが面白いなと思いました。

第2章 第1の変化「すべてのデータを扱う」

・「無作為標本」という考え方が革命的だったという話はそういう考え方ができることで初めて母集団全体を推測できるようになったことを考えると納得できるなと思いました。
その「無作為標本」もある程度のレベルでしかなかなか実現できていない現在で全数で統計を取ることができるというのは確かに魅力的だと思います。

第3章 第2の変化「精度は重要ではない」

・乱雑な構造化されていないデータをそのままで分析できる仕組みがどのようになっているかが書かれておらず、その内容について知りたいと思いました。
RDBのフィールドやレコードという概念がない状態で全てフラットに扱って全体を検索するようなイメージでしょうか。
なんとなく検索をする段階である程度の仮説は必要になってきそうな気がしますし、それであれば結局「誰でも扱える」ようにはならない気がします。

第4章 第3の変化「因果から相関の世界へ」

・「FREE」の著者のクリス・アンダーソンの「理論の終焉」ということを否定し、ビッグデータ自体が理論で構築されているとしているのは冷静な議論だなと思いました。

第5章 データフィケーション

・マシュー・フォンテーン・モーリーの航海日誌を洗い出して情報を抽出・集計したり、ボトルメッセージを利用して海流の流れを調べたりする手法を19世紀の日本がまだ江戸時代の時期に実践していたというのはすごいことだなと思いました。

・「座り方」のデータを研究し、座り方自体を個人を特定する情報とすると言うのは面白い発想だなと思いました。
太ったり食い放題に行って体重が変わるほど食べたり、逆にマラソンに出て汗をかいて体重が減ったら本人と確認されなかったりするかなと思いました。

・「データ」という言葉が「与えられたもの」という意味のラテン語が語源となっているというのは初めて知りましたがなんとなくしっくりくるなと思いました。

・複式簿記が誤り訂正のロジックが含まれたものというのはITに携わってから簿記の勉強を始めた人は結構気付きそうだなと思いました。

・片っ端からデータ化していくというビッグデータの前提は情報収集力・情報保管力の向上とともに実現していくだろうなと思えました。

第6章 ただのデータに新たな価値が宿る

・データは採集した時より後に新たな価値が宿るというのは納得できる話だなと思いました。

・スペルミスも立派なデータになるというのはグーグルの事例だけでなく、「ヤバい経済学」で書かれていた命名の際のミスも該当するなと思いました。

第8章 リスク―ビッグデータのマイナス面

・ビッグデータの中では匿名でも本人が特定できるというのは2chのユーザーがニュースから個人を特定して掲示板に暴露していたことを思い出しました。

第10章 ビッグデータの未来

・これまで書かれてきたことの総括として、ビッグデータでは直感、良識、思いつき等の領域には踏み込めないと書かれていましたが、これまで書かれてきたトーンからすれば「それもいずれは可能になる」と書きそうなものだと思っていたので意外な感はありました。

○つっこみどころ

・自分がITについて全く知らなかった時の「今の世の中は自分が直接知らないだけで、これくらいのことができるんだろうな」と思っていた妄想とそっくりで笑いました。
技術的な基礎知識がなければこういうふわっとした内容になってしまうのだなと思いました。
第1章の最後に書いてある「緊急対策としても生かしてもらえる指南書である」という著者の自負には同意できません。

・著者の技術に関する知識にはかなり違和感がありました。
グーグル、アマゾン、フェイスブックといった企業が市場を見ていただけでなく、それよりも技術的に可能なところを追っていたところなどを理解していないように思えました。
また技術が革新的なものとなって世に出るまでのプロセスがそのまま抜けていて、過渡期の話がほとんど検討されていないように思いました。
「データが乱雑であるほどいい」と言える状況になるのはまだまだ先の話だと思いますし、技術を魔法とでも勘違いしていないかと思えます。
技術自体に関する記述がほとんどなく、結果としてこういう事例があったと紹介しているだけなので、物足りなさを感じました。

・著者の技術者に対する無関心に近い記述にはかなり違和感がありました。
技術者のスキルレベルやセンスなどは関係ないというような記述が多いように思いました。

・後半の事例は著者の意図とは違って「結果がわかれば理由はいらない」の例というよりは、ある程度の理論・仮説を基に結論を出したように思えます。(第2章 第1の変化「すべてのデータを扱う」)

・アマゾンやウォルマートの例も「こういうデータを集める」「こういうデータも必要」という思考で作り上げられた仕組みだと思いました。
「この本を買った人はこの本も・・・」や「この天気の場合の売り上げは・・・」という相互のデータの関係は相関関係ですが、その前提となっているのは因果関係であり、因果関係は外せないということをより意識しました。(第4章 第3の変化「因果から相関の世界へ」)

・今には残っていない古文書等の語彙の意味をビッグデータの分析手法で調べ上げるというのは面白いなと思いました。
後半の「システムに知恵や洞察力が生まれる」はあまり同意できませんでした。
システムがそのようになる場合、そのようにするシステムの設計で予め組み込まれた条件であって、自発的に生まれているわけではないと思います。(第5章 データフィケーション)

・データを有していること自体を資産価値として評価するという考え方はわかりますが、恣意的になり過ぎて企業評価として利用するのは難しそうだと思いました。
価値実現(データをどのように活用し、どのように収益を得ているか)まで行かないと他の資産と同等とは認められない気もします。
著者のフェイスブックへの評価は恣意的過ぎてフェイスブックの経営者に知り合いでもいるのかなと思いました。(第6章 ただのデータに新たな価値が宿る)

・P.190~のビッグデータ企業の3タイプで「データ型」「スキル型」「アイデア型」でビッグデータ時代の序盤は「アイデア型」が抜きんでて徐々に「データ型」が躍進してくる、ということが書かれ、「スキル型」には焦点があてられていませんでした。
技術者・専門家を抜きにしてもビッグデータの相関関係を活用できるようになるためには「条件も無作為に付与」「結果の選別も自動」というようなことが必要だと思いますが、そのレベルにビッグデータのインフラが到達するのは相当先の話ではないでしょうか。
それまでは技術者のスキルや乱雑なビッグデータを整理して利用しやすくすることはどうしても必要になってくるように思います。(第7章 データを上手に利用する企業)

・「エキスパートの終焉」の話は、著者が「理論の終焉」を否定したことと同じ論理で否定できると思いました。
この辺りも技術者・専門家を嫌っていると思えるような著者のダブル・スタンダードなところだと思いました。(第7章 データを上手に利用する企業)

・この章の最後のビッグデータの恩恵を受ける企業の話で中規模の企業が恩恵を受けないということと小規模企業にはコストとイノベーションのメリットがあるという話は一般化していいのかと疑問に思うほど乱暴な結論で、実際は大企業が更に大きくなる格差拡大に貢献しそうだなと思いました。(第7章 データを上手に利用する企業)

・データの独裁、データ至上主義の弊害の話は、これも「そのデータでよいのか」という著者が避けている技術者・専門家の洞察が有用だと思いました。(第8章 リスク―ビッグデータのマイナス面)

・リスクをあまり詳しく書きたくなかったのか、著者が単に思いつかなかったのか、書かれているリスクのレベルがかなりしょぼいなと思いました。(第8章 リスク―ビッグデータのマイナス面)

・第8章で述べたリスクに対する対処策が書かれていましたが、著者の提唱するビッグデータ時代にふさわしいガバナンスの基盤が「プライバシー保護の利用者責任制」「予測に人間の関与が含まれていること」「ビッグデータ監査人(アルゴリミスト)をおくこと」というのはザル過ぎて笑止千万だと思いました。
特にアルゴリミストに該当するようなITに関する監査はSOX法、J-SOX法で実施されていますが、それがどれだけ実効性がないものかを著者は知らないのだろうなと思いました。(第9章 情報洪水時代のルール)