忍者ブログ

I'm Standing on the Shoulders of Giants.

読んだ本から個人的に惹かれた部分を抜き出します。心理学およびその周辺領域を中心としています。 このBlogの主な目的は,自分の勉強と,出典情報付きの情報をネット上に残すことにあります。書誌情報が示されていますので,気になった一節が見つかったら,ぜひ出典元となった書籍をお読みください。

   

[PR]

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

データセットの影

 非常に運がよければ,データセットの影を簡単に作れる場合もある。たとえば,ビッグデータでしばしば問題になるのは,取り扱いに慎重を要する個人情報が明らかになってしまうことである。それなら,それぞれの記録に付随している個人名を消してしまえば十分なはずのように思える。だが,そんな単純なケースはまれである。問題は,多くのビッグデータは情報がきわめて豊富なため,じっくり考えれば各記録の個人名など,冗長なデータにすぎない。つまり,記録自体に個人を特定するための特徴が豊富に含まれていて,それに該当しうる人物は地球上にたった一人しかありえないということになるからだ。こうしたケースでは,個人名を外してもあまり実効性はない。



エレツ・エイデン ジャン=バティースト・ミシェル 坂本芳久(訳) (2016). カルチャロミクス:文化をビッグデータで計測する 草思社 pp. 89


PR

bitFlyer ビットコインを始めるなら安心・安全な取引所で

Copyright ©  -- I'm Standing on the Shoulders of Giants. --  All Rights Reserved
Design by CriCri / Photo by Geralt / powered by NINJA TOOLS / 忍者ブログ / [PR]