第2回 ITを理解している人を見分けるにはどうしたらいいの?

--データと情報のちがい-- (2001/1/22発信)

「じゃあ、次の質問、いきます。

ITを理解している人を見分けるにはどうしたらいいの?」


--それはいい質問だね。見分ける方法か・・。

 そうだな、こういうふうに訊ねてみるといいかもしれない。『データと情報はどこがちがうか?』

 この質問にはっきり答えられる人はITの本質について洞察をもっている人だ。逆に、いかにパソコンにくわしくても、この質問の意味が分からない人は、ITの意義を理解できていないと思った方がいい。

 

「データと情報? それって何がちがうの? 同じものかと思ってた。」


--たいていの人は「データ」と「情報」という二つの言葉を、あまり区別せずにつかってる。専門書ですら、ときにはあいまいにしている。しかし、ITを理解する上では、この両者ははっきりと区別する必要があるんだ。

 「情報」とは、人間にとって意味をもたらすものさ。人間の話す言葉、書く言葉は意味を伝達するために発達した。

 これは逆の例を取ってみればわかるだろう。君がもし誰かから手紙をもらったとして、それが翻訳家の君でさえ全く知らない言語で書かれていたら、それに何の意味があると思う? ラブレターなのか? 脅迫状なのか? 招待状かはたまた予言書か? 意味が分からないものは、情報の役割をはたさないんだ。


「じゃ、データって何?」


--「データ」とは何か。データとは、数字や文字の規格化・定型化された並びのことなんだ。『規格化』・『定型化』の意味についてはおいおい説明するけど、いまはとりあえず「表のようにきちんと並んだ」というふうに理解しておいてほしい。


「なんか抽象的でよく分からないわ。例をあげてみてくれない?」


--たとえば、新聞の株式欄はデータだ。会社名と、株価の数字が整然と表になって並んでいる。駅の時刻表や電話帳もデータだ。野球のスコアブックもデータだね。


「スコアブックなんてコンピュータに入れておくものなの?」


--データというものは、必ずしもコンピュータの中に格納されていなくてもいい、ってことに注意してほしい。「あの野球監督はデータにもとづいて作戦を立てる」といったとき、そのデータは過去のスコアブックの集積を指しているので、それがパソコンに入っているかどうかは本質じゃない。その監督が単なる人情や勘だけで指示を出しているわけではない、ということをいっているのだから。

 ちなみに定型化され規格化されたデータをコンピュータに格納したものを、「データベース」とよぶ。


「わたし、数字のことをデータって呼ぶのかと思ってた。」


--データはべつに数字が並んでいる必要はない。文字だけでもデータなんだ。だから住所録や学校の卒業名簿だってデータさ。

 それと、図書館の蔵書カードなんか、カードがたくさん並んでいるだけで、全体が一枚の表の形にまとまっているわけではないけれど、それでもデータだ。1枚に書くべきことが決まっていて、それがきちんと並べられているからね。倉庫の入出庫台帳なんかもデータですな。


「ちょっと待ってよ、新聞の株式欄は『情報』じゃないの? ある株が上がったか下がったか、どの会社が今、注目株か。これはみな『意味』そのものなんだから、さっきの定義にしたがえばデータではなくて情報のはずじゃないかしら。」


--その答えはイエスでもありノーでもあります。というのは、数字の羅列から意味をくみ出すのは、人間の側の精神の働きにあるからね。ある株価の動きに君は意味を感じるが、別の人はその株価には無関心で、他の数字に意味を見いだすかもしれない。

 これは、証券アナリストが出す「今注目の株はこれ!」というレポートが、不特定多数の人に対してほぼ同じ意味を伝える「情報」そのものであることに対比して考えるとわかるとおもう。株式欄の数字自体は、受け取る人の意味づけに対して中立なものなんだ。


「なんだかまだごまかされているような気がするわ。人間の精神の働きが意味を汲み上げるって、どういうことよ。急にドイツ哲学の講義の時間になったみたい。」


--かりにいま、6月から9月までの毎日のビール消費量と、その日の気温との関係を日付順にならべて表をつくったとする。これはデータだ。ところで、そのデータを、横軸に気温・縦軸にビール消費量をとってプロットすると、こんな風に点が並んだとする(図-*)。この図を見ると、消費量は気温が28℃を超えるとぐっと上向きになることが誰でもわかる。

 しかし、これは人間がデータから意味を読みとる力をもっているからこそ、わかることなんだ。コンピュータは、表の形になっていようが、グラフの形で表現されていようが、そこから自動的に意味をくみ取るようなまねはできない。

 つまり、「データ」とは中立な(いいかえれば無味乾燥な)もので、そこから意味を引きだして「情報」にするのは人間の認識力そのものなのさ。


「ふーん、それで?」


--ところで、ここから先が大事なんだけれど、コンピュータの中に格納して処理できるのはデータだけだ。機械にできるのは、定型化された数字や文字の並びをあれこれと加工することなんだ。意味は人間の側の働きだから、コンピュータは「情報」を取り扱うことはできません。

 これがデータと情報のちがいさ。そして、この両者の関係が分からない人は、ITがわからないといえるとぼくは思う。



<参考 JISにおける用語定義>



情報:事実、事象、事物、過程、着想等の対象物に関して知り得た事であって、概念を含み、一定の文脈中で特定の意味を持つもの


データ:情報の表現であって、伝達解釈又は処理に適するように形式化され、再度情報として解釈できるもの。(備考 データに対する処理は人間が行っても良いし、自動的手段で行っても良い)




Follow me!