Harmonie "Diary" Chromatique

Harmonie Chromatiqueの日記帳です。

情報公開の意味~文脈とか~

「情報公開」とか「隠蔽体質」といった議論をめぐって、最近ちょっと面白い話があったので紹介。
多分同人企画方面に話を引っ張ることもできるとは思いますが、今日の議論はもっと一般的な話で閉じます。

元ネタはこれ。

bylines.news.yahoo.co.jp

そもそもこれ、私は「気象庁が隠蔽を図った・隠蔽体質というわけではない」という立場です。ですが、神田氏は(記事中にもあり当時のtweetで明言あった通り)隠蔽体質を立証しようとした、という立場で取材に乗り込んでいます。
で、「誤予測」を生んだ原因というのが、そもそも「高度利用者向け」の情報が一般向けに「漏洩」(あえてこう言います)したのが原因なんですね。

日本のスマホアプリやPC向けアプリで緊急地震速報を流す場合、おそらく大半が高度利用者向け情報をもとにした情報が元になっています。ただ、高度利用者向けってのは「高度」と言う通り、情報の文脈をちゃんと分かっている人、つまりどういう場合にどういうエラーが発生し、どういう誤りが発生しうるか理解している人向けの情報です。言い換えれば、誤報による混乱リスクを引き受けてでも大地震発生を一刻も早く知りたい人向け情報。

最近の東京都政をめぐっても、「情報公開」の題目で多くの情報を透明化することが求められています。大阪は一足早く全ての歳出を透明化する仕組みを作りました。
大阪市市政 公金支出情報の公表

なんですが、こういう生データが文脈を持たずに誰からもアクセス可能なのは、補助線って意味ではどうなんだろう?と思うこともあります。

一方で、私はいま本職のほうでデータサイエンスの仕事をやってます。機械学習とかAIとかそっち方面。そういう方向性から見ると、生データを直接いじれるってのは、確かに楽しいんですよね。楽しみだけに限れば、文脈なんかいらないから機械可読なデータを出せと。*1
ただ、じゃあ私がデータをきちんと扱う倫理を持っているかというと、それは証明はできません*2。仕事なら当然マネジメント下にあるのでビジネスとしてのインセンティブが働きますが、私個人の活動にそういうインセンティブは基本ありません。だから、「個人には生データを触らせない」というのは当然理解はできます。

……本来出て来てはダメだろ?と思う生データが出てきた最近の事例、例えばこれですね。これ一般向けに出すのは倫理的にアウトだろって気しかしないんですが……
名古屋市:子宮頸がん予防接種調査の結果を報告します(暮らしの情報)
ただ、データが出た以上データサイエンス方面から見れば宝の山なわけで、あっという間に統計学者たちがよってたかってデータクレンジングに取り組んで、機械可読なデータが一丁上がりしましたとさ。

なんだかんだ言っても、文脈を持たない未整理の生データが一般市民向けに出てくるのは、データサイエンスや細かい分析の民主化には役立ちますけど、一方で文脈を理解しない議論や曲解に巻き込まれる、という結果にも繋がります。
そのあたりの整理をどうやって進めればいいのか、悩みは尽きません。

未来への夢として、大枠としては「中立を放棄した多数のマスコミ(ベクトルの合計としては中立に近いことが望ましい)」と、「マスコミどうしの相互批判(ファクトチェック活動を含む)」あたりを整えていくと、いろいろ機能してくるのかなー?と思うところではありますが。

そういればこれ。

newsofnews.jp

ファクトチェックって「正しい/間違っている」だけではなく、「ミスリード」とか「変節した」とかの判定もしているんですよね。面白い概念だとは思います。

 

*1:ただし結果は世に出せないというやつでもあります:そんな勝手な補助線が世に出ちゃいけないので、結局自己満足にしかならない。

*2:倫理がない、というつもりはないのですが、倫理って証明できるかどうかが一番大切なことなので、証明できないこの手の倫理は存在しないのと同じです