データビジュアライゼーション 役立つ情報源(デザイン面を中心に)

データビジュアライゼーション 役立つ情報源(デザイン面を中心に)

随時更新しています。

データビジュアライゼーションとは

ツール

D3.js

Java Script ライブラリ

Leaflet

Java Script ライブラリ

コミュニティ

研究者

ブログ

  • GUNMA GIS GEEK
    清水正行さん D3、GIS,オープンデータなどの話題

ポッドキャスト

報道機関

カンファレンス・イベントなど

オープンデータなど

事例

データビジュアライゼーション

インフォグラフィックス

書籍

地図がウソをつくとき 専門家による地図にだまされないコツ

この記事は、When Maps Lieの日本語訳です。
CityLab.com編集部の許諾を得ています。転載はご遠慮ください。

地図がウソをつくとき
専門家による地図にだまされないコツ

Original Article: When Maps Lie
Text: Andrew Wiseman
Published: Jun 25, 2015
Translate: Tatsuo Sugimoto

この地図にはなにか意味があるのでしょうか。(iQoncept / Shutterstock.com)

このところ地図は大きな話題です。ブログや(このサイトなどの)ニュースサイトが、「世界を説明する40の地図」、「全米各州で人気のTV番組」といった地図をしょっちゅう掲載しては、よく拡散されています。こうした地図は、Facebook、Twitter、Tumblrで広がっていて、報道機関も、デジタル空間で地図の持つ明らかなパワーを当然利用しています。地図は、大量のデータを素早く効果的に視覚化することができます。ところが地図は、大量のデータを不正確にも誤解を招くようにも視覚化することができてしまいます。

地図はただの絵ではありません。地図は、その背後にあるデータや、データの収集と解析に使われる方法論、そうした作業をおこなう人々、視覚化における選択、制作に使われるソフトウェアでもあります。地図は世界の代わりにもなりますが、多少の不正確さは残っているものです。ほとんどの地図は、球面上の世界を平面にして表します。全てを同時に見せられる地図がないように、何かしら消し去られたり強調されるのが常です。意識していようがいまいが、全ての選択やバイアスが地図そのものに大きな影響を与えます。私たちは気づかぬうちに、不正確だったり、誤解を招いたり、間違ったりしているものを見ているかもしれないのです。

アメリカ国民は幼い頃から、言葉の意味や使い方を分析し理解することを学びます。ところが地図に関しては、そうした技術を学ぶことはほとんどありません。

名著『地図は嘘つきである』(How to Lie With Maps)でマーク・モンモニア(Mark Monmonier)が書いたように、(彼の言葉を借りれば「言葉の慎重な消費者」になるように)アメリカ国民は幼い頃から、広告、政治キャンペーン、ニュースなどの言葉の意味や使い方を分析し理解することを学びます。ところが地図に関しては、そうした技術を学ぶことはほとんどありません。

地図は嘘つきである
地図は嘘つきである

posted with amazlet at 16.04.17
マーク モンモニア
晶文社
売り上げランキング: 874,458

地図を使う教育(と地理全般)は、全米の学校では不十分で一般的ではありません。高校の飛び級試験の人文地理学は、2001年に始まったばかりです。多くのトップ私立大学は、科目として地理を課していません。ハーバード大学は、1948年に地理を削除し、研究者からは全国で地理の学習が減少しはじめたことに非難の声があがりました。

数多くの研究が、大多数のアメリカ人には地理的リテラシーが欠けていて、地図上でアフガニスタンやイラクなどの場所を見つけることができないと報告しています。ましてや、それらがどこにあり、なぜそこにあり、ほかのことにどう影響するのかといった、複雑な空間的関係を理解することなどできません。(ハーバード大学の名誉のためにいっておくと、同大学は2006年に地理学的分析センターを設立しています。)こうしたことを思い浮かべても、多くのアメリカ人は地理といえば、単に州都を覚えたり、ナショナルジオグラフィックのクールな動物写真を見たりすることだと考えているのです。

人々が地図をたいてい正確だと思い込んでいることは驚くことではありません。なぜなら地図がどのように作られているのかは、ほとんど知られていないからです。モンモニアが言うように、地図は「過剰な敬意と信憑性をもたらす神秘的なイメージ」であり、「高度な技術をもつデザイナーと製図者という聖職に託された」ものなのです。言葉はほぼだれでも書けますが、全員が地図を作ることはできません。

その一方で、コンピュータやソフトウェアが強力かつ安くなり、地理情報システム(GIS)の利用が爆発的に拡大しました。新たなWeb地図ツールとデータの公開で、従来専門家や専用ソフトのユーザしかできなかった地図制作の民主化が進み、だれでも地図を作れるようになりました。つまり、より多くの人が自分で地図を作るようになったのです。これは確かに良いことです。しかし、(拡散を煽ったり特定の視点を押し付ける)デザインや、自分のやっていることを完全に理解していない制作者による、精密さを欠いた不正確な地図も大量に出回ってしまっています。

地図というのは、たとえ精密でなくとも楽しいものです。とはいえ地図にだまされないように、頭の片隅にとどめておけるちょっとしたコツがあります。

タイトルを信じない

よき地図制作者は、大風呂敷を広げずに、地図が示すことを正確かつ簡潔に説明しなければいけません。最近の事例に、「成長期を過ごすのに最良な地域と最悪な地域」というタイトルがついたニューヨークタイムズの記事とインタラクティブな地図があります。説明するまでもないタイトルかもしれませんが、この地図の背後にあるデータは、人々が育った場所によってどれほどのお金を稼いでいるかを示しているだけです。とても興味深い発見ではありますが、収入の多寡から、ある場所で育つのが他の場所よりも良いとは必ずしもいえません。これは定義が難しい問題で、間違いなく多くの変数が絡んでいるからです。ある場所は物価が低く、良い学校や良い保健施設があり、いろいろなレクリエーションが用意されているかもしれません。事実、この記事ではそうした議論がなされています。

アリゾナ州マリコパ郡では、貧しい家庭の子ども平均的な所得移動があります。全郡の約48%より上位です。(The New York Times)

データは非常に魅力的に提示され、実際読者が閲覧している場所によってこの地図は印象的に変化しています。しかしこのタイトルは、何を示そうとしたかを本当に示してはいません。地図を見ただけでその土地の良し悪しを判断したとしたら、この記事の全体像を見過ごすことになります。アトランタやデンバーは、育つのに悪い場所でしょうか。ワイオミング州、ユタ州、南北ダコタ州、田舎のミネソタ州やアイオワ州が最良の場所でしょうか。良いか悪いかは、あなたが何を最良で何を最悪だととらえるかで変わります。

地図のタイトルがついた赤い旗は、アメージング、インクレディブル、ゴージャスなどの〔バイラルメディアの〕Upworthy的な言葉で、全てを明らかにしたと主張しているはずです。「このすばらしい地図は、わずか数都市で全米の生産量の半分を占めていることをあらわす」というように。データとマップの作られ方をしっかり調べると、こうした大げさなタイトルが見掛け倒しであることがよくあります。

国内総生産(GDP)を示したこの地図では、都市部の住民が地方の住民よりも生産的に見えますが、実際に示しているのは、この国のGDPの50%が人口の50%によって生産されているということです。かなり多くの人々が地方よりも都市部に住んでいるので、とくに驚くべき話ではありません。興味深い地図は人口当たりのGDPでしょう。ある地域は他の地域よりも生産的ですか? それはなぜ?(私が学生に伝えたいのは、良い地図は唯一の解ではなく疑問をひきだすこともあるということです。)似た事例に、米国のエイズ事案の92%が25の州で発生していることを示す地図があります。しかし別の記事によると、米国の人口の大部分はその25の州に住んでいます。つまりこの結果は、ほぼ想定の範囲内なのです。各州の内部のばらつき具合を地図に示せば、より興味深いものになるでしょう。

タイトルは、人々がどのように地図を解釈するかの問題でもあり、良い地図がデータの情報源を地図自体に(詳細についてはその直後に)載せなければいけない理由でもあります。例えば、この「コーポレート・ステーツ・オブ・アメリカ」の地図は、各州で「最も有名な」会社を示していると謳っています。しかし「最も有名」とは、どんな意味でしょうか。この地図の作者は正直に、企業の認知率や市場価値といった実際のデータの裏付けはなく、単にその州をもっとも代表すると自分で考えた企業だと説明しています。ですからフロリダが、自州の代表がフーターズだからといって恥じる必要はないのです。別の有名な地図に、各州のご当地バンド(他州よりも人気のあるバンド)地図があります。この地図は、存在するデータをもとにしていて、「あなたの州のお気に入りバンド」として共有されました。この2つの事例は別物です。

こうした「アメージング」な地図は、たいてい誰かが構成したものでしかないのです。だからといって、そうした地図がイケてないとか楽しくないわけではもちろんありません。(事実その地図はイケてるはずです。美しくないマップはシェアされませんから。)

情報源は大切

地図のデータの情報源は、最初に見つけるべきことのひとつです。この情報はどこから来ているか。信頼できる情報源か。最新の情報か。自分で確認できるものか。

情報源が掲載されていなかったらご用心。ただし掲載されていても、注意しなければいけません。たとえば最近、もっとも嫌われている大学バスケットチームの地図が口コミで拡散しました。この制作者は、自身をキュレーターとする小さなメタデータを掲載していて参考になります。ところがデータ自体は、Redditの大学バスケットボール板に投稿された2問のGoogle Docsのアンケートによるもので、アメリカ国民の全体像をあらわすことはできません。このアンケートは出身地の回答が必須でしたが、回答者はわざとウソをつくことができました。デューク大学が嫌いな人は、データを歪めるためにノースカロライナ出身だといつわることもできたのです。

この地図の正確な説明は、「自主的に回答したReddit大学バスケットボール板ユーザーの中でもっとも嫌われている大学バスケットボールチーム」となるでしょう。このような説明文は、読者がたどれるようにするのではなく、しっかり地図上に示しておくべきです。このように表記していたら、嫌われているというチームの本拠地で発行している新聞が、この地図を取り上げることはなかったでしょう。

全米各州の代表的食べ物
この地図のデータを信じられますか。よく見てください。(via Playboy)

これは取るに足らない無害な事例です。嫌いな大学バスケ地図が正しいかどうかなんてどうでもいいですよね。でも同じことが、政治、健康、宗教など、あらゆる種類のデータでできてしまいます。

情報源にすぐに辿り着けると、偏りがないか、データ通りに作られているかを確かめられます。面白い例に、州ごとの「門外不出。本当に多い死因」があります。この地図には、トロール、ロシアの侵略、モンスター、〔牛乳を消化できない〕乳糖不耐症などが並んでいます。これは明らかにバイラルマップのパロディです。各州で最も人気の映画や仕事や食べ物、あるいは死因のような重大な話題を示すバイラルマップは、誤解を招き、複数の州にまたがっている多様性を隠してしまうおそれがあります。

「各州の特徴的な食物」「各州でいちばん人気のテレビ番組」(それともいちばん大きな影響をもつ番組? 繰り返しますがタイトルは重要です)といったバイラルマップは、Redditユーザを発祥とすることもあって、アーカンソー州の特徴的な食物として「ドラッグ・クッキー」みたいなものが出てきてしまいます。こうした地図はもちろん楽しいですが、これをもとに結論を出すのはまずいでしょう。〔アーカンソー州の〕リトル・ロックには、メニューにドラッグを載せているレストランがたくさんあるとは思えません。


ヒートマップ・密度マップは混乱のもと

WebコミックのXKCDは、地図を使ってこの類の面白おかしさを一刀両断しています。この地図には、あるWebサイトの訪問者、「マーシャ・スチュワート・リビング」誌の購読者、動物ポルノの消費者という3つの無関係なものの密度が示されていて、どれも同じ密度になっています。

イラッとすること 第208回
地理的分析地図は基本的にただの人口分布図
「この業界がいわんとしていることは一目瞭然です」

このジョークは、どの地図も人口地図でしかなく、多くの人々がこうした地図を作りたがっていることを伝えています。さきほど取り上げたGDPマップもただの人口マップでしかありません。人口が多い場所はGDPも大きいのです。

これまでの全てのツイートを示したとする地図も、同じタイプの地図です。とてもきれいな地図ですが、Floating Sheepというすばらしいサイトの地図制作者が指摘するように、この地図が基本的に示しているのは、人がたくさんいる場所ほどツイートする人も多いということです。ある場所には何かが多くあることを示すだけなら十分かもしれません。しかし単に人口以上のことをマッピングしたり、参考となる結論を導きたい場合、ヒートマップには、人口や何か別の有効な要素との比率で一般化するなどの作業が必要です。

例えば一人当たりのツイート量のマップは興味深いものになるでしょう。こうすると、自分が見ているものが実際に平均的かどうかを見ることができます。(ツイート地図の制作者エリック・フィッシャー(Eric Fischer)は、ツーリストと地元住民がジオタグのついた写真をどこで撮影しているのかを比較して見せ、ときにはワシントンD.C.のアナコスティア川の東側のように必ずしも人口の多くない地域で多くのツイートがあることを示す、興味深い事例も作っています。)


地図制作者は何を見せ、何を隠そうとするのか?

地図は世界の代わりとなる表現ですが、ある要素は強調され、別の要素は取りのぞかれています。ほとんどの場合、情報の取捨選択は良いことです。特定の目的をもつ地図には有用な項目(道路地図なら道路の種類、名前、都市名)だけを載せるべきですし、ぎざぎざで絡み合ったものを明瞭にするには地下鉄の路線図のようにシンプルにすることがあります。しかし何かを操作したり取りのぞいたりしたことを伝えるのは容易ではありません。そこで地図制作者がどんな選択をしたかを考えることが重要になります。

このシンプルな一例に、何かを売り込み説得しようとする地図があります。その不動産地図は、距離を正確に示していますか? そばにある石炭発電所や悪臭を放つ養鶏場をないものにしていませんか?(「ザ・シンプソンズ」のモノレールの甘い罠を思い出してください。あの地図には、ブロックウェイ、オグデンヴィル、ノース・ヘイヴァーブルックが載っていました!)

色とサイズも、何かを強調したり隠したりするのに使われます。制作者が良くないものとして何かを見せたい場合、赤色にします。強調したい場合は、大きくし鮮やかな色をつけ、人々に気がついてほしくないものを小さくしグレーにします(もしくは一切とりのぞきます)。

見せたいものがたくさんある場合(ニュージャージー州の道にあいている穴など)、大きくて目立つ印を作るかもしれません。この大きな印によって、データにはいろいろな種類の穴があることが分からなくなってしまいます。穴は30センチ幅あるのか、ほんの2~3センチなのでしょうか。この地図では「へえ、たくさんの穴があるんだな」以上のことを伝えることは不可能です(それにこの地図はデータの情報源も掲載していません)。

こうした地図は、うっかりミスを誘います。たとえそういう意味でなかったとしても、赤や異なる色がつけられたものを人々は悪いものだとみなしてしまいます。それに赤は、他の地味な色よりも目を引きつけがちです。この紛らわしい事例のひとつが、州ごとの人口増加をあらわすAP通信のこの地図です。

ゆるやかな人口増加
情報源:アメリカ合衆国国勢調査局 AP通信

ミシガン州が赤色ということは悪い場所、で間違いないですか。実はこの地図の凡例は、いろんな理由で混乱を招いています。ここには3種類の異なる範囲が設定されています。「未満」記号が2つ、5–10といった数値の範囲が3つ、それに「プラス」記号です。表示される数字の表し方がいろいろあるため、理解が難しくなっています。さらに範囲が重なってもいます。10%は、5–10なのか10–15なのか分かりません。範囲を0-4.9や5-9.9のようにすると分かりやすくなるでしょう。5%未満は、厳密にいえば0%未満も含んでいます。さらに極め付きは、説明にはデータは1,000単位だと書いてあるのに、パーセントで表されていることです。テキサス州の人口はたくさん増えましたが、20,000%も増加してはいません。これらの事例はどれも、凡例と色を見逃してはいけない理由をしっかり表しています。赤色を悪いことだとするのなら、その理由を明確にしましょう。

データが構造化された方法も注意すべき部分です。値は、失業者の合計や失業率といったデータ自体の値ですか、データから派生した何か別の値ですか。実際の値を得ることから離れるほど、疑い深くなる必要があります。見ているのは変化率ですか、変化率のうちの減少分ですか。もし誰かが二次的な派生を強調していたら、全体的に不都合な真実を隠そうとしているのかもしれません。(一方これを検証する重要な推論があります。それは、簡単に入手できる人口によってデータを正規化することです。)


データの区分け方は重要

州ごとの人口を少ないほど薄い色に、多いほど濃い色にするといった、何かのバリエーションを別々の色を使って表す地図をコロプレス図〔塗り分け地図・階級区分図〕と呼びます。こうした地図は、値を別々の分類に分割することをとくに重視しています。この区分が誤解をまねいたり現実を覆い隠してしまうことがあります。

均等な間隔でデータを分割する地図を作ることは普通によくあることです。郡ごとの人口を、1-10,000、10,0001-20,000、20,001-30,000などとします。しかし理論的な区分けが、情報を提示するのに最適な手法ではないこともあります。地図制作者が何かを強調したり隠したりしたい場合、分割(集合間の分割線)を簡単に操作し、高い値や低い値をあわせて1つの大きな分類にまとめ、その他の値には個々の分類を作ることができてしまいます。この場合、データの一部分が強調され、その他の部分が隠れてしまいます。そのよく分かる事例が、フロリダ州のヒスパニック人口を示したこれらの地図です。

これらの地図はどれもまったく同じデータを使っています。各地図の異なる分類によって、ヒスパニックの人数が全く違うように見えてしまいます。

「高い」と「低い」だけで色分けしていたり、凡例が一切なかったりするなど、地図がどんな区分けをしたのか明確でない場合は十分警戒してください。情報源が信頼できなかったり、何者かが捏造したりするおそれがあることにも注意が必要です。

データのグループ化も恣意的になりえます。地図制作者が、失業率低下といった肯定的だと考えているものを強調したい場合、失業率が上昇した郡は全て(薄いグレーのような)目立たない色に統一する一方、失業率が低下した郡は低下するほど濃い色にし低下量を見せる地図を作るかもしれません。強調された失業率低下の地域よりも、上昇の地域が実際にはかなり広かったとしても、この地図からは見て取れないでしょう。上昇と低下の両方を含むスケール〔目盛り〕で同じデータを示した地図では、閲覧者はまったく違ったデータを理解することになるでしょう。(データの情報源が重要であることのもう一つの理由です。)


コロプレス図にご注意

前述したコロプレス図は、データをとても効果的に示すことができます。しかしこの地図が誤って使われると、多くの問題が起こります。そのひとつが、州、郡、国勢調査の地域などの面積や人口が均等でなく、各地域内の人口も均等に分散されていない「可変単位地区問題」と呼ばれる問題です。これは、データを分割するのに使われる境界線によって、現実世界のクラスターやパターンが隠されてしまうことを意味します。隠されたパターンを理解するには、データを掘り下げる必要があるかもしれません。

2012年米大統領選挙の一連のコロプレス図は、この問題をとてもよく表しています。最初の地図では、大統領選が非常に拮抗しているか、国が(赤い州と青い州に)きれいに二分しているように見えるように作られています。ただこのように勝者によって州を赤色か青色にすると、勝敗の差の程度、投票の合計数、州内の多様性が見えなくなってしまいます。

制作者が論理的な選択として、より細かい郡ごとに同じデータを見せることを選んだ場合、オバマよりもロムニーに多くの支持が集まっているように見えます。じっさいにはオバマが500万票以上も上回る票を獲得し、やすやすと選挙人団の票を得た事実があったにもかかわらずです。私たちは、それぞれの郡が同じ人口ではないことを知っています。ロムニーは人口の少ない農村郡で数多く勝利した一方、オバマは大きな人口を擁する小都市の郡で圧勝しました。(選挙後に人気を博した「紫色の州」地図のように)青色から紫色、赤色へと支持率に応じたデータを示したとしても、いぜんとして大部分がきわめて小さな面積である都市部の郡の人口が大きいことを見過ごしてしまいます。

可変単位地区問題は、なぜ生の数値よりも密度(人口密度など)などをマッピングしたほうが役に立つかの根拠にもなります。なぜなら小さな郡や国勢調査の地域の密度がとても高いかもしれないからです。

この問題に対する一つの解決策はカルトグラムです。カルトグラムとは単位地区(この場合では郡)を人口に応じて大きさを変えた図なので、人口の多い郡ほど大きく見えます。

2012年米国大統領選の結果のカルトグラムの例
ミシガン州立大学のマーク・ニューマン(Mark Newman)による

この地図はそれなりに便利ですが、州や郡がどこにあるのかをあらかじめ知っていてもなお、ずいぶん混乱したり方向感覚を失うおそれがあります。各郡での勝敗の差を示すグラデーションを加えると、さらに多くのことが分かります。

このカルトグラムでは、多くの郡がほとんど紫色だったのに対し、人口の多い郡のほとんどではオバマが圧勝したことを示しています。

この結果は当たり前に見えるかもしれません。しかしそれは、私たちが基本的に米国の選挙結果をよく知っているからに過ぎません。私たちがよく知らない情報は、存在しないというよりパターンを示しているように見え、表示や編集の方法によって不正確になるかもしれません。このことが、制作者が自分のデータと何をマッピングしているのかを理解し、データを他者から見られるように公開しなければならない理由なのです。

理解せず作られた悪しき例が、ナイジェリアでの誘拐に関するFiveThirtyEightの記事でした(現在は更新されています)。もともとこの制作者は、誘拐の報告に関するデータがどのように収集され整理されたのかを十分に理解せずにマッピングし、そこから多くの誤った結論を導きました。そして長文の撤回に終わったのです。一例をあげると、どの町にもマッピングされなかったデータは、ナイジェリアのちょうど中心地に置かれたので、このコロプレス図の中心点のある地区で誘拐が頻発しているように見えたのです。さらにこの記事は、微妙ながら重要な違いとして、実際には「誘拐の報告の地図」なのに「誘拐の地図」だと述べていたのです。この地図も、正確なタイトルと説明がなぜ重要なのかを示す例です。


基本データも重要

地図に使われる基本データも、境界、位置など重要な影響をもたらします。たとえばGoogleマップは、あなたがどこにいるかによって国境を変化させています。中国、インド、パキスタンの国境線は、領土の主張が相反しているため、各国でかなり違います。Googleは、ウクライナ、ロシアのクリミアやその他の地域でも同じことをしていて、その国の人々に巧妙に合わせたり、変えたりしているのです。別の場所の誰かは一生を通じて別の地図を見ているかもしれませんが、あなたはいつも同じように地図を見ているので、何かが消されていることに気がつくことはないでしょう。

地図の表示方法も重要です。悪名高いメルカトル図法が分かりやすい例で、アフリカと南アメリカを実際よりも小さく見せる一方で、ヨーロッパと北アメリカの大きさを誇張します。この面白い事例が、〔ドラマ〕「ザ・ホワイトハウス」にあります。

基本データは体系的な欠陥を持つこともあります。拡散した「米国のすべての河川」地図は一見きれいですが、よく見るとデータに問題があります。

米国のすべての河川地図? まさか。

一例をあげると、テキサス州とオクラホマ州に河川の密度が変わっているところがあり線や矩形が見えます。何らかの理由で、間違いなく地勢ではない人為的なものがデータにあり、他の地域よりも多くの河川がマッピングされている地域があります。地図で使われる基本データには、このように一見しても明らかでない欠陥が他にもあるかもしれません。


それでも地図は悪くない

これでどんな地図もダメだとか、私たちはいつも地図を疑ってかからなくてはいけないとか、専門家だけが地図を作るべきだ、というわけではまったくありません。地図というのはもともと面白くて楽しいものです(地理もね!)。でも制作者がどのように操作したり隠したりできるかについて、ちょっと考えたり意識したりすることもよいことです。広告や政治キャンペーンのように、そもそも地図(とその背後にあるデータ)を信用してはいけませんが、地図はこれからもパワフルで面白くて楽しませてくれます。

Top image: iQoncept / Shutterstock.com

データビジュアライゼーションにおけるデザインとリデザイン


Design and Redesign in Data Visualization
original text: Fernanda Viégas / Martin Wattenberg
translation: Tatsuo Sugimoto

初出:Malofiej 22, Annual Book

この記事は、フェルナンダ・ヴィエガスとマーティン・ワッテンバーグ(Fernanda Viégas / Martin Wattenberg)によるDesign and Redesign in Data Visualizationの原著者許諾済みの日本語訳です。翻訳時にもくじとリンクを追加しました。

著者は、現在マサチューセッツでGoogleのBig Pictureビジュアライゼーション研究グループを率いていて、全米の風をリアルタイムに可視化したプロジェクトWind Mapなどを手がけています。2007年には、IBM Researchでビジュアライゼーションの共有サイトMany Eyesを開発していて、この分野の先駆者といえます。

このテキストでは、データビジュアライゼーションにおける再制作「リデザイン」を通じた批評の可能性と課題を事例を通じて考察し、リデザイン批評で守るべきルールを提案しています。

もくじ

ビジュアライゼーションは、いまやマスメディアです。ハリウッドほどではありませんが、インフォメーション・グラフィックスは何百万人もの人びとの目にふれ、授賞式があり、この世界の有名人はTwitterで何万人ものフォロワーを集めています。より大きなこととして、ジャーナリズムの観点からは、データビジュアライゼーションが情報伝達の過程に不可欠な要素になっています。今日、グラフが1つもないデータ記事は、写真がないファッション記事のようなものです。

きらびやかさや人気とともに、ビジュアライゼーションは大衆の批評という別のものもひきつけました。これは、小さな規模で起こっていて、インフォグラフィックスの批評がニューヨーク・タイムズのアート欄にあらわれてはいません。とはいえ魅力的なビジュアライゼーションが登場すると、ウェブにコメントや議論があらわれてブログからTwitter、Facebookに広まっていくことはめずらしくありません。このレベルの批評は、ほかの一般的なコミュニケーションのメディアでもつきもので、驚くべきことではありません。

しかしビジュアライゼーション批評では、伝えるプロセス、さらに受け取るプロセスでも、予期しないことが起きることがわかります。これは、単にビジュアライゼーションがとても新しいからだとか、どんなメディアでも批評が感情をかき立てうるからそうなるのではありません。これから述べるように、ビジュアライゼーションが生データの変換をベースにしていることから、その批評が映画批評や書評では不可能なかたちをとりうることを意味しています。このエッセイの目的は、公開の場でのビジュアライゼーション批評、とくに直接的なリデザインをもとにした批評に関する問題を考察することです。

批評としてのリデザイン

著名な批評家による有名な批評からはじめましょう。エドワード・タフテ(Edward Tufte)は、歴史に残る著書『Visual Explanations』で、1986年スペース・シャトル「チャレンジャー号」の爆発を引き起こした判断過程について書いています。エンジニアと政府担当者は、双方同じように大ざっぱな手書きの表や図を使って、状況を解き明かして自分たちの判断を伝えようとしました。タフテは、彼らを反映している、この図とメンタルプロセス両面における問題を見事に分析したのです。

タフテの最重要な論点は、デザインです。データは十分に決定的で、明快な思考に基づいた明快なコミュニケーションがあれば、シャトルが打上げられることはありませんでした(悲しいことに、彼が報告書を作成して主張したのは、混乱した思考による失敗のあとでした)。タフテは、デザインの問題を証明するためにリデザインし、エンジニアが作ったオリジナルの表や政府調査にあるグラフと明確に比較できるお手本となる新たな図を制作しました。

主要な可変項目を直接的に比較できることを示すために、タフテは上図の散布図を制作しました。このチャートでは、データそのものが物語っています。低温の危険を明らかに図解し、寒波の打上げが明確な異常値としてあらわれているのです。この散布図のリデザインは、長く繊細な分析の一部分ですが秀逸です。タフテは次のようにまとめています。「正しい散布図やデータ表が作られていたら、だれがあんな寒波のなかでチャレンジャー号にあえてリスクをとらせようとしたでしょうか」。

リデザインによる批評という方法は、どちらかといえば流行りだしています。次はごく最近の事例です。Accuratジョージア・ルーピ(Giorgia Lupi)は、有名作家の著作の図を制作し、作家の生存期間における代表作の日付をビジュアライズしました。彼女のチャートは、各作家の数篇の著作をあらわす「小さな複数の」多角形による変わった組み合わせのものでした。マイアミ大学教授のアルベルト・カイロ(Alberto Cairo)は、同じデータをもとに単純明快な直線のタイムラインを使いました。隣合わせに比較すると、両者の表現方法を実に簡単に比べることができます。

「リデザインによる批評」という手法は、いくつかの点において、データビジュアライゼーションでとても特有にはたらきます。映画評論家は、映画をリメイクすることはできません。美術評論家は、絵画のモデルにもう一度座ってとお願いすることはできません。書評家は、あるセンテンスをリライトすることはできるかもしれませんが、本全体をやるのは不可能です。ところがデータビジュアライゼーションの場合、もとのデータセットにアクセスできて、そのデータがそれほど複雑でなければ、すくなくともラフなリデザインを作ることは可能なのです。

もちろん、この手法を使えることが単純に良いとはいえません。リデザインによる批評の影響は驚くほど複雑で、このエッセイではそれを解きほぐすのに大部分を費やします。とはいえ、この最初の2つの事例だけでも、明らかな利点と欠点があらわれています。

まず、いくつかの利点から。リデザインは、同じデータを利用するため、知的に誠実です(そうあるべきです)。またリデザインは、ダイレクトな視覚的比較を可能にします。ビジュアライゼーションをことばで説明すると、かならず何かがこぼれ落ちます。ダイレクトでありのままの比較を可能にすることが、リデザインが民主的なやり方で説得するという別の重要な利点をもたらしてくれます。権威(「俺が言ってるんだから、このデザインはまずい。」)に言葉で訴えるのではなく、隣り合わせに比較することで、見る人に判断をゆだねられます。

同時に、リデザインが問題になることもあります。タフテは、スペース・シャトルの判断に使われた図の制作者よりも相当優位に立っていました。彼は、当事者が考えていた問題の答えがわかっていて、どの可変項目が問題なのかをまさに知っていたのです。彼のリデザインは、一目でわかる明白な事例をつくりました。しばらく眺めていると、視覚効果の大部分が、左上角にあるきわめて異常なたった1つのデータポイントに注がれていることに気がつきます。これを取りのぞけば、ずいぶん落ち着いた形になります。これだと頭の固い役人に打上げを中止することを説得できたでしょうか。

実際のところ、たった1つの異常値のデータポイントにそれほど重きを置くことが本当に良い考えでしょうか。チャレンジャー号の場合には、確かにその通りでした。ただ一般的には、常にそうとは限りません。こんな疑問を抱く人もいるでしょう。もし打上げが何事もなく成功していたら、タフテの能力をもっただれかが、同じデータから、異常値を無視する知恵について同様に説得力あふれるグラフィックを作れたのだろうかと。

タフテは、他にも手っ取り早い方法を使っています。彼の散布図は、ある特定のデータの側面を選び取っていました。それは事故の後に、決定的になることが判明したものです。散布図は、Oリング問題の位置やタイプといった可変項目を除外しています。彼の考えでは、その情報は分析とは関係が薄いことになっていますが、もちろん当時はその問題を知る方法がありませんでした。チャートにこのデータを追加したら、もっと入り乱れて不明瞭なものになったでしょう。じっさい批評家が問題を解決しようとして単純化することは、よくありがちなことです。カイロによるルーピのタイムラインのリデザインは、軽快で洗練されていますが、同じスペースにデータの50%しか表せていません。ここで示した事例では、単純化によって批評家の要点が大きく揺るがされてはいませんが、若干の疑いの目を持たれています。

しかし、おそらくリデザインにまつわる最大の問題は、コンテクストを取り去ってしまうことにあります。デザインは、妥協の産物です。ロゴをデザインしたり、映画を制作したり、家を建てたりしたことのある人ならだれでも知っていることですが、最終的な成果物には多くは隠れてしまった目標や制約の数々が反映されています。依頼主がどうしてもピンクにしてほしいんだって! 主演の役者が足首を痛めちゃったぞ! 都市計画局の頭がおかしいんだよ!──こうした制約を知らずにリデザインするのは、ある意味で、不公平です。

ビジュアライゼーションの場合、コンテクストは戦略と目標の差違から戦術的な制約まで多様です。タフテによれば、チャレンジャー号のエンジニアは飛行のリスクをよく知っていて、打上げに待ったをかけていました。しかし、タイミングまわりの政治的圧力が、違う判断を生んだのです。彼は、正しい散布図やデータ表が別の判断をもたらしたかもしれないと結論づけました。にもかかわらず、この世界で最もよくできたデザインが決定を覆せたとは限りません。カイロのリデザインの場合、可読性と審美性、新規性のどこに重きを置くかで、違うものになったでしょう。

1つの単純なリデザインなどというものが存在しないことは、この際はっきりしておくべきでしょう。

公開の場でのリデザイン

2004年、米国の有権者は、2人の大統領候補、共和党のジョージ・ブッシュ大統領か民主党のジョン・ケリーの支持に見事に分かれました。選挙運動を通して、選挙マップは、居住者が共和党(赤)か民主党(青)のどちらに主に投票したかをあらわす「赤い」州と「青い」州として、この分裂を記録しました。この赤青マップの大きな欠陥は、共和党がじっさいよりも大きな支持者をもっている印象を与えてしまうことでした。地理的に広大なアメリカ合衆国の中南部の州の多くが、共和党候補を主に支持していたため、色分けマップは真っ赤な海になったのです。まるでこの国全体が共和党候補に投票したように見えてしまいます。要するに、このマップは米国の人口分布を考慮できていなかったのです。このマップは、赤い州の人口が青い州(多くの民主党支持者は大都市に居住している傾向があります)の人口よりも、平均的にずっと少なく密度も薄いことをとらえられていません。


2004年アメリカ大統領選の赤青マップ(出典:Wikipedia [4])

この視覚的難問は、米国の選挙データをより実態通りに表示するための探究に人々を駆り立てました。なかでもデータサイエンティスト、ジャーナリスト、ビジュアライゼーションの専門家は、この問題にさまざまな角度から取り組んだ数々のマップを作りました。郡ベースのマップは、州を小さな単位に分割することで、共和党の州のなかで民主党投票者の地域を見えるようにしました。「紫煙(パープル・ヘイズ)」マップは、赤と青を混ぜ合わせて、各地の共和党と民主党の得票率をあらわしています。カルトグラムは、データビジュアライゼーションの世界の変わった手法で、各地の人口によって郡や州を拡大縮小し、地理的なエリアをゆがませています。

このデータ解析とマップ制作のプロセスは、公開の場で起こり、数週間おきに新たな「赤青」マップがあらわれました。唯一の正解といえるものはありません。それぞれのマップは、一連のトレードオフとバイアスをあらわしています。とはいえ全体としては、これらのマップは意見交換を作りあげました。公開の場で、国家のアイデンティティや方向性について意見交換する強力で健全な新たな方法です。おそらく同様に重要なこととして、こうした活動が、公正で協働的な態度で発展していったのです。互いのマップを露骨にリデザインしようとせずに、実務家はお互いの作品をベースにして作り、データのよりよい視覚的記号化にとりくみました。データをよりよく視覚化して理解したいという思いが進めた協働的な活動だったのです。

残念ながら、公開の場でのデータビジュアライゼーションの再制作が、このように一様にポジティブな反応につながるとは必ずしもいえません。リデザインが大きな反発にあった出来事がありました。たとえば2015年2月のアルベルト・カイロによる別のリデザインです。ジョージア・ルーピの作品への批評と同様に、カイロは円周状の図(アラブの春のタイムライン、アレクサンダー・ケイティン(Alexander Katin)とカー・ハチャトゥーロフ(Kir Khachaturov)作)をとりあげ、「巻きをほぐして」、直線上に配置しました。

カイロがこのリデザインをブログに書いたところ、すばやく猛烈な反応が返ってきました。その多くは、2つの対立軸に沿ってふりかかってきました。一方は、オリジナルのグラフの美しさが重要なのだと異議を唱え、他方は、リデザインされた解決案によってデータの読みやすさが劇的に改善していると頑なに主張したのです。

「@albertocairo この円は1年のサイクルを見せるためのものなんですよね?」
 
「この円形レイアウトでできたゆがみのせいで、イエメンを描いた期間がもっと短かった場合でも、〔外側の〕イエメンよりも〔内側の〕チュニジアのタイムラインが短く見えてしまいます。」
 
「2015年のすばらしい円形タイムラインの議論で、私は @albertocairo よりも @blprnt の側につきます。」
 
「明快さが目的なら、直線版に賛同します。円を読むには、スケールに沿って動きながら、無数の視線移動が必要になるからです。」
 
Twitterから抽出した引用。このやりとりに加えて、全部大文字で罵りあうような過激なツイートも交わされました。

何千人、もしかすると世界中の何百万人もの人びとに広がる可能性をもった公開の場でのリデザインは、新しい現象であり、ソーシャルメディア時代の産物のひとつです。この影響範囲と即時性には、プラスとマイナスの両面がありえます。プラスの面では、簡単に費用をかけずに、リデザインをデータビジュアライゼーションのコミュニティの人たちに幅ひろく見てもらい議論してもらうことができます。一方、ソーシャルメディアにさらされると、こうしたリデザインに、多くのユーザーが1つのコンテクストになって流れ込んでしまいます。これは、これまでのデザインスタジオによる相互評価からの厳しい船出です。これまでの相互評価は、コンテクストや作品の意図を共有している同業者によるもので、批評の対象となるデザインをした人物を知っていて、目の前に存在していたのです。オンラインで公開の場のリデザインは、顔が見えず個人を感じられなくなり、すぐに憎しみや敵意を招いてしまうおそれがあります。

カイロの事例では、もともとのコンテクストは教育のためでした。学生が円周状のグラフについて質問をしたので、カイロは直線と円周の解決策の効果を比較する解説として役立つことを期待していました。しかしTwitterに流れるやいなや、そこでの会話は、美学、テーマについてのカイロの権威性、示されたデータの重要性(またはその欠如)、デザインの役割などの質問が入り、違った傾向をみせました。一方において、話題を広げていくことは、批評のなかで目指すところです。他方、時にこうした意見交換をともなった対立は、その過程を全部脇に置く方がよいでしょう。それにしても、この影響範囲とコンテクストのトレードオフは、どうバランスをとればよいでしょうか。そして、リデザインにまつわる議論の多くを生産的にするには、どう最適化すればよいでしょうか。

2つの文化をつなぐリデザイン

ビジュアライゼーションの分野は、2つのまったく異なる知的潮流が交差するところに位置しています。ビジュアライゼーションの起源の1つは、アートとグラフィックデザインです。もう一方は、コンピュータグラフィックと科学実験の分野に由来しています。一歩引いて、それぞれの分野にある慣習や規範を説明し、各分野がビジュアライゼーション批評でどのように対立するのかを描くのは意味があります。

文学や芸術の分野を知的に前進させる重要な方法は批評です。話し言葉で「批評」というと否定しているようですが、もちろん芸術や人文学にはもっと豊かな伝統があります。バーゼルによれば、「一般的に批評とは、特定の領域に精通した判断を下す専門家のことを指す。身近な例として、映画評論家や文学評論家、建築批評、それに認定ワイン鑑定士のワイン鑑定能力も含まれる」[3]。この定義を強調する理由の1つは、ささいな誤解を避けるためです。「ビジュアライゼーション批評」を推奨することが、一般に思われている否定的な意味を呼びだしてはいないのです。

デザインのコミュニティでは、デザイン批評といえる特徴的な批評があります。抽象的だったり哲学的だったりする文芸批評とはちがい、定番の「批評」は通常、制作中の作品を改善することを目標としています。批評のプロセスの重要な部分は、人間関係のコンテクストであり、真剣でハイレベルな会話をする同業者同士であるという事実です。批評が公開の場でおこなわれることはほとんどありません。批評は一般的に、スタジオや学校でおこなわれ、専門技術をもったプロや学生からなり、デザインの文脈についての知識を共有していて、慎重な判断が下されます。

科学の世界には、別の光景がひろがっています。科学では、仮説を検証するプロセスから人間の判断を排除しようとします(人間の判断はたしかに資金調達や出版のプロセスでは生きのびていますが、それは別の話です)。仮説は反証可能でない限り、科学的な検討すらされません。つまり、仮説が誤りであることを示す機械的な手順があるのです。その結果、新しい治療のための判断基準は、医師の委員会の意見ではなく二重盲検法であり、理想的には複数グループで繰り返し成功した実験になります。

データビジュアライゼーションの科学的な前身の1つであるコンピュータグラフィックの場合、事実上の標準になった一連のサンプル画像があります。たとえば、3Dレンダリングの研究者は、まず特定のティーポットのモデルを使います。画像圧縮と改良に取り組む学者は、何十年も(有名な)プレイボーイの写真「レナ」を使っています。その目的は、よく知られているコンテクストに新しい技術やアイデアを適用することで、だれでも以前の業績と直接的に比べることができるからです。

こうした慣習を比較することで、リデザインによる批評における混乱のもとをいくつか説明できます。おもに非公開の場でおこなわれてきた批評の習慣から見ると、公開の場でのリデザインは、過度に個人的で、さらされすぎていると感じられます。公開の場で起きた批評は、リンクをクリックした人はだれでも見ることができ、注意深い解説に必要なコンテクストの多くを失ってしまうからです。一方、実験に基づく科学者の観点からは、リデザインを評価するのに、人間──それもきわめて主観的な──専門的な判断が不可欠というのが、不正行為のように見えてしまうかもしれません。ここまで、それぞれの分野の実務家があらわした反応の根拠になるものをみてきました。

こうした問題はありますが、「リデザインによる批評」という方法は、この分野を成長させるまさに混合物かもしれません。知覚心理学と関連の学問が、ビジュアライゼーションになんらかの助言を提供することができるのは確かですが、あらゆる現実のデザイン問題に完璧に答えられるほど高度ではありません。結局のところ、批評のプロセスに人間の判断は必要とされています。そこには、コンテクストと仲間関係が失われて、公開の場での批評に問題を引き起こしてしまう一方、批評のプロセスのすばらしい点を引きだし、最悪の落とし穴をさけることができる「批評のルール」があると信じています。

批評のルール

デザインは、科学ではありません。ただし「科学ではない」ことが「まったく主観的である」こととイコールではありません。じっさい、批評のプロセスは何世紀にもわたってデザインに規律をもたらしました。共有されたデータセットに基づくビジュアライゼーションでは、同じデータにもとにしたリデザインを通じた批評の価値を示すことで、正確さのレベルを上げるチャンスがあります。

リデザインを通した批評は、ビジュアライゼーションの分野を前進させるための最も強力なツールの1つかもしれません。同時に、この批評は簡単ではありませんし、落とし穴がたくさんあり、知的で、実践的で、ソーシャルです。この批評のツールを、すべての関係者を意識して敬意を持ちつつ、どのように効果的に利用できるでしょうか。ここでいくつかの提案があります。正確さを保つ、デザイナーをリスペクトする、批評家をリスペクトする、の3つのカテゴリーに分類しました。

1.正確さを保つ

科学実験と同じく、リデザインも何のためにおこなうのか──ある意味、何を「測定」しているのか──を知ることが大切です。ビジュアライゼーションには、データを伝える、会話を刺激する、説得する、見る者を引き込む、美的経験をつくりだすなど、いろいろな到達点がありえます。リデザインをつくる批評家は、その目標を、そしてデザイナーとは別の目標に興味を持っている場合があるという事実を明らかにすべきです。このことが、コンテクストを知らずに結果に出くわす人たちがいるウェブでは特に重要です。

次に、批評家はどんな仮定の単純化にも誠実でなければなりません。リデザインがオリジナルよりも少ないデータしか示していない場合、はじめにそのことを言及すべきです。そうしないと、シンプルなリデザインが、単なるデータ切り捨ての結果だと解釈されるおそれがあります。

正確さを保つことの中には、プロの判断が一致せず、合意にいたる道を発見していく状況を認めることも入っています。ときに人々は、隣り合わせにした比較を見て、まったく異なる結論に達します(たとえば、アルベルト・カイロがリデザインした円周状のタイムラインのように)。意見の相違のもとについて会話を交わすことが第一歩です。プロによってビジュアライゼーションの成功基準が違っていたり、異なる目標を思い描いていることはよくあることです。そうしたことをはっきりさせることが、この分野にとってとても役に立ちます。しかし、明快さや読みやすさについて、単純に各人が違う直観をもつ場合もあります。このような場合、科学的な実験に向かう意味があるかもしれません。これは批評の失敗ではなく、むしろ成功としてとらえるべきです。簡潔明瞭で検証可能な科学的な論点は、めったにない有用なものですから。

2.デザイナーをリスペクトする

全てのリデザインは、敵対的に見られてしまうおそれがあります。事故の責任の所在を明らかにしたタフテのリデザインのように、まるで批評家がデザイナーの欠点を指摘し、自分の技術が優れているか同等だと主張しているように見られるのです。口コミでリンクしていく現在、この影響は倍増します。自分の作品についての否定的なコメントが、リブログされ、リツイートされ、リポストされるのを見るのは気分のよいものではありません。

批評のプロセスでデザイナーに配慮することは、多くの理由で良いことです。もちろん、そこには親切心があります。それに加えて、会話の可能性を開いてくれます。作品のオリジナルのデザイナーは、ほかのだれよりもその作品特有の問題について考えつくしているものです。あらゆる段階で、デザイナーを会話に招き入れることをおすすめします。一般公開の批評に先立ち、デザイナーと話し、応答する機会を与えて、いつでもデザイナーを立派なプロとして扱うのです。

批評家は、いろいろな方法で、デザイナーにふりかかるリデザインの感情的な影響をやわらげることができます。

第一に、いくつかのビジュアライゼーションを批評することで主張を展開できるのなら、もっともレベルの高い組織が手がけたものを選んでください。公開の場で欠点を指摘するなら、1年生相手ではなくニューヨーク・タイムズに対しておこないましょう。著名なデザイナーほど打たれ強いとは限りませんが、批評を引き受けるべきです。第二に、批評の文脈で意味をなすのなら、デザインの良い面、つまりリデザインする必要のない特徴について言及してください。色やタイポグラフィがすばらしくて変える必要がなかったら、そのことをしっかり伝えるのは良い考えでしょう。

第三に、教育的に指摘するには、すばらしいビジュアライゼーションを悪く変えてしまう「後戻り」のリデザインを検討してください。言いかえれば、指摘したいこと(たとえば、良いラベルづけやカラーパレット)を例証するのに、あるビジュアライゼーションをとりあげて、重要な要素を取りのぞく(大部分のラベルを消したり、ハレーションをおこす色に変える)のです。この方法は従来のリデザインと同じ効果を与えることができるでしょう。オリジナルのデザイナーの気分を害さず、気持ちよくいてもらうことができます。それに、「批評」のもつ既存の作品を否定的に見るという考えを断ち切る良い方法でもあります。

3.批評家をリスペクトする

批評は難しい、デザイン同様に難しい行為です。確立したメディア(本、映画、音楽)では、すぐれた批評家は独立した専門家として認められているほどです。一分野として、ビジュアライゼーションの批評家にも同様の敬意を払うべきです。批評家はアクティブな実務家ではないというデザイナーの不満の声をときおり耳にします。確かにそうかもしれませんが、大した問題ではありません。

結論として、リデザインがあらっぽいことを理由に、無視してはいけません。リデザインが有効になるために、完全に洗練させる必要はないのです。すこしラフなリデザインが、うまく働くことさえあります。つまりリデザインは、批評家とデザイナーの競い合いではなく、デザインに関するアイデアの要点のチェックなのです。

最後に、デザイナーのみなさんは、批評のプロセスの目標を心にとめておいてください。それは最終的には、個人の評価ではなく、この分野全体を改善していくやり方だということを。

おわりに

データビジュアライゼーションは、いまだ新しい分野です。ジャーナリストやサイエンティスト、データを理解したい人たちにとっては、すでに欠かせないメディアになっています。とはいえこのメディアは、まだまだ理解されているとはいえません。始まったばかりのもので、改良の余地がたくさん残されています。

さらなる批評が必要とされていて、リデザインはビジュアライゼーション批評に主要な要素です。しかしそのあまりに多くがウェブで起きていて、つまり公開の場で、すぐに関係するだれからでも見られ、コンテクストや前準備のない世界に開かれているため、困難なプロセスになることがあります。ここでは、批評はどうすれば最も生産的にでき、関係者にストレスをほとんど生まないようにするのかについて話し合いはじめることを目標としていました。

将来のことを考えながら締めくくります。これまで議論したリデザインと批評は、技法にかなり集中していました。これは成長期にある新しいメディアにとっては適切です。しかし映画批評や書評と比べると、普通とはいえません。典型的な書評について思い浮かべてみると、評文にはおそらく文体や人物の姿形について書かれています。しかし通常は、すくなくとも同じくらい、たいていはずっと多くのスペースが、登場人物や筋書き、ムードなど内容についての議論で占められています。ビジュアライゼーションが1つのメディアとして成熟したあかつきには、今日の技法に関する批評のように、内容についての批評が数多くあわられるでしょう。

謝辞

自分たちの指針にしたがって、たくさんの会話をもとにこのエッセイを書きました。きっかけは、アルベルト・カイロのオンライン批評と、その後につづいたTwitter、ブログ、メールでの議論でした。とくに、モリッツ・ステフェナー(Moritz Stefaner)、ヤン・ウィレン・トゥルプ(Jan Willen Tulp)、そのほか有益な議論をかわして情報を示していただいたみなさんに感謝します。


[1] Visual Explanations: Images and Quantities, Evidence and Narrative.
[2] http://www.thefunctionalart.com/2014/11/redesigning-visualizations.html
[3] J. Bardzell / Interacting with Computers 23 (2011) 604–621
[4] http://en.wikipedia.org/wiki/File:2004_US_elections_map_electoral_votes.png
http://commons.wikimedia.org/wiki/File:Gastner_map_purple_byarea_bycounty.png
http://commons.wikimedia.org/wiki/File:Countycartlinear1280x1024.png

Visual Explanations: Images and Quantities, Evidence and Narrative
Edward R. Tufte
Graphics Pr
売り上げランキング: 42,391

2015年のインフォメーションビジュアライゼーション

この記事は、ロバート・コサラ「The State of Information Visualization, 2015」の原著者許諾済みの日本語訳です。


header

The State of Information Visualization, 2015
Original Article published by Robert Kosara.
Translated by Tatsuo Sugimoto.

どうやら2014年は、ビジュアライゼーションにおいて特筆すべき年ではなかったというのが既定路線のようです。先週、ポッドキャストData Stories2014年をふり返るエピソードを収録しましたが、みんな落ち込み気味に話しはじめました。とはいえたくさんの出来事がおきて、2015年にはさらなる展開をみせようとしています。

2014年が退屈な年だったとしたら、どうしてアンディ・カークが2014年前半をまとめて、なお2014年後半にも多くのよい事例を投稿できたのでしょうか。それに、ナーサン・ヨウの年間ベストデータビジュアライゼーションのリストについてはどうでしょう。そうです、いろいろとあったのです。もちろん新たなことも。

InfoVis学会

InfoVis 2014のクオリティには、いまでも敬服しています。このイベントはすばらしい研究内容にとどまらず、興味深い新発見を提示し、上手に紹介し、データやコードを利用できるようにした、全部をひっくるめたものでした。今までこれほど一貫性をもった質の高いイベントはありませんでした。

研究の多くの方向性も多様でした。新技術の研究はほとんどなかったものの、その多くはすばらしかったです。しばらくの間、多くの新技術は現実の問題を解決できていませんでしたが、進展しているようです。現在では、より多くの理論的傾向の研究(AlgebraicVisなど)や、将来有望な基礎的な研究(ヴェーバーの法則など)、長年の仮説を探究する研究(棒グラフの知覚、エラーバー、アニメーション演出など)などがあります。

何度も引用されている先行研究をしっかりと検証し、批評し、改良を加えていくことは、InfoVisにおいて有効かつ一般的な研究方法であるべきです。科学を進歩させるには、信念や概念を疑いつづけるしかありません。こうした研究が出てきたことはすばらしく、この傾向が続くことを願っています。

ストーリーテリング

昨年の頭、私はストーリーテリングの話をしましたが、2014年はまさにストーリーテリングにとって大きな1年でした。Tableau 8.2の「ストーリーポイント」機能だけでなく、データから興味深いストーリーをつむいでいく興味深い新しいアプローチが数多くあらわれました。

Bloomberg ViewData Viewシリーズ(残念なことにすべてを一覧で見る方法がないようです)のような、新たなフォーマットも生まれています。まだ一般的な「スクローリーテリング」〔訳注:スクロールをつかったストーリーテリング〕フォーマットは登場してないようですが、とても迷惑で気まぐれな事例もありました。私は、スクロールはクリックよりも簡単だとするマイク・ボストックの主張にはまったく賛同しませんが、彼がこの手のものを作る人たちに役立つ助言をしていることは確かです。

モリッツ・ステフェナーと私自身の間で、ストーリーをめぐるちょっとした議論もありました。モリッツが口火を切って私がそれに答えてストーリーの定義を加えました。最終的に、全体を整理したデータストーリーについてのData Storiesのエピソードになりました。

来たるべき年に、多くのストーリーテリングが登場することは間違いありません。ツールはよくなっていて、人々は実験をはじめてうまく働く面を学んでいます。ストーリーテリングについての学術的研究がもっと進むことも願っています。

学会以外のカンファレンス

InfoVisのようなカンファレンスといえば、どれも同じように、新しくないかもしれませんが継続的に開催されています。 TapestryOpenVisVisualizedeyeoなど、どのカンファレンスも異業種の人たちをつないでいます。人びとが語り合うカンファレンスはいいものです。

こうしたカンファレンスがうまくいっているのは(eyeoにはなかなか参加できないほど)、本当にすばらしいことです。そこには知的好奇心があります。意外な人たちも参加しているので、参加者の話も興味深いです。とくにジャーナリストは、これまでジャーナリズムのカンファレンス以外で話すことはありませんでした。みな面白い話題を持ち寄っていて、その話を聞きたがっています。

データジャーナリズムの夜明け

FiveThirtyEightVoxThe UpShot。これらのサイトは、どれも昨年スタート(または再スタート)しました。全部うまくいった? ノー。ネイト・シルバーのニュースをオタク化する誓いはよいスタートを切りましたが、まだ道のりは長いです。Voxは間違いをおかしすぎましたし、率直にいって、スピードを落とし「公開優先でチェックは後回し」のアプローチを考え直す必要があります。数字に関するストーリーはなんでもすぐにデータジャーナリズムだと見なすカーゴ・カルト的なところもあります。

誤りや技術的なトラブルが多少あったにせよ、ジャーナリズムのなかにデータがあることは間違いなく、これからもっと視覚化されていくでしょう。

そのほか2015年に起こること

このほかに、コミュニケーションとデータを説明するためのビジュアライゼーションが、ジャーナリズム以外でも引き続き利用されることは明らかだとおもいます。分析がなくなることはもちろんありませんが、その結果の多くは一覧表などではなくビジュアルになるでしょう。ビジュアライゼーションの価値は、画面に向かっている一人の人間に限られるものではありません。

こうしたビジュアライゼーションは、アカデミック側でも取り上げられる存在です。この方向に向かって、特定のアイデアに着目して(分析中心だった)従来よりも実用的な多くの研究が発表されるとおもいます。

最後に、私はビジュアライゼーションの良書を待ち望んでいます。昨年、タマラ・マンツナーの本が発売されましたが、まだ読み終えていないので、かなり期待しているとしか言えません。コール・ナスバウマーアンディ・カークアルベルト・カイロなど、執筆中の人たちもいます(後の2人の本は2016年に出版される予定ですが)。

2014年はインフォメーションビジュアライゼーションにとって悪くない年だったと思います。そして2015年以降はもっとよくなるでしょう。

執筆:ロバート・コサラ

photo

ロバート・コサラは、タブローソフトウェアのリサーチサイエンティストで、コンピュータサイエンスの元准教授。研究テーマは、ビジュアライゼーションを使ったデータのコミュニケーション。ブログ書きのほかに、ランニングツイートもしています。

Visualization Analysis and Design (AK Peters Visualization Series)
Tamara Munzner
A K Peters/CRC Press
売り上げランキング: 381

データビジュアライゼーションをはじめるためのフリーのツール・情報源20選

お知らせ (2015年9月30日)
日経ビッグデータ発行の『データプレゼンテーションの教科書』(2014年12月発売)の記事「データビジュアライゼーションのためのフリーツール厳選20」(P.102~105)において、本記事の翻訳文が盗用され、改変の過程で誤訳が生じていました。詳しくは下記リンクをご参照ください。
 『データプレゼンテーションの教科書』(日経BPムック)についてお詫びと訂正(日経BP社サイト)

この記事はThe top 20 data visualisation toolsの原著者許諾済みの日本語訳です。

Brian Sudaが、データをクリーンアップし、すてきなビジュアライゼーションを作成する20のツールと学習情報を紹介します。

Original Article by Brian Suda.
Translated by Tatsuo Sugimoto.

この記事では、フリーで入手しやすいチップスとツールに焦点をあてています。この分野では多くのすばらしい有料のツールが知られていて、私もそれらのツールを利用しています。しかしこの分野の入門者が、何をはじめるのかよくわからないまま、高価なソフトウェアを購入するのは現実的ではありません。ここでは、Webや印刷物向けに美しいデータビジュアライゼーションを作成するのに役立つツールと情報源をくわしく紹介していきます。

データセットを洗い出して組み合わせるデータジャーナリズムから、装飾的にデザインされたインフォグラフィック・スタイルのポスターまで、どのジャンルでもうまく成果を上げるにはツールとオーディエンスの理解が不可欠です。この記事では、新しい情報に目を向け、さらにスキルを磨くための適切な指針を示します。

もくじ

クリーンアップ

データセットを扱っている人はみな口を揃えて、データセットを使えるフォーマットにするためのクリーニング作業に多大の時間を費やしていると言うでしょう! 典型的なクリーンアップ作業は、乱雑なエクセルファイルの数値を再整形したり、略語を広げたり縮めたりして、きちんと整理された列群へと変換するといったことです。たとえば、「UK」、「U.K.」、「United Kingdom」は、どれも同じ値を異なるやり方で表記したものです。そこでデータを「クリーニング」することで、これから紹介するツールを利用したワークフローで一貫性をもって使える情報にするのです。

この大変な作業を軽減するツール群がこれまでに多く作られています。もしこの分野へ進んでいくのなら、データをクリーンアップするのに役立つツールを知っておくことが、あなたの平静を保てる唯一の方法です。PDFからデーターベースにコピーペーストするのに時間を費やすことほど最悪なことはありませんからね。これから紹介するいくつかのツールは、あなたの仕事を大変にすることなくスマートにしてくれます。

Data Wrangler

Data Wranglerは、乱雑なデータセットを貼り付けると、データをクリーンにするための数ステップを経て動作し、お気に入りのツールで動かすのにより適切なフォーマットでダウンロードできるWebベースのツールです。開発したスタンフォード大学のデータビジュアライゼーションチームは、データ抽出の新技術においてたいへん優秀なチームです。

[訳注]
現在Data Wranglerは、研究プロジェクト期間を完了し積極的なサポートが打ち切られています。開発チームメンバーは、Trifactaというベンチャー企業に移籍しています。また、スタンフォード大学のデータビジュアライゼーションチームは、ワシントン大学のインタラクティブデータラボへ移動しました。

Data Wrangler

Open Refine

Open Refineは、Google Refineのリブランドです。Data Wranglerと同じく、Open Refineもデータを使えるフォーマットにクリーニングしますが、Open RefineはオンラインではなくローカルのPCで動作するという違いがあります。データの機密を保持したい場合、Open Refineを使えば解決できます。

この2つのツールは、扱いにくいデータをクリーンアップするだけでなく、不正なデータポイントを検出して知らせてくれます。コンマやピリオド、数値から3桁分のゼロを追加したり削除したりする単位記号の欠落などです。たとえば、100,000 と 100K は同じ値ですが表記が異なります。こうした異常値には、より詳しく調査できるようにフラグがつけられます。

また、これらのツールは、NASA と N.A.S.A. のようによく知られた略語を統一しようとします。こうした機能は、結果を分析するさいに時間を大幅に節約してくれます。

Open Refine

Tabula

Tabulaは、扱いにくいPDFファイルからCSVデータを抽出してくれる新しいプロジェクトです。Tabulaは、データを抽出したいエリアを選択するだけで、抽出した結果をプレビューできCSVファイルとして返すシンプルなインタフェースをもっています。とても簡単です! リンク先に、できることを示したすばらしいデモがありますが、自分の書類を処理するには自前のサーバが必要になります。

[訳注]
Tabulaは、公式サイトからWindows/Mac/Linux版をダウンロードできます。

政府機関はますますデータを公開するよう迫られていて、しぶしぶPDFファイルで公開しています。PDFファイルはマシンにとってアクセスしやすい書類ではないため、PDFファイルからデータを抽出する多くのよくできたツールが同時に発展しています。ここには、データクリーニング技術の専門家になる巨大なチャンスがあります。この技術は、数年前には存在さえしていなかった数多くの領域のひとつであり、現在とても求められているスキルなのです。

Tabula

D3

前回の記事では、チャート作成ツールとしてD3を紹介しました。D3は、シンプルなチャートやグラフをつくるにはやや複雑なところがありますが、より簡単につくることができるD3用の追加ライブラリをいくつか紹介します。

NVD3

NVD3は、再利用のためのライブラリです。このプロジェクトは、D3のもっているパワーを利用して、一般的なチャートタイプを出力します。NVD3は、異なるデザインがはびこることを防いで制約をあたえると同時に、データビジュアライゼーションを始めたばかりの人にとって、はるかに簡単で親しみやすいコードを作成するため、私はこのアイデアをとても気に入っています。

NVD3

D3 Maps

地図製作に取り組むには、D3用の美しい地図生成ツールD3 Mapsがあります。たとえば、みなさんが「ヴィーフェル図法」の地図を作成しなければならなくなるかどうかはわかりませんが、もしそんな機会があるとすれば、このツールが最適です! D3 Mapsを使えば、非標準的な地図ライブラリ利用にメリットのあるプロジェクトで、とても簡単に地図を作成することができます。

D3 Maps

ツール

ここでは、よりオープンで柔軟な一般的なチャート作成ツールを紹介します。どれも、みなさんのワークフローやデザインで使えるツールであるとともに、生データに価値を提供しインスピレーションの源泉にもなるでしょう。

Wolfram Alpha

Wolfram Alphaは、サーチエンジンではなく知識エンジンです。Wolfram Alphaはあらゆるデータをプロットできます。「次の満月は」といった質問を訊ねると、基本的なビジュアライゼーションを返してきます。自分のFacbookアカウントについて訊ねると、Wolfram Alphaは数多くの興味深いチャートやグラフ、あなたのつながりや関心についてのデータを返します。Wolfram Alphaは汎用ツールではありませんが、大量のデータセットを扱って様々な方法で表現するすばらしい事例です。Wolfram Alphaブログに詳しい紹介があります。

Wolfram Alpha

Chart.js

Chart.jsは、デザイナーや開発者向けの美しいオープンソースのチャートライブラリです。数行のJavaScriptコードでcanvas要素内にチャートを描くことができます。ただしIEはcanvas要素をまるで扱えないので、IE8以下ではちょっとした対応を要するでしょう。Chart.jsは、基本的なチャートのタイプをほとんどカバーしていて、動作にはわずか20KBしかページ容量を増やしません。

現在のチャートやグラフの代わりになるものを探しているなら、これが答えになるかもしれません。

Chart.js

Processing.js

Processingのことを聞いたことがあるなら、それが一風変わった偉大なアニメーションとインタラクティブなパワーを持っていることをきっとご存じですよね! ProcessingがWeb用にJavaアプレットを出力することもご存じでしょう。いまでは、そのProcessingのすばらしさをJavaScriptでも使えます。

Processingは、驚くべきインタラクティブなデータビジュアライゼーションへの扉を開いてくれます。圧縮バージョンの容量は200KB以上ありますが、完全に機能するアニメーションツールと物理エンジンを提供しているのですから、まったく問題ありません!

Processing.js

Paper.js

長い間、Adobeのクリエイティブ・ソフトウェアをスクリプト制御する最良のやり方は、Scriptographerでした。現在それは、Paper.jsとしてWebに移行しました。Processing.js が数年の歴史を持っているのに対して Paper.js は新入りです。それでもこのライブラリには注目する価値があります。新しいといっても、このライブラリの起源は折り紙つきなのですから。作例をながめているだけで、きっとこのライブラリを活用したプロジェクトをいくつか着想できるはずです。

Paper.js

JpGraph

Google Static Charts の停止が迫ったとき、静的グラフ生成の需要を満たすものが存在しませんでした。手の込んだインタラクティブなチャートはすばらしいのですが、ベクター形式のSVGグラフだと、そのチャートをプレゼンソフトにコピーペーストすることがほぼ不可能です。ただ幸運なことにcanvas要素は、画像として書き出せてスクリーンキャプチャもできます。しかし静的画像が適している場合は、画像で始めませんか。JpGraphは、Google Static Charts の代わりとなるすばらしいツールです。PHPで書かれたサーバに設置するプログラムで、自由なライセンスをもつ JpGraph は、データビジュアライゼーション作成のツールボックスに加えておくとよいでしょう。

JpGraph

Circos

環状のダイヤグラムがお好み? ゲノム情報を扱っている? もしそうなら Circos がぴったりです! バイオデータのビジュアライゼーションという特殊な領域をこえて成熟した Circos は、いまでは大量のデータをコンパクトで円形のビジュアライゼーションへとしっかり詰めこむツールになりました。二つ以上の要素間のつながりを見せる、このような環状のビジュアライゼーションは、さっと眺めてパターンを見るには最適な手法です。

Circos

マッピング

前回の記事では、ビジュアライゼーションツールとして地図を使用するいろいろなツールを紹介しました。それらの多くは位置情報としての地図に焦点をあてていましたが、データの表現に使える地図の手法は他にもあります。これから紹介するツールは地図を使用しているものの、地図中の位置を直接あつかっているものではありません。

Open Heat Map

ヒートマップは、あるエリアである出来事がどの程度の頻度で発生しているのかを見せる地図を見事に描いてくれます。これは、気温や価格、事件の密度などの指標にも使えます。こうしたヒートマップを見せるには、十分な数学的知識と、既存の地図に独自の格子状のマップをレンダリングして追加する能力が必要です。Open Heat Map は、スプレッドシート書類を数学的に処理し、ヒートマップの格子をレンダリングするため、こうした課題をすべて取り除いてくれます。これは、最小の努力で、あなたのデータビジュアライゼーションのスキルを披露する格好の方法です。

Open Heat Map

Color Brewer

地図を使ったデータビジュアライゼーションを作成すると、最終的に配色選びの穴にはまってしまいます。最適なカラーパレットを選ぶことが難しいのには、いくつかの理由があります。みなさんは、閲覧者がどのようにデータを受容するのかをつねに想定しておく必要があります。しかし、印刷でも、白黒のデバイスでも、液晶スクリーンでも機能し、弱視や色覚異常の人でもわかる、あるいは誰もが違いを見分けられる十分なコントラストをもつ配色を正しく選ぶのは至難のわざです! Color Brewer では、あなたのプロジェクト特有のパラメータをいくつか選択することで、あらかじめ用意された基準をみたしているカラーパレットを提示してくれます。

Color Brewer

タイムライン

イベントデータをビジュアライズする最適な手法は、タイムライン上に表示することです。タイムラインを使うと、どのイベントが、いつ、どんな長さで発生したのかを特定しやすくなります。スケジュール管理から調査報道まで、イベントの記録をタイムライン上でビジュアルに見られると役立ちます。ここでは、手軽にスクロールやズームができるタイムラインを作成するツールをいくつか紹介します。

Timeline

Timeline は、MIT SIMILE プロジェクトの成果です。しばらく前から存在していて、たいへん堅牢です。JSON と XML の入力に対応していて、あらゆるタイムフォーマットから全てのイベントを書き出します。Timeline は、恐竜の歴史からスケジュール帳まで、あらゆる尺度を作成して実行できる簡単なビジュアライゼーションです。それぞれ連動していて個別にスワイプしてスクロールできる、おもしろい3段積み上げのタイムラインを作成でき、完全にカスタマイズ可能です。

Timeline

Here is Today

タイムラインは、時間上の多種多様な尺度や違いを見せるために使うこともできます。Here is Today は、つねに今日を起点とした相対的な時間をズームアウトしつづけるインタラクティブなタイムラインの好例です。シンプルに見えますが、データビジュアライゼーションデザインの良い側面をいくつか示しています。これは、閲覧者自身のペースで次に進めていけるインタラクティブなものですが、それぞれのステップでは相対的な情報だけを見せています。今日という日を、1ヶ月間のなかで位置づけ、次は1年間で、その次は1世紀間で、というように。閲覧者に全ての情報を一度に見せて圧倒させるのではなく、見る者にひとつの解釈だけを選びとらせようとしているのです。

Here is Today

Timeflow

Timeflow は、タイムベースのダイヤグラムをすばやく簡単に作ってくれます。ジャーナリストのために設計された Timeflow は、データを異なる方法でビジュアライズし隠された潮流をつかめるようにしてくれます。このプロジェクトはこの数年間更新されていませんが、試してみたい人に現在も提供されています。

Timeflow

もっと学習する

こうしたツールの先へ進むには、データビジュアライゼーションの世界の動向をつねに注目しておくことがポイントです。わたしが発見したそのための最良の方法は、未来と過去の両方を見ることです。デザインには、過去何百年ものあいだ幾度も洗練され選り抜かれてきた歴史があります。Webやさまざまなサイズの新しい機器といった新たなメディアを扱うときも、多くのデザインの基本原則はそのまま生き残ります。とはいえ、新しい研究や発見や、インターネットで失敗に終わっていることについても通じておく必要があります。ここでは、データビジュアライゼーションとデータを使ったデザインについて引き続き学習するためのすばらしい情報源をいくつか紹介します。

Data Stories

Data Stories は、インストールして毎日使うようなツールではありません。Data Stories は、この分野のすぐれた専門家が、彼らのワークフローやツール、プロジェクトについて議論するポッドキャストです。データビジュアライゼーションに本気で取り組んでいるなら、この業界の動向についていく必要があります。そのためには専門家から直接学ぶことにかなう方法はありません。

Data Stories

Data Journalism

スタンフォード大学は、データジャーナリズムの中核のひとつになりました。vis.stanfor.edu には、彼らが開発した Data Wrangler など多くのすばらしいツールがあります。さらにスタンフォード大学では、データジャーナリズムについての授業やビデオもあります。datajournalism.stanford.eduでは、オンラインでビデオを視聴でき、多くのツールや使用事例、ワークフローがどのように実世界の状況に実装されたのかを見ることができます。

[訳注]
スタンフォード大学のデータビジュアライゼーションチームは、ワシントン大学のインタラクティブデータラボへ移動しました。

Data Journalism

Teaching to See

インゲ・ドラックレイは、たいへん評価の高いデザイナーのひとりです。40年以上にわたって、彼女は今日の偉大なデザイナーたちにグラフィックデザインを教えてきました。最近、彼女は『Teaching to See』というショートフィルムを作りました。本気でデータを使ったデザインをやるのなら、座ってじっくり学んでおきましょう。

Teaching to See

習うより慣れろ

大規模データセットに入り込んでいけばいくほど、たんなるビジュアルな表示以上のものを理解しなければならなくなるでしょう。データをクリーンアップし、小さな部分へと刈り込むのに役立つツールを理解し、閲覧者が知るべきことを理解する必要があります。まずは、ここで紹介したデータのビジュアルな表現を作成するさまざまなツールを使いはじめることができます。それは、円や地図、そのほかのチャートやグラフになるでしょう。そのためには練習が必要になるので、ツールだけでなく学習の情報源についてもしっかりと紹介することにしたのです。データビジュアライゼーションに本気で取り組むなら、業界で何が起こっているのかを常に追いつづけて、カンファレンスのビデオをみて、関連するポッドキャストやインタビューを聴いて、すぐれた実践家によるデータビジュアライゼーションに関する読み物をすべて読みつづける必要があります。Eyeo Festivalのビデオは、この分野で活躍する人を視聴して学習をはじめるのに最高の場所です。

これらの多くのツールを自分自身のプロジェクトに実装するとともに、あなたの知識を共有することが重要です。データビジュアライゼーションは成長している分野なので、そのなかのどこかの部分では専門家になれるチャンスがあります。機会をみつけては、どのように結果を成し遂げて、失敗から学んだのかを他の人に解説するようにしましょう。


Brianは、ソフトウェア開発者。著書に『A Practical Guide to Designing with Data』(Five Simple Steps)。

Information is Beautiful Awards受賞作にみるデータビジュアライゼーションの秀作

ロンドンのライターでありデザイナーでもあるDavid McCandlessは、さまざまなデータビジュアライゼーションの作品集Information is Beautiful(リンク先はサイト)を出しています。

Information is Beautiful
Information is Beautiful

posted with amazlet at 13.09.02
Collins (2013-02-14)
The Visual Miscellaneum: A Colorful Guide to the World's Most Consequential Trivia
David McCandless
Harper Design
売り上げランキング: 14,129
タイトルが違うのでまぎらわしいのですが、『Visual Miscellaneum』『Information is Beautiful』(イギリス)の米国版です。内容はまったく同じなのでご注意! 日本語版は出ていません。

彼は、市場調査会社カンター(Kantar)とともに、データビジュアライゼーションのコンテストInformation is Beautiful Awardsを主催しています。

このコンテストの2012年度の受賞作にデータビジュアライゼーションの秀作がそろっていますので紹介します。

CNN Home & Away

最優秀賞(Most Beautiful)・データジャーナリズム部門金賞
制作:Stamen

cnn home and away

Home & Awayは、アフガニスタンとイラクで戦死した米国人の死亡場所と出生地をマッピングしたCNNのスペシャルコンテンツです。アフガニスタンでの死者約3600人、イラクでの死者約4800人がマッピングされています。ふたつの戦争にアメリカが払った大きな代償が見えてきます。モノクロームの地図の上に戦死者の顔写真がカラーで浮かび上がります。一人ひとりの名前をクリックすると、出生地や死亡場所、死亡の状況が記載されていて、追悼メッセージを書き込めるようになっています。

Notabilia

インタラクティブビジュアライゼーション部門金賞
制作:Moritz Stefaner, Dario Taraborelli, Giovanni Luca Ciampaglia

Notabiliaは、Wikipediaで削除依頼されたページごとの議論の過程を樹状に可視化したインタラクティブなビジュアライゼーションです。対象のページは、削除するか存続するかの議論が長く続いた100ページ分の議論の流れです。1本の枝が1ページをあらわしていて、枝の長さが議論の長さです。削除か存続かの意見表明によって、枝の色とカーブの向きが変わります。枝のかたちは、賛否が拮抗していると直線状、連続した賛否が交互にあらわれるとS字状、全員一致の場合はらせん状になります。

the deleted
こちらは、削除が決まった100ページ。

the kept
こちらは、削除されずに存続・統合・リダイレクトが決まった100ページ。

制作ツールは、FlashFlareFDT。サイトに掲載されている静的グラフは、Tableauで制作されています。 ビジュアライゼーションの入力元のデータセットは、Google Docsで公開されていて自由に使用することができます。

Information graphics in context

データビジュアライゼーション部門金賞
制作:Peter Ørntoft

Information graphics in context:難民と移民は、宗教的シンボルを身につけていることの是非に焦点をあてたグラフィックです。データはデンマーク人を対象とした調査結果です。テーマとなっている宗教的シンボルの写真と色分けしたデータを組み合わせて見せています。


イスラムのスカーフ


十字架


ヤムルカ(キッパ・ユダヤ帽)

Cover mania

インフォグラフィック/インフォデザイン部門金賞
制作:Michele Mauri

Cover maniaは、年別にカバーされた楽曲のオリジナル・バンドを示した時系列のビジュアルです。リボンの色がオリジナル・バンドをあらわし、幅がその年に発表されたカバー曲の数です。各年のリボンは曲数の多い順に上から並んでいます。全体を通じてもっともカバーされていた緑色のリボンはビートルズ。2位以下は、ボブ・ディラン、クイーン、スティーヴィー・ワンダー、ローリング・ストーンズと続いています。データソースは、サンプリング・カバー曲のデーターベースサイトのWhoSampled

Afghanistan – What is the true cost of war?

モーション・インフォグラフィック部門金賞
制作:Peter Jeffs, Tom Stevenson

Afghanistan – What is the true cost of war?は、イギリスがアフガニスタン戦争に費やしている多額の予算を見せた動画です。モノクロームの色調を背景に、アフガニスタン国旗の赤・黒・緑の3色で構成しています。元政治家で反戦団体Stop the War代表のトニー・ベンの力強いナレーションの後ろに流れている緊張感あふれる音楽は、ブライアン・イーノ。

The Antimap

ツールおよびWebサイト部門金賞
制作:Trent Brooks

Antimapは、データビジュアライゼーションのためのオープンソースのツールです。データを記録するスマートフォンアプリAntimap Logと、データ分析とビジュアライゼーションをおこなう2種のアプリ:WebアプリAntiMap SimpleとデスクトップアプリAntiMap Videoで構成されています。スノーボード、スキー、自転車、ドライブ、ジョギングなどの活動中に位置や方角、スピードなどのログをスマートフォンアプリで記録し、保存されたCSVデータを分析できます。

Antimap SimpleはHTML5/ProcessingJS、AntiMap VideoはopenFrameworksで開発されています。

参考情報

ここで紹介したのは、最優秀賞と各部門の金賞です。すべての受賞作はこちらをご覧ください。なお現在、2013年度のコンテストが作品募集中です。締切は2013年9月13日。なお応募には、エントリーフィーがかかります。

ちなみに、2012年は市場調査会社ニールセン(Nielsen)も、同社提供のデータを素材としたビジュアライゼーションのコンテストを開催していました。

データビジュアライゼーション・ツール20選

この記事はThe top 20 data visualisation toolsの原著者許諾済みの日本語訳です。
By Brian Suda on September 17, 2012
Translated by Tatsuo Sugimoto

2014年4月28日更新:オリジナル記事が以前のサイトから移転したため発生していた画像の非表示に対応しました。

わたしがもっともよくきかれる質問のひとつが、データビジュアライゼーションを始める方法についてです。このブログの先へ進むには、練習し、さらに実践し、利用できるツールを理解する必要があります。この記事では、シンプルなチャートから複雑なグラフ、地図、インフォグラフィックスまで、ビジュアライゼーションを作成するための20種類のツールを紹介しようとおもいます。ほとんどのツールは無料で利用でき、そのうちいくつかはすでにインストール済みかもしれません。

もくじ

エントリーレベルのツール

エントリーレベルでは、使いなれたツールを転用してみましょう。たとえば、Excelはビジュアライゼーションソフトだとはおもわれていませんが、驚くほど複雑な結果を得られます。もし始めたばかりなら、これらのツールを理解すべきです。もし毎日ビジュアライゼーションを扱うのなら、すぐにこの先へと進めていけますが、ほかの皆がそうできるわけではありませんので、いつもあまり扱いたくない出所[訳注:つまりエントリーレベルのツール]からのデータを扱うことになります。

1. Excel

 for example, by creating 'heat maps' like this one
Excelは、グラフィカルな柔軟さはありませんが、たとえばこのような「ヒートマップ」を作成するためのデータ探索に向いています。

セルの「ヒートマップ」から散布図まで、Excelではかなり複雑なことができます。エントリーレベルのツールとして、ちょっとしたデータ探索や組織内使用のためのビジュアライゼーション作成には向いていますが、デフォルトの色、線、スタイルのセットが限られているので、本格的な出版物やWebサイトで利用できるグラフィックを作成することは困難です。それでもExcelは、すばやくアイデアを伝えるための手段として、用意しておくべきツールです。

Excelは、商用のMicrosoft Officeの一部として提供されていますので、購入していない場合は、Googleドライブの一部であるGoogleスプレッドシートでほぼ同じことができます。Googleは自社サービスを再利用しているので、スプレッドシートはGoogle Chart APIと同じチャートを生成できます。つまり今後ツールを卒業し自分のプロジェクトでAPIを直接使用するときにそなえて、あらかじめできることを把握しておくことができます。

2. CSV/JSON

CSV(コンマ区切り値)とJSON(JavaScript Object Notation)は、ビジュアライゼーションツールではありませんが、一般的なデータフォーマットです。これらの構造と入出力の方法を理解しておきましょう。このあと紹介するすべてのツールは、入力源としていずれかまたは両方のフォーマットに対応しています。

オンラインのビジュアライゼーション

3. Google Chart API

静的画像のためのツールセットの一部が廃止されたため、現在Google Chart Toolsサイトは動的なチャートのためのツールだけを提供しています。これらは堅牢で、SVG、Canvas、VMLをサポートするすべてのブラウザ上で動作しますが、クライアントサイドで生成するという唯一の大問題があり、JavaScriptのないデバイスやオフライン利用、さまざまなフォーマットに保存するときに問題が生じます。静的画像にはこうした問題はなかったので、なくなってしまったのが残念です。

とはいえこのAPIは、棒グラフ、折れ線グラフから地図やQRコードにいたるまで、ありとあらゆることができます。Googleっぽい外観でかまわなければ、極端なカスタマイズを必要とせずに、よいビジュアライゼーションになるでしょう。出発点として、Google Chart APIは使い方を知るのに最適なツールです。

The portion for static images has been deprecated, but the Google Chart API is a good way to create dynamic visualisations
静的画像の部分が廃止されましたが、Google Chart APIは動的なビジュアライゼーションを作成するためのよい方法です。

4. Flot

Flotは、折れ線グラフと棒グラフ用のすばらしいライブラリです。FlotはCanvasをサポートするすべてのブラウザで動作します。つまりほとんどの一般的なブラウザ、および古いブラウザではCanvasをVMLとして扱う外部ライブラリを使えば動作します。FlotはjQueryライブラリなので、すでにjQueryになれていれば、グラフィックのスタイルや振る舞いをコールバックで簡単に扱えます。

Flotの素晴らしい点は、多くのコールバック関数にアクセスできるので、ユーザーのホバー、クリック、マウスアウトなどの一般的なイベント発生時に、独自のコードとスタイルを実行できることです。Flotは、ほかのグラフ作成パッケージよりもはるかに柔軟性がありますが、やや習得しづらいです。Flotは、折れ線グラフと棒グラフに限定されています。Flotはほかのライブラリほど多機能ではありませんが、一般的な仕事をしっかりこなします。

It's specialised on line and bar charts, but if you know jQuery, Flot is a powerful option
Flotは折れ線グラフと棒グラフに特化したものですが、jQueryを知っていれば強力な選択肢です。

5. Raphaël

Raphaëlもグラフ作成のすばらしいJavaScriptライブラリです。ほかのライブラリとの大きな違いは、RaphaëlがSVGとVMLの出力にしぼっていることです。これには一長一短があります。SVGはベクターフォーマットなので、どんな解像度でも美しく見えます。ただし各要素のDOMノードが作成されるため、Canvasにラスタライズされたイメージよりも遅くなります。一方で、HTMLのように各DOM要素とインタラクトできるという利点があります。

Webサイトには、Raphaëlが一般的なグラフを簡単につくれることを見せるたくさんのデモがありますが、任意のSVGにもレンダリングできるため、IllustratorInkspaceなどのベクターツールに頼らなければできないほど、とても複雑なビジュアライゼーションを作成できます。

 slower than raster-based tools, but it's capable of complex results
Raphaëlはベクターベースのグラフを作るよい手段です。ラスターベースのツールよりも遅いものの複雑な結果を得られます。

6. D3

D3 (Data-Driven Documents)は、SVGレンダリングをサポートするJavaScriptライブラリです。この例はシンプルな棒グラフと折れ線グラフを超えた、かなり複雑なボロノイ図、ツリーマップ、円形クラスター、ワードクラウドです。道具箱に用意すべきすばらしいツールですが、図書館に行くようにいつでもD3をおすすめしようとはおもいません。D3は、とても複雑なインタラクションを作るにはすばらしいです。しかし、ただできるからといって、やったほうがよいというわけではありません。シンプルでいることを心得ていることが、最適なビジュアライゼーションツールを選択する大切なポイントです。

D3 is capable of creating very complex output – but it's best saved for special cases, not everyday use
D3はとても複雑なアウトプットを作成できますが、普段使いではなく特別な機会にとっておくのに最適です。

7. Visual.ly

データビジュアライゼーションよりもインフォグラフィックを必要としている場合、それを支援する新しいツール群が登場しています。Visual.lyはそのなかでおそらく最も人気があります。そもそもインフォグラフィックデザイナーのためのオンライン市場でしたが、テンプレートを選びFacebookやTwitterアカウントに接続すると、すてきなイラストが返ってくる作成機能があります。結果は現在のところ限られていますが、良くも悪くも、有用なインスピレーションの源泉です。このサイトは、今後より多くのフォーマットに対応し、さらにおもしろいグラフィックを作成できるように発展しそうです。

Visual.ly acts both as an online marketplace and simple creation tool for infographics
Visual.lyはオンライン市場とインフォグラフィックのシンプルな作成ツールをもちあわせています。

インタラクティブなGUIコントロール

データビジュアライゼーションがインタラクティブになったら、それ自体がGUIコントロールになるでしょうか? オンラインのビジュアライゼーションが進化したように、ボタン、ドロップダウン、スライダーは、入力パラメータとデータを同時に変化する範囲制御の小さなハンドルのような、より複雑なインタフェース要素へと変化しています。コントロールとコンテンツは融合していくのです。これから紹介するツールは、この提案への可能性を探るのに役立つでしょう。

8. Crossfilter

クライアントがデータの中をかき分けていけるようにより複雑なツールを構築するとき、わたしたちはインタラクティブなGUIウィジェットの役割も兼ねたグラフやチャートを作りはじめています。JavaScriptライブラリのCrossfilterはこれら両方ができます。データを表示すると同時に、データの範囲を制限してリンクされたグラフの反応を見ることができます。

 by restricting the input range on any one chart, data is affected everywhere. This is a great tool for dashboards or other interactive tools with large volumes of data behind them
実行中のCrossfilter:任意のグラフの入力範囲を制限することで、全てのデータに影響が及びます。Crossfilterは、背後に大量のデータをかかえているダッシュボードやインタラクティブなツールに最適なツールです。

9. Tangle

Tangleでは、コンテンツとコントロールの境界がさらにあいまいになります。複雑なインタラクションや方程式を説明しようとするとき、ユーザ自身に操作感覚とデータ探索の強力な方法の両方を提供するために、入力値を微調整させ出力を見せます。JavaScriptライブラリのTangleは、まさにこれをおこなうツールセットです。変数上でドラッグすると、その数値を増減させ、関連するグラフが自動的に更新されるのを見ることができます。この結果はほとんど神秘の一歩手前です。

Tangle creates complex interactive graphics. Pulling on any one of the knobs affects data throughout all of the linked charts. This creates a real-time feedback loop, enabling you to understand complex equations in a more intuitive way
Tangleは、複雑なインタラクティブなグラフィックを作成します。任意のでっぱりを引っぱると、すべてのリンクしたグラフを通じてデータに影響をおよぼします。Tangleは、リアルタイムのフィードバックループを作りだし、より直感的な方法で複雑な方程式を理解できます。

マッピング

マッピングは、以前はウェブ上のとてもやっかいな作業でした。そこにGoogleマップが、オンライン地図の動作方法についての先入観をすっかり吹き飛ばして登場しました。その後間もなくGoogleは、開発者が自分のサイト内にマップを埋め込めるGoogle Maps APIをリリースしました。

それ以来、この市場は大いに成熟しました。自分のデータビジュアライゼーションのプロジェクトでカスタムマッピングソリューションを埋め込みたい場合、現在ではいくつかの選択肢があり、他と比べてどれを選択するべきかを知っていることが、ビジネス上の重要な判断になったのです。おそらくこれらのマップのいずれかに必要なものをすべて押し込むことはできますが、ハンマーを持ってあらゆる問題を「くぎ」として見ることのないようにおすすめします。

10. Modest Maps

Modest Mapsは小さなマッピング・ライブラリです。わずか10kBしかなく、ここであげているなかで最軽量の選択肢です。Modest Mapsは基本的な形式のみしか作れませんが、だまされていはいけません。Waxなどいくつかの拡張でこのライブラリに命を吹き込むことができます。Modest Mapsは、StamenBloomMapBoxによる制作物ですから、興味深い経歴をもっていることがわかります。

Teamed with additional libraries, such as MapBox's Wax (pictured), the tiny Modest Maps becomes a powerful tool
MapBoxのWax(図)のような追加ライブラリと合わせることで、小さなModest Mapsは強力なツールになります。

11. Leaflet

CloudMadeチームが提供するLeafletも、小さくモバイルページを作成するのに十分軽量になるように設計された小型のマッピングフレームワークです。LeafletもModest Mapsも、自分のサイトで使用するのに理想的なオープンソースのプロジェクトです。強力なコミュニティがバックアップしているので、すぐに消えてしまうことはありません。

Leaflet is a small, lightweight JavaScript library ideal for mobile-friendly projects
Leafletは、モバイルプロジェクトに理想的な小さく軽量なJavaScriptライブラリです。

12. Polymaps

Polymapsもマッピングライブラリですが、真正面からデータビジュアライゼーションのユーザをねらっています。CSSセレクタに似た、作成したマップをスタイリングするユニークなアプローチを提供しているので、知っておくとすばらしいリソースです。

Aimed more at specialist data visualisers, the Polymaps library creates image and vector-tiled maps using SVG
データビジュアライザーの専門家向けのPolymapsライブラリは、SVGを使って画像とベクターでタイル張りされたマップを作成します。

13. OpenLayers

OpenLayersは、これらのマッピングライブラリの中でおそらく最も堅牢です。ドキュメントはあまりよくなく、習得はむずかしいですが、ほかではできないことに使えます。他のライブラリが提供していない特定のツールを必要としているとき、OpenLayerがたよりになります。

It isn't easy to master, but OpenLayers is arguably the most complete, robust mapping solution discussed here
OpenLayersをマスターするのは簡単ではありませんが、ここでとりあげているなかで間違いなく最も完全で堅牢なマッピングソリューションです。

14. Kartograph

Kartographのキャッチフレーズは「マッピングの再考」で、この開発者がやっていることそのものです。私たちはいつもメルカトル図法を使っていますが、Kartographははるかに多くの選択肢をもたらします。もし世界規模のデータの作業ではなく、明確なボックスのなかにマップを配置できるなら、Kartographは他よりひときわ目立つために必要な選択肢を持っています。

Kartograph's projections breathe new life into our standard slippy maps
Kartographの投影図は、標準のとらえにくいマップに新たな命を吹きこみます。

15. CartoDB

最後に、CartoDBは知っておくべきサイトです。表形式のデータをマップと組み合わせられる容易さは群を抜いています。たとえば住所の文字列のCSVファイルを入力できて、それらは緯度経度に変換され、地図上にプロットされますが、他にも多くのユーザーがいます。5つの表までは無料で利用できます。その後は月額料金プランがあります。

CartoDB provides an unparalleled way to combine maps and tabular data to create visualisations
CartoDBは、ビジュアライゼーションを作成するためにマップと表形式のデータを結合する素晴らしい方法を提供します。

グラフ用のフォント

最近のWeb開発のトレンドのひとつに、美しいベクターアイコンを作成するため、埋め込みフォントにシンボルフォントを合成することがあります。これらのアイコンは、拡大や印刷に完全に対応していて、あたらしいRetinaデバイスにもぴったりです。FF ChartwellChartjunk等のいくつかのフォントは、グラフを表示するために特別に作られています。こうしたフォントは、すべてのブラウザでは完全にサポートされていないOpenTypeの日常的問題をかかえていますが、近い将来は検討に値するでしょう。

本格的に取り組む

データビジュアライゼーションに本格的に取り組むなら、シンプルなWebベースのウィジェットから、さらに強力なものに移行する必要があります。つまりデスクトップアプリケーションやプログラミング環境のことです。

16. Processing

Processingはインタラクティブ・ビジュアライゼーションのシンボル的存在になりました。Processingでは、Javaにコンパイルされる、より簡単なコードを書くことができます。Javaアプレットなしでより簡単にProcessingを使うWebサイトを作れたり、Objective-CへのポーティングでiOS上で使えるProcessing.jsプロジェクトもあります。Processingはデスクトップアプリケーションですが、すべてのプラットフォームで動作し、現在数年の歳を重ねていて、コミュニティによる十分なサンプルとコードがそろっています。

Processing provides a cross-platform environment for creating images, animations, and interactions
Processingは、画像、アニメーション、インタラクションを作成するためのクロスプラットフォーム環境を提供しています。

17. NodeBox

NodeBoxは、2Dグラフィックとビジュアライゼーションを作成するためのOS Xアプリケーションです。Pythonコードを知っていて理解する必要がありますが、その先にあるNodeBoxは、変数を微調整し、瞬時に結果を確認するための迅速かつ簡単な方法です。NodeBoxはProcessingに似ていますが、インタラクティビティはありません。

NodeBox is a quick, easy way for Python-savvy developers to create 2D visualisations
NodeBoxは、Python使いの開発者にとって、2Dビジュアライゼーションを作成する素早く簡単な方法です。

プロ・ツール

Excelからはじまるスペクトルの対極に位置するのが専門的なデータ分析ツールです。データ・ビジュアライゼーションに本格的に取り組んでいるなら、このうちのいくつかに熟達していないとしても意識はしておく必要があります。SPSSSASといった業界標準のツールは高額な利用料が必要なので、大規模な組織や学術機関だけが利用できます。しかしいくつかの無料の代替ソフトウェアが、強力なコミュニティとともにあります。オープンソースソフトウェアも商用ソフトに劣らぬ品質で、プラグインやサポートもすぐれています。

18. R

そのソフト専用の検索エンジンをそなえたソフトウェアが他にあるでしょうか? 統計パッケージは大規模なデータセットを解析するために使用されます。Rは非常に複雑なツールで、理解するのに時間がかかりますが、強力なコミュニティと、つぎつぎに制作されているパッケージライブラリをもっています。学習曲線は、ここでとりあげるツールのどれよりも険しい[訳注:むずかしい]もののひとつですが、このレベルに到達したいなら、使い慣れておかなくてはなりません。

A powerful free software environment for statistical computing and graphics, R is the most complex of the tools listed here
Rは統計処理とグラフィックのための強力なフリーソフトウェア環境で、ここにあげたツールのなかで最も複雑です。

19. Weka

データサイエンティストの世界に深く入るには、自らの能力をビジュアライゼーションの作成だけからデータマイニングに拡張する必要があります。Wekaは、さまざまな属性に基づき(データ探索の強力な方法である)データの分類とクラスタリングをおこなうのに適したツールです。また、簡単なプロットを生成することもできます。

A collection of machine-learning algorithms for data-mining tasks, Weka is a powerful way to explore data
Wekaはデータマイニング作業のための機械学習アルゴリズムを集積した、データ探索の強力な方法です。

20. Gephi

人びとが関連性、ソーシャルグラフ、相関関係について話しているとき、実際には、ネットワーク内の他のノードに対して、2つのノードが相対的にどう互いに関連しているかについて語っています。問題となるノードは、会社の人々や文書内の単語、サッカーの試合のパスにもなりえますが、数学も同じことです。グラフベースのビジュアライザーでありデータ管理ソフトであるGephiは、大量のデータセットを処理し美しいビジュアライゼーションを作成できるだけでなく、データをクリーンにしソートすることもできます。使用事例が限られている複雑なソフトウェアですが、この珠玉のソフトを知らない人よりも一歩前に進むことができます。

Gephi in action. Coloured regions represent clusters of data that the system is guessing are similar
実行中のGephi。着色された領域は、システムが類似していると推測したデータのクラスタを表しています。

参考サイト

  • ビジュアライゼーションのサンプルとインスピレーションのすばらしいTumblrブログ。 vizualize.tumblr.com
  • Nicholas Feltonのアニュアルリポートは現在たいへん有名ですが、彼は自分が見つけた素晴らしい作品群のTumblrブログももっています。
  • Processingを世に送りだした人物から。benfry.com/writing
  • Stamen Designはいつも興味深いプロジェクトを生み出しています。stamen.com
  • Eyeo Festivalは、データビジュアライゼーションの偉大な人物たちを集めていて、オンラインでビデオを見ることができます。

日本語ブックガイド

ビューティフルビジュアライゼーション (THEORY/IN/PRACTICE)
Julie Steele Noah Iliinsky
オライリージャパン
売り上げランキング: 74,506
ビジュアル・コンプレキシティ ―情報パターンのマッピング
マニュエル・リマ Manuel Lima
ビー・エヌ・エヌ新社
売り上げランキング: 51,393
Processingをはじめよう (Make: PROJECTS)
Casey Reas Ben Fry
オライリージャパン
売り上げランキング: 37,686
ビジュアライジング・データ ―Processingによる情報視覚化手法
Ben Fry
オライリージャパン
売り上げランキング: 81,829
Rクックブック
Rクックブック

posted with amazlet at 13.08.30
Paul Teetor
オライリージャパン
売り上げランキング: 159,468
RとRubyによるデータ解析入門
Sau Sheong Chang
オライリージャパン
売り上げランキング: 11,105