この記事は、When Maps Lieの日本語訳です。
CityLab.com編集部の許諾を得ています。転載はご遠慮ください。
地図がウソをつくとき
専門家による地図にだまされないコツ
Original Article: When Maps Lie
Text: Andrew Wiseman
Published: Jun 25, 2015
Translate: Tatsuo Sugimoto
- タイトルを信じない
- 情報源は大切
- ヒートマップ・密度マップは混乱のもと
- 地図制作者は何を見せ、何を隠そうとするのか?
- データの区分け方は重要
- コロプレス図にご注意
- 基本データも重要
- それでも地図は悪くない
この地図にはなにか意味があるのでしょうか。(iQoncept / Shutterstock.com)
このところ地図は大きな話題です。ブログや(このサイトなどの)ニュースサイトが、「世界を説明する40の地図」、「全米各州で人気のTV番組」といった地図をしょっちゅう掲載しては、よく拡散されています。こうした地図は、Facebook、Twitter、Tumblrで広がっていて、報道機関も、デジタル空間で地図の持つ明らかなパワーを当然利用しています。地図は、大量のデータを素早く効果的に視覚化することができます。ところが地図は、大量のデータを不正確にも誤解を招くようにも視覚化することができてしまいます。
地図はただの絵ではありません。地図は、その背後にあるデータや、データの収集と解析に使われる方法論、そうした作業をおこなう人々、視覚化における選択、制作に使われるソフトウェアでもあります。地図は世界の代わりにもなりますが、多少の不正確さは残っているものです。ほとんどの地図は、球面上の世界を平面にして表します。全てを同時に見せられる地図がないように、何かしら消し去られたり強調されるのが常です。意識していようがいまいが、全ての選択やバイアスが地図そのものに大きな影響を与えます。私たちは気づかぬうちに、不正確だったり、誤解を招いたり、間違ったりしているものを見ているかもしれないのです。
アメリカ国民は幼い頃から、言葉の意味や使い方を分析し理解することを学びます。ところが地図に関しては、そうした技術を学ぶことはほとんどありません。
名著『地図は嘘つきである』(How to Lie With Maps)でマーク・モンモニア(Mark Monmonier)が書いたように、(彼の言葉を借りれば「言葉の慎重な消費者」になるように)アメリカ国民は幼い頃から、広告、政治キャンペーン、ニュースなどの言葉の意味や使い方を分析し理解することを学びます。ところが地図に関しては、そうした技術を学ぶことはほとんどありません。
地図を使う教育(と地理全般)は、全米の学校では不十分で一般的ではありません。高校の飛び級試験の人文地理学は、2001年に始まったばかりです。多くのトップ私立大学は、科目として地理を課していません。ハーバード大学は、1948年に地理を削除し、研究者からは全国で地理の学習が減少しはじめたことに非難の声があがりました。
数多くの研究が、大多数のアメリカ人には地理的リテラシーが欠けていて、地図上でアフガニスタンやイラクなどの場所を見つけることができないと報告しています。ましてや、それらがどこにあり、なぜそこにあり、ほかのことにどう影響するのかといった、複雑な空間的関係を理解することなどできません。(ハーバード大学の名誉のためにいっておくと、同大学は2006年に地理学的分析センターを設立しています。)こうしたことを思い浮かべても、多くのアメリカ人は地理といえば、単に州都を覚えたり、ナショナルジオグラフィックのクールな動物写真を見たりすることだと考えているのです。
人々が地図をたいてい正確だと思い込んでいることは驚くことではありません。なぜなら地図がどのように作られているのかは、ほとんど知られていないからです。モンモニアが言うように、地図は「過剰な敬意と信憑性をもたらす神秘的なイメージ」であり、「高度な技術をもつデザイナーと製図者という聖職に託された」ものなのです。言葉はほぼだれでも書けますが、全員が地図を作ることはできません。
その一方で、コンピュータやソフトウェアが強力かつ安くなり、地理情報システム(GIS)の利用が爆発的に拡大しました。新たなWeb地図ツールとデータの公開で、従来専門家や専用ソフトのユーザしかできなかった地図制作の民主化が進み、だれでも地図を作れるようになりました。つまり、より多くの人が自分で地図を作るようになったのです。これは確かに良いことです。しかし、(拡散を煽ったり特定の視点を押し付ける)デザインや、自分のやっていることを完全に理解していない制作者による、精密さを欠いた不正確な地図も大量に出回ってしまっています。
地図というのは、たとえ精密でなくとも楽しいものです。とはいえ地図にだまされないように、頭の片隅にとどめておけるちょっとしたコツがあります。
タイトルを信じない
よき地図制作者は、大風呂敷を広げずに、地図が示すことを正確かつ簡潔に説明しなければいけません。最近の事例に、「成長期を過ごすのに最良な地域と最悪な地域」というタイトルがついたニューヨークタイムズの記事とインタラクティブな地図があります。説明するまでもないタイトルかもしれませんが、この地図の背後にあるデータは、人々が育った場所によってどれほどのお金を稼いでいるかを示しているだけです。とても興味深い発見ではありますが、収入の多寡から、ある場所で育つのが他の場所よりも良いとは必ずしもいえません。これは定義が難しい問題で、間違いなく多くの変数が絡んでいるからです。ある場所は物価が低く、良い学校や良い保健施設があり、いろいろなレクリエーションが用意されているかもしれません。事実、この記事ではそうした議論がなされています。
アリゾナ州マリコパ郡では、貧しい家庭の子どもに平均的な所得移動があります。全郡の約48%より上位です。(The New York Times)
データは非常に魅力的に提示され、実際読者が閲覧している場所によってこの地図は印象的に変化しています。しかしこのタイトルは、何を示そうとしたかを本当に示してはいません。地図を見ただけでその土地の良し悪しを判断したとしたら、この記事の全体像を見過ごすことになります。アトランタやデンバーは、育つのに悪い場所でしょうか。ワイオミング州、ユタ州、南北ダコタ州、田舎のミネソタ州やアイオワ州が最良の場所でしょうか。良いか悪いかは、あなたが何を最良で何を最悪だととらえるかで変わります。
地図のタイトルがついた赤い旗は、アメージング、インクレディブル、ゴージャスなどの〔バイラルメディアの〕Upworthy的な言葉で、全てを明らかにしたと主張しているはずです。「このすばらしい地図は、わずか数都市で全米の生産量の半分を占めていることをあらわす」というように。データとマップの作られ方をしっかり調べると、こうした大げさなタイトルが見掛け倒しであることがよくあります。
国内総生産(GDP)を示したこの地図では、都市部の住民が地方の住民よりも生産的に見えますが、実際に示しているのは、この国のGDPの50%が人口の50%によって生産されているということです。かなり多くの人々が地方よりも都市部に住んでいるので、とくに驚くべき話ではありません。興味深い地図は人口当たりのGDPでしょう。ある地域は他の地域よりも生産的ですか? それはなぜ?(私が学生に伝えたいのは、良い地図は唯一の解ではなく疑問をひきだすこともあるということです。)似た事例に、米国のエイズ事案の92%が25の州で発生していることを示す地図があります。しかし別の記事によると、米国の人口の大部分はその25の州に住んでいます。つまりこの結果は、ほぼ想定の範囲内なのです。各州の内部のばらつき具合を地図に示せば、より興味深いものになるでしょう。
タイトルは、人々がどのように地図を解釈するかの問題でもあり、良い地図がデータの情報源を地図自体に(詳細についてはその直後に)載せなければいけない理由でもあります。例えば、この「コーポレート・ステーツ・オブ・アメリカ」の地図は、各州で「最も有名な」会社を示していると謳っています。しかし「最も有名」とは、どんな意味でしょうか。この地図の作者は正直に、企業の認知率や市場価値といった実際のデータの裏付けはなく、単にその州をもっとも代表すると自分で考えた企業だと説明しています。ですからフロリダが、自州の代表がフーターズだからといって恥じる必要はないのです。別の有名な地図に、各州のご当地バンド(他州よりも人気のあるバンド)地図があります。この地図は、存在するデータをもとにしていて、「あなたの州のお気に入りバンド」として共有されました。この2つの事例は別物です。
こうした「アメージング」な地図は、たいてい誰かが構成したものでしかないのです。だからといって、そうした地図がイケてないとか楽しくないわけではもちろんありません。(事実その地図はイケてるはずです。美しくないマップはシェアされませんから。)
情報源は大切
地図のデータの情報源は、最初に見つけるべきことのひとつです。この情報はどこから来ているか。信頼できる情報源か。最新の情報か。自分で確認できるものか。
情報源が掲載されていなかったらご用心。ただし掲載されていても、注意しなければいけません。たとえば最近、もっとも嫌われている大学バスケットチームの地図が口コミで拡散しました。この制作者は、自身をキュレーターとする小さなメタデータを掲載していて参考になります。ところがデータ自体は、Redditの大学バスケットボール板に投稿された2問のGoogle Docsのアンケートによるもので、アメリカ国民の全体像をあらわすことはできません。このアンケートは出身地の回答が必須でしたが、回答者はわざとウソをつくことができました。デューク大学が嫌いな人は、データを歪めるためにノースカロライナ出身だといつわることもできたのです。
この地図の正確な説明は、「自主的に回答したReddit大学バスケットボール板ユーザーの中でもっとも嫌われている大学バスケットボールチーム」となるでしょう。このような説明文は、読者がたどれるようにするのではなく、しっかり地図上に示しておくべきです。このように表記していたら、嫌われているというチームの本拠地で発行している新聞が、この地図を取り上げることはなかったでしょう。
全米各州の代表的食べ物
この地図のデータを信じられますか。よく見てください。(via Playboy)
これは取るに足らない無害な事例です。嫌いな大学バスケ地図が正しいかどうかなんてどうでもいいですよね。でも同じことが、政治、健康、宗教など、あらゆる種類のデータでできてしまいます。
情報源にすぐに辿り着けると、偏りがないか、データ通りに作られているかを確かめられます。面白い例に、州ごとの「門外不出。本当に多い死因」があります。この地図には、トロール、ロシアの侵略、モンスター、〔牛乳を消化できない〕乳糖不耐症などが並んでいます。これは明らかにバイラルマップのパロディです。各州で最も人気の映画や仕事や食べ物、あるいは死因のような重大な話題を示すバイラルマップは、誤解を招き、複数の州にまたがっている多様性を隠してしまうおそれがあります。
「各州の特徴的な食物」や「各州でいちばん人気のテレビ番組」(それともいちばん大きな影響をもつ番組? 繰り返しますがタイトルは重要です)といったバイラルマップは、Redditユーザを発祥とすることもあって、アーカンソー州の特徴的な食物として「ドラッグ・クッキー」みたいなものが出てきてしまいます。こうした地図はもちろん楽しいですが、これをもとに結論を出すのはまずいでしょう。〔アーカンソー州の〕リトル・ロックには、メニューにドラッグを載せているレストランがたくさんあるとは思えません。
ヒートマップ・密度マップは混乱のもと
WebコミックのXKCDは、地図を使ってこの類の面白おかしさを一刀両断しています。この地図には、あるWebサイトの訪問者、「マーシャ・スチュワート・リビング」誌の購読者、動物ポルノの消費者という3つの無関係なものの密度が示されていて、どれも同じ密度になっています。
イラッとすること 第208回
地理的分析地図は基本的にただの人口分布図
「この業界がいわんとしていることは一目瞭然です」
このジョークは、どの地図も人口地図でしかなく、多くの人々がこうした地図を作りたがっていることを伝えています。さきほど取り上げたGDPマップもただの人口マップでしかありません。人口が多い場所はGDPも大きいのです。
これまでの全てのツイートを示したとする地図も、同じタイプの地図です。とてもきれいな地図ですが、Floating Sheepというすばらしいサイトの地図制作者が指摘するように、この地図が基本的に示しているのは、人がたくさんいる場所ほどツイートする人も多いということです。ある場所には何かが多くあることを示すだけなら十分かもしれません。しかし単に人口以上のことをマッピングしたり、参考となる結論を導きたい場合、ヒートマップには、人口や何か別の有効な要素との比率で一般化するなどの作業が必要です。
例えば一人当たりのツイート量のマップは興味深いものになるでしょう。こうすると、自分が見ているものが実際に平均的かどうかを見ることができます。(ツイート地図の制作者エリック・フィッシャー(Eric Fischer)は、ツーリストと地元住民がジオタグのついた写真をどこで撮影しているのかを比較して見せ、ときにはワシントンD.C.のアナコスティア川の東側のように必ずしも人口の多くない地域で多くのツイートがあることを示す、興味深い事例も作っています。)
地図制作者は何を見せ、何を隠そうとするのか?
地図は世界の代わりとなる表現ですが、ある要素は強調され、別の要素は取りのぞかれています。ほとんどの場合、情報の取捨選択は良いことです。特定の目的をもつ地図には有用な項目(道路地図なら道路の種類、名前、都市名)だけを載せるべきですし、ぎざぎざで絡み合ったものを明瞭にするには地下鉄の路線図のようにシンプルにすることがあります。しかし何かを操作したり取りのぞいたりしたことを伝えるのは容易ではありません。そこで地図制作者がどんな選択をしたかを考えることが重要になります。
このシンプルな一例に、何かを売り込み説得しようとする地図があります。その不動産地図は、距離を正確に示していますか? そばにある石炭発電所や悪臭を放つ養鶏場をないものにしていませんか?(「ザ・シンプソンズ」のモノレールの甘い罠を思い出してください。あの地図には、ブロックウェイ、オグデンヴィル、ノース・ヘイヴァーブルックが載っていました!)
色とサイズも、何かを強調したり隠したりするのに使われます。制作者が良くないものとして何かを見せたい場合、赤色にします。強調したい場合は、大きくし鮮やかな色をつけ、人々に気がついてほしくないものを小さくしグレーにします(もしくは一切とりのぞきます)。
見せたいものがたくさんある場合(ニュージャージー州の道にあいている穴など)、大きくて目立つ印を作るかもしれません。この大きな印によって、データにはいろいろな種類の穴があることが分からなくなってしまいます。穴は30センチ幅あるのか、ほんの2~3センチなのでしょうか。この地図では「へえ、たくさんの穴があるんだな」以上のことを伝えることは不可能です(それにこの地図はデータの情報源も掲載していません)。
こうした地図は、うっかりミスを誘います。たとえそういう意味でなかったとしても、赤や異なる色がつけられたものを人々は悪いものだとみなしてしまいます。それに赤は、他の地味な色よりも目を引きつけがちです。この紛らわしい事例のひとつが、州ごとの人口増加をあらわすAP通信のこの地図です。
ゆるやかな人口増加
情報源:アメリカ合衆国国勢調査局 AP通信
ミシガン州が赤色ということは悪い場所、で間違いないですか。実はこの地図の凡例は、いろんな理由で混乱を招いています。ここには3種類の異なる範囲が設定されています。「未満」記号が2つ、5–10といった数値の範囲が3つ、それに「プラス」記号です。表示される数字の表し方がいろいろあるため、理解が難しくなっています。さらに範囲が重なってもいます。10%は、5–10なのか10–15なのか分かりません。範囲を0-4.9や5-9.9のようにすると分かりやすくなるでしょう。5%未満は、厳密にいえば0%未満も含んでいます。さらに極め付きは、説明にはデータは1,000単位だと書いてあるのに、パーセントで表されていることです。テキサス州の人口はたくさん増えましたが、20,000%も増加してはいません。これらの事例はどれも、凡例と色を見逃してはいけない理由をしっかり表しています。赤色を悪いことだとするのなら、その理由を明確にしましょう。
データが構造化された方法も注意すべき部分です。値は、失業者の合計や失業率といったデータ自体の値ですか、データから派生した何か別の値ですか。実際の値を得ることから離れるほど、疑い深くなる必要があります。見ているのは変化率ですか、変化率のうちの減少分ですか。もし誰かが二次的な派生を強調していたら、全体的に不都合な真実を隠そうとしているのかもしれません。(一方これを検証する重要な推論があります。それは、簡単に入手できる人口によってデータを正規化することです。)
データの区分け方は重要
州ごとの人口を少ないほど薄い色に、多いほど濃い色にするといった、何かのバリエーションを別々の色を使って表す地図をコロプレス図〔塗り分け地図・階級区分図〕と呼びます。こうした地図は、値を別々の分類に分割することをとくに重視しています。この区分が誤解をまねいたり現実を覆い隠してしまうことがあります。
均等な間隔でデータを分割する地図を作ることは普通によくあることです。郡ごとの人口を、1-10,000、10,0001-20,000、20,001-30,000などとします。しかし理論的な区分けが、情報を提示するのに最適な手法ではないこともあります。地図制作者が何かを強調したり隠したりしたい場合、分割(集合間の分割線)を簡単に操作し、高い値や低い値をあわせて1つの大きな分類にまとめ、その他の値には個々の分類を作ることができてしまいます。この場合、データの一部分が強調され、その他の部分が隠れてしまいます。そのよく分かる事例が、フロリダ州のヒスパニック人口を示したこれらの地図です。
これらの地図はどれもまったく同じデータを使っています。各地図の異なる分類によって、ヒスパニックの人数が全く違うように見えてしまいます。
「高い」と「低い」だけで色分けしていたり、凡例が一切なかったりするなど、地図がどんな区分けをしたのか明確でない場合は十分警戒してください。情報源が信頼できなかったり、何者かが捏造したりするおそれがあることにも注意が必要です。
データのグループ化も恣意的になりえます。地図制作者が、失業率低下といった肯定的だと考えているものを強調したい場合、失業率が上昇した郡は全て(薄いグレーのような)目立たない色に統一する一方、失業率が低下した郡は低下するほど濃い色にし低下量を見せる地図を作るかもしれません。強調された失業率低下の地域よりも、上昇の地域が実際にはかなり広かったとしても、この地図からは見て取れないでしょう。上昇と低下の両方を含むスケール〔目盛り〕で同じデータを示した地図では、閲覧者はまったく違ったデータを理解することになるでしょう。(データの情報源が重要であることのもう一つの理由です。)
コロプレス図にご注意
前述したコロプレス図は、データをとても効果的に示すことができます。しかしこの地図が誤って使われると、多くの問題が起こります。そのひとつが、州、郡、国勢調査の地域などの面積や人口が均等でなく、各地域内の人口も均等に分散されていない「可変単位地区問題」と呼ばれる問題です。これは、データを分割するのに使われる境界線によって、現実世界のクラスターやパターンが隠されてしまうことを意味します。隠されたパターンを理解するには、データを掘り下げる必要があるかもしれません。
2012年米大統領選挙の一連のコロプレス図は、この問題をとてもよく表しています。最初の地図では、大統領選が非常に拮抗しているか、国が(赤い州と青い州に)きれいに二分しているように見えるように作られています。ただこのように勝者によって州を赤色か青色にすると、勝敗の差の程度、投票の合計数、州内の多様性が見えなくなってしまいます。
制作者が論理的な選択として、より細かい郡ごとに同じデータを見せることを選んだ場合、オバマよりもロムニーに多くの支持が集まっているように見えます。じっさいにはオバマが500万票以上も上回る票を獲得し、やすやすと選挙人団の票を得た事実があったにもかかわらずです。私たちは、それぞれの郡が同じ人口ではないことを知っています。ロムニーは人口の少ない農村郡で数多く勝利した一方、オバマは大きな人口を擁する小都市の郡で圧勝しました。(選挙後に人気を博した「紫色の州」地図のように)青色から紫色、赤色へと支持率に応じたデータを示したとしても、いぜんとして大部分がきわめて小さな面積である都市部の郡の人口が大きいことを見過ごしてしまいます。
可変単位地区問題は、なぜ生の数値よりも密度(人口密度など)などをマッピングしたほうが役に立つかの根拠にもなります。なぜなら小さな郡や国勢調査の地域の密度がとても高いかもしれないからです。
この問題に対する一つの解決策はカルトグラムです。カルトグラムとは単位地区(この場合では郡)を人口に応じて大きさを変えた図なので、人口の多い郡ほど大きく見えます。
2012年米国大統領選の結果のカルトグラムの例
ミシガン州立大学のマーク・ニューマン(Mark Newman)による
この地図はそれなりに便利ですが、州や郡がどこにあるのかをあらかじめ知っていてもなお、ずいぶん混乱したり方向感覚を失うおそれがあります。各郡での勝敗の差を示すグラデーションを加えると、さらに多くのことが分かります。
このカルトグラムでは、多くの郡がほとんど紫色だったのに対し、人口の多い郡のほとんどではオバマが圧勝したことを示しています。
この結果は当たり前に見えるかもしれません。しかしそれは、私たちが基本的に米国の選挙結果をよく知っているからに過ぎません。私たちがよく知らない情報は、存在しないというよりパターンを示しているように見え、表示や編集の方法によって不正確になるかもしれません。このことが、制作者が自分のデータと何をマッピングしているのかを理解し、データを他者から見られるように公開しなければならない理由なのです。
理解せず作られた悪しき例が、ナイジェリアでの誘拐に関するFiveThirtyEightの記事でした(現在は更新されています)。もともとこの制作者は、誘拐の報告に関するデータがどのように収集され整理されたのかを十分に理解せずにマッピングし、そこから多くの誤った結論を導きました。そして長文の撤回に終わったのです。一例をあげると、どの町にもマッピングされなかったデータは、ナイジェリアのちょうど中心地に置かれたので、このコロプレス図の中心点のある地区で誘拐が頻発しているように見えたのです。さらにこの記事は、微妙ながら重要な違いとして、実際には「誘拐の報告の地図」なのに「誘拐の地図」だと述べていたのです。この地図も、正確なタイトルと説明がなぜ重要なのかを示す例です。
基本データも重要
地図に使われる基本データも、境界、位置など重要な影響をもたらします。たとえばGoogleマップは、あなたがどこにいるかによって国境を変化させています。中国、インド、パキスタンの国境線は、領土の主張が相反しているため、各国でかなり違います。Googleは、ウクライナ、ロシアのクリミアやその他の地域でも同じことをしていて、その国の人々に巧妙に合わせたり、変えたりしているのです。別の場所の誰かは一生を通じて別の地図を見ているかもしれませんが、あなたはいつも同じように地図を見ているので、何かが消されていることに気がつくことはないでしょう。
地図の表示方法も重要です。悪名高いメルカトル図法が分かりやすい例で、アフリカと南アメリカを実際よりも小さく見せる一方で、ヨーロッパと北アメリカの大きさを誇張します。この面白い事例が、〔ドラマ〕「ザ・ホワイトハウス」にあります。
基本データは体系的な欠陥を持つこともあります。拡散した「米国のすべての河川」地図は一見きれいですが、よく見るとデータに問題があります。
米国のすべての河川地図? まさか。
一例をあげると、テキサス州とオクラホマ州に河川の密度が変わっているところがあり線や矩形が見えます。何らかの理由で、間違いなく地勢ではない人為的なものがデータにあり、他の地域よりも多くの河川がマッピングされている地域があります。地図で使われる基本データには、このように一見しても明らかでない欠陥が他にもあるかもしれません。
それでも地図は悪くない
これでどんな地図もダメだとか、私たちはいつも地図を疑ってかからなくてはいけないとか、専門家だけが地図を作るべきだ、というわけではまったくありません。地図というのはもともと面白くて楽しいものです(地理もね!)。でも制作者がどのように操作したり隠したりできるかについて、ちょっと考えたり意識したりすることもよいことです。広告や政治キャンペーンのように、そもそも地図(とその背後にあるデータ)を信用してはいけませんが、地図はこれからもパワフルで面白くて楽しませてくれます。
Top image: iQoncept / Shutterstock.com
地図製作に最近興味を持って学校で授業を取っています。その際に説明されていた可変単位地区問題を辿りこちらにたどり着きました。地図製作における注意点・効果的な可視化方法が簡潔にまとめられており、非常に勉強になりました。翻訳してくださった方、ありがとうございました。