新型コロナの感染状況(2020/4/4)

今回は緊急企画として、OpenJUMP(以降、OJ)を使って世界の新型コロナウィルスの感染状況などをグラフ表示したいと思います。

データの入手と加工

まずはデータを入手し加工します。

1.世界地図の入手

世界地図は、下記サイト(Natural Earth)にて無償配布しています。
https://www.naturalearthdata.com/downloads/110m-cultural-vectors/

世界地図のダウンロード

”Admin 0 – Countries”(シェープファイル、国別ポリゴン)をダウンロードしOJへ読み込みます。

属性データは、各国語で国名など21項目が設定されています。韓国語などは文字化けしますが、今回は使用しないので気にしなくてよいでしょう。

属性データは21項目で構成

2.感染状況データ

次に、WHOのサイトから各国の感染状況データを表示します。
https://www.worldometers.info/coronavirus/#countries
※本記事では、WHO発表の2020年4月4日のデータを使用します。

国別の感染状況などのデータ

CSV形式での配布はないようですので、ブラウザからデータをコピーしてテキストエディタに張り付け、その後エクセルに張り付けます。完成すると、以下のようなエクセルファイルになります。

WHOのサイトから入手した感染状況等のデータ

3.感染状況データの加工

先にダウンロードした地図と感染状況データをマッチングしたいのですが、いくつか表記の違いがあります。例えばアメリカ合衆国の場合、”USA”(WHO)、”United States of America”(Natural Earth)となっており、国名の表記が違うため加工しないとマッチングできません。
エクセル(VLOOKUP関数)を使って国名を比較し、WHO側の国名を10件修正して以下のマッチング状態としました。
・シェープファイル側:158/176件一致(不一致18件)
・WHOデータ側:158/207件一致(不一致49件)

4.属性結合の実施

国名を修正したWHOデータをタブ区切りテキストに出力し、OJ上で属性結合を行います。
タブ区切りテキストファイル化は、エクセルからのコピペで問題ありませんが、コピペ後、カンマ”,”を削除してください。カンマを削除しないと、数値が文字項目として取り込まれてしまいます。

タブ区切りファイル化したWHOデータ

属性結合は、メニューから[ツール]、[編集 属性]、[テキストファイルとの結合…]を選択し、結合用ファイル(WHO側)と結合レイヤを指定します。

属性結合機能の選択

最後に表示される”結合用フィールド”ダイアログにて、各データの結合フィールドを指定して”OK”ボタンを押下します。
・レイヤ:NAME_EN
・WHOデータ:Country(作成したWHOファイルの先頭カラム)

結合用フィールドの指定

OJによる属性結合とグラフ表示は、以前の記事でも触れていますので、参考にしてください。

グラフ表示

ようやくグラフ表示ができるようになりました。
まずは感染者数を棒グラフ表示しましょう。
ツールバーのグラフマーク(下図右端)をクリックして”Chart Dialog”を表示し、以下のように指定して”OK”ボタンを押下します。
・Attributes:グラフ化したい項目を選択(感染者数)
・Chart Type:Bar
・Size:Variable

グラフ表示条件の指定

結果、以下のような感染者グラフが表示されます。
アメリカが断トツです。

感染者数グラフ

続いて、人口百万人あたりの検査数を表示してみます。小国のせいかアイスランドが断トツです。

人口百万人あたりの検査数

我が国周辺を見ると、我が国の検査数が少なく感染者数の信ぴょう性に疑問を感じざるを得ない状況です。

我が国周辺の人口百万人あたりの検査数

続いて人口百万人あたりの死亡者数を確認すると、イタリアとスペインの深刻な状況がわかります。

人口百万人あたりの死亡者数

まとめ

今回は緊急企画として、新型コロナウィルスの感染状況などを地図にグラフ表示してみました。
ヨーロッパの深刻な状況が地図からも確認できました。
亡くなった方のご冥福と感染された方の回復をお祈りするとともに、微力ながらこの事態を収束させるための行動を取っていきたいと思っています。