【備忘録】ggplot2で自殺者数の可視化

学部ゼミでは、ゼミ生たちの研究関心からたびたび自殺に関する議論になります。

なので、ちょっと自殺者数の推移を把握しておいた方が良いだろうと思い、内閣府で公表されているデータを使いggplot2で可視化してみました。

元データは以下から入手しました。

http://www8.cao.go.jp/jisatsutaisaku/whitepaper/w-2015/html/chapter1/chapter1_01_01.html

ggplot2で手間取ったのは、例えば元データは「6,000」のように「,」で数値が区切られているんですけど、このままだと scale_y_continuous を使うとエラーで返されたという点です。

これは単純に「6,000」から「6000」に変換すると普通に動きました。






ggplot2のコードは以下のように書きました。

library(ggplot2)
library(reshape2)

#文字化け防止
old = theme_set(theme_gray(base_family="HiraKakuProN-W3"))

#データの読み込み(〇〇〇はデータが存在する場所を指定)
x <- read.csv(“〇〇〇")

# ggplot2用にデータの整形
df <- melt(x, id.var = "year")

# ggplot2のコード
g <- ggplot(df, aes(x = variable, y = value, group = year, colour = year))
g <- g + geom_line()
g <- g + scale_y_continuous(breaks = c(5000,10000,15000,20000,25000,30000,35000), limits = c(5000,35000))
g <- g + xlab("年推移")
g <- g + ylab("自殺者数(人)")

# plotの出力
g

出力されたプロットは以下です。

Rplot01