福島第一原子力発電所 放射線計測データの変換

東京電力では、 モニタリングポスト(MP) の計測データをPDFでしか、 発表 していません。
PDFは、簡単にプログラムを使って処理することが出来ません。
そこで、そのデータをJSON に変換してみました。

福島第一原子力発電所 モニタリングポスト空間線量率(μSv/h)

English Esperanto


変換の手順

福島第一原子力発電所モニタリングによる計測状況のPDFファイルの取得

SRC=http://www.tepco.co.jp/nu/fukushima-np/f1/images
#
wget $SRC/f1-2011041221-j.pdf
wget $SRC/f1-2011041223-j.pdf
wget $SRC/f1-2011041309-j.pdf
wget $SRC/f1-2011041315-j.pdf
wget $SRC/f1-2011041321-j.pdf
wget $SRC/f1-2011041309-j.pdf
スクリプトで変換

  1. テキストの抽出
  2. pdftotext -layout f1-2011041221-j.pdf f1-2011041221-j.txt

  3. モニタリングポスト空間線量率のみを選びだす。
    モニタリングカーの値などを除きます。
    次の awk のプログラムを使います。

    {ppx = length($2) - 2
    if ((substr ($1,0,4) == "2011") && (substr ($2,ppx,1) == ":") && (6 < NF))
    {
    print $1"_"$2,$3,$4,$5,$6,$7,$8,$9,$10
    }
    }


  4. テキストを JSON に変換
  5. text_to_json.php
  6. JSON を見やすくする (行わなくても良い)
  7. sed 's/},/},\n/g' f1-2011041221-j.json

作成された JSON JSONP には こちらを

元のPDF 11040505.pdf 11040601.pdf

jQueryを使ったJSONの表示

JSON の良さを感じて下さい。

戻る


Apr/16/2011