国勢調査

(未定稿。随時加筆予定)

2015年の国勢調査ネット回答を全国的に併用した最初の国勢調査である。

インターネット回答の利用案内(ID・パスワード)が9月10〜12日に調査員から手渡しされ,9月20日までにネット回答した世帯はそれで完了する。ネット回答しなかった世帯は,9月26〜30日に紙の調査票を手渡しされ,記入して10月1〜7日に調査員に手渡しするか郵送する。

私の家には9月10日に届いた。調査員さんは熟年の紳士で,ご婦人(?)を同伴して来られた。マニュアル通りに国勢調査員証と腕章を呈示し,封をしていない封筒に入った「インターネット回答の利用者情報」と「操作ガイド」を,中身を確認・簡単に説明しながら手渡された:

尋ねられたことといえば,最後に「ネットで回答されますか」と聞かれたことだけである。「はい,そのつもりです」と答えた。翌11日にネット回答したが,たいへん簡単であった。

これでめでたしめでたしかと思ったが,ツイッターを見ると,いろいろひどい状況になっていた。

まず,ネット回答のID・パスワードが届かない世帯がけっこうある。届いても,手渡しではなく郵便受けに入れられていたという報告が多い。特に集合住宅ではその傾向が大きいようだ。閉じていない封筒が郵便受けからはみ出した状態でポスティングされた写真がツイッターなどに投稿され,騒ぎになった。

9月15日,朝日新聞は国勢調査、封せず個人情報配布 IDなど盗み見の恐れという記事を配信し,利用者情報(ID・パスワード)を「個人情報」と決めつけた:「封筒にはネットでの回答に必要な世帯ごとのIDとパスワードを記した書類が入っているが、誰でも取り出して見られる状態だった。IDとパスワードが第三者に知られると、他人が本人のふりをして答える「なりすまし」や、回答済みの個人情報を盗み取られる恐れもあり、不安の声が広がっている」。

これは誤報である。まず,IDはランダムに生成された今回限りのもので,個人情報にはあたらない。また,パスワードは他人に知られても,回答送信時に変更を強制されるので,回答内容を盗み見られる恐れはない。パスワードは8〜32文字で英字・数字が混在しなければならず,初期パスワードと同じパスワードは設定できない(実際に試されたかたから教えていただいた)。何回かパスワードを間違えると一定時間ロックされるので,当て推量で中を覗かれる可能性は非常に小さい。

本人が回答する前に他人がなりすまし回答した場合は,パスワードが変更されているため本人がログインできなくなり,発覚する。仮に(他人がなりすまし回答しパスワード通知を改竄して再ポストインするなどして)ログインできたとしても,ログイン済みであることが表示されるので,やはり発覚する。ネット回答しなかった場合は,紙の調査票が後日配付されるので,なりすまし回答された場合は紙の調査票が届かないことで発覚する(ただし地域によっては紙の調査票を全員に配布しているので発覚しない可能性がある)。さらに,市区町村の役所でチェックし,疑問がある場合は問い合わせが来る。

なお,なりすましが生じても,回答は統計的に処理されるだけで,でたらめな内容を書き込まれて不利益を受ける(例えば警察や税務署が飛んでくる)ことはない。全体として統計の質が落ちるだけである。

いずれにしても朝日新聞の「封せず個人情報配布」はまったく正しくない。同じ朝日新聞系でも,withnews(ウィズニュース)は国勢調査、大量ポスティング 総務省「個人情報は漏れません」という正しい内容の記事を配信している。

朝日新聞は,ネット回答が締め切られた21日になってから,国勢調査のネット回答、個人情報漏れは大丈夫?という事実上の訂正記事を配信した。ただ,やはり不安を煽るような書き方になっている:「とはいえ、それでも漏れる危険があるといい、専門家は注意を呼びかけています。元のPWと酷似したPWを登録したりする人もいるからです。この傾向を利用し、ハッカーなどは変更済みのPWを類推するのです。セキュリティー問題に詳しい森井昌克・神戸大大学院教授は「類推したPWで不正アクセスやサイバー攻撃が行われたケースもある」と話します」。

念のため書けば,元のパスワードと類似したパスワードを登録することへの対策としては,「注意を呼びかける」のではなく,システムで類似のパスワードを受け付けないようにするのが正しい方法である(今回の国勢調査システムがそうなっているかどうかは不明)。


国勢調査は国・地域の実態を調べるための最も重要な統計調査である。その根拠は統計法で定められており,拒んだり嘘の回答をしたりしてはならない(法律上は罰則があるが,適用事例はなく,罰則を積極的に周知もしていない)。戸籍や住民基本台帳ではわからない生活の実態を調べるためのものであり,現状をそのまま回答すればよい。調査員など関係者には守秘義務が課せられており,回答内容が税務署や警察に流されることはない。マイナンバーなどと紐付けされることもない。

住民基本台帳の人口と,国勢調査の人口は,地域によっては大きく乖離している。選挙区の画定,議員定数の決定,地方交付税の算定などの基準となる「法定人口」は,国勢調査による人口である。もし回答を拒否した場合は,少なくとも人数・性別・氏名だけでも把握するために,ご近所の人への聞き取りなどをしなければならず,調査員の負担が大きくなる。

総務省の平成27年国勢調査におけるオンライン調査の実施状況によれば,1917万5769件のネット回答があった。当初目標の2倍近い。前回の国勢調査の世帯数(5195万0504世帯)をもとに試算すると,36.9%の世帯がネットで回答したことになる。東京都が異常に低いのが目立つ(26.0%)。日本地図参照。東京は以前の紙の調査でも回答率が異常に低い(平成17年国勢調査の聞き取り調査等の状況及び「国勢調査の実施に関する有識者懇談会」における検討状況の「所定期間内に調査票が提出されなかった世帯の割合」で東京都は13.3%で,全国平均4.4%を大きく上回る)。なお,スマートフォンからの回答は663万0039件で,PC:スマホ=2:1程度である。

なお,ネット回答可能な期間については,当初から9月10日〜9月20日・9月26日〜10月20日が予定されていたようであるが,情報が錯綜していた。公式サイトや大部分の自治体ページには9月10日〜9月20日としか載っていないが,例えば世田谷区には9月26日〜10月20日にも回答できると書かれており,最初に配布された封筒にも赤で明記されている(写真)。一方, Read More

BOOKSCANから自動ダウンロード

BOOKSCANは1冊100円からでスキャンを請け負ってくれる会社。

ただし,最低価格だと,スキャンされたPDFはWebからダウンロードするしかない。これが遅く,複数ファイルを同時ダウンロードできない。

ダウンロードすべきファイルのURL一覧は,ダウンロードページをスクレープすればすぐに得られる。ただ,認証が必要であるため,まずはGoogle Chromeでログインしてから「cookies.txt」という拡張機能を使ってクッキーをcookies.txt形式エクスポートし,それをwgetで使う:

wget --load-cookies cookies.txt 'https://system.bookscan.co.jp/download.php?....pdf'

cookies.txtの形式はここ参照。

念のため,BOOKSCANの一覧ページのソースから上のようなスクリプトを生成するRubyコード:

while line = gets() if line =~ /<a href="(download\.php.*?&f=(.*\.pdf))"/ puts 
      
      Read More
    

twittering-mode

Emacs上で動くTwitterアプリtwittering-modeを久しぶりに使ってみた。

インストールは簡単。上のサイトから twittering-mode.el をいただいてきて,load-pathの通っているところ(通常はsite-lispの中)に置く。~/.emacs.d/init.el には最低限次のように書く。

(require 'twittering-mode)

これで M-x twit とすれば動作する。

最初 .curlrc を設定していたのでうまく動作しなかった。これは何とかしてほしい(追記:とりあえず curl-args に "--no-remote-name" を加えたら直ったようだ)。

日本語の説明がこちらにもある。

設定の例を示す:

(require 'twittering-mode) (
      
      Read More
    

SONYデジタルペーパーDPT-S1

SONYデジタルペーパーDPT-S1 をお借りすることができたので,いろいろ試している[追記:気に入ったので,買った]。

軽い(358g)。Kindle端末より薄い(6.8mm)。

ディスプレイのサイズは270.4mm × 202.8mmで,A4サイズ(297mm × 210mm)より若干狭いが,紙の印刷マージンを考えれば,実質A4サイズといえる。16階調グレースケール,1200×1600ピクセル,150ppiの画面は,近づいて見るとやや粗いが,eジャーナルや自炊本を読むには十分である。

本体の空き容量は約2.8GBだが,microSD/microSDHCカードで最大32GB増やすことができる。

電磁誘導方式のペンにより,PDFに書き込むことができるのがおもしろい。書き込んだPDFをパソコンに転送しても書き込みが残る。つまりPDFが上書きされる。

マイクロUSB端子により,充電・ファイル転送ができる。USBケーブル・電源アダプタが付属している。充電時間は,電源アダプタなら2.5時間,PC接続なら3.5時間。

電源スイッチを押してから起動までに30秒,シャットダウン(電源ボタン長押し→[はい])に30秒かかる。通常は電源オンオフではなくスリープ(電源ボタン短押し)を使う。起動・スリープ解除のパスワードを設定することができるだけでなく,内部ストレージの暗号化もできる。

下の図は拙著『LaTeX2e美文書作成入門』第6版PDFを表示したところである。

表示例

Read More

Jekyllでブログ構築中

Jekyll Now に書いてある通りにしたら,できたっぽい。

# 初めてgitを使う場合の設定(~/.gitconfigに書き込まれる) git config --global user.name "Haruhiko Okumura" git config --global user.email "だれだれ@どこどこ" git config --global core.editor "emacsclient" # 例えば # Jekyll Nowをフォークして okumuralab.github.io にリネーム git clone...
      
Read More

Jekyllへの移行

Drupalでやっていたブログを試験的に(ローカルで)Jekyllにしてみた。コメントは拾えていないので,公開していない。

MacのRubyでちょっと試した後,CentOS 6にも最新のRubyを入れて,そちらでもやってみた。

yum install libffi-devel yum install mysql-devel tar xvzf ruby-2.2.0.tar.gz cd ruby-2.2.0 ./configure --enable-shared make make install gem install jekyll jekyll-import sequel execjs therubyracer mysql cd jekyll new blog-tmp cd blog-tmp...
      
Read More