仕事中の問題と解決メモ。

最近はPythonとGoogle Cloud Platformがメイン。株式会社ビズオーシャンで企画と開発運用、データ活用とか。https://github.com/uyamazak/

Google Cloud Datalab(jupyter)で日本語の文字コードエラーを止める

Python3を使うようになってから、全然苦労しなくなった文字コード周りのエラーだけど、DatalabはPython2。

日本語使いとしては、いい加減Googleも3系に移行してほしいんだけどしょうがない。英語環境だと困らないんだろうな。


BigQueryから取ってきたデータ内に日本語があると、jupyter上の表示は問題ないけど、to_fileや、文字列連結などをしようとすると下記エラーが出る


UnicodeEncodeError: 'ascii' codec can't encode characters in position 1-3: ordinal not in range(128)

実行する前に下記追加で直った

import sys
reload(sys)
sys.setdefaultencoding("utf-8")