GAミント至上主義

コストにうるさいWEBアプリ開発者。最近はPython, Vue.js, Kubernetesがメイン@株式会社ビズオーシャン。https://github.com/uyamazak/

Google Cloud Datalab(jupyter)で日本語の文字コードエラーを止める

Python3を使うようになってから、全然苦労しなくなった文字コード周りのエラーだけど、DatalabはPython2。

日本語使いとしては、いい加減Googleも3系に移行してほしいんだけどしょうがない。英語環境だと困らないんだろうな。


BigQueryから取ってきたデータ内に日本語があると、jupyter上の表示は問題ないけど、to_fileや、文字列連結などをしようとすると下記エラーが出る


UnicodeEncodeError: 'ascii' codec can't encode characters in position 1-3: ordinal not in range(128)

実行する前に下記追加で直った

import sys
reload(sys)
sys.setdefaultencoding("utf-8")