Python3を使うようになってから、全然苦労しなくなった文字コード周りのエラーだけど、DatalabはPython2。
日本語使いとしては、いい加減Googleも3系に移行してほしいんだけどしょうがない。英語環境だと困らないんだろうな。
BigQueryから取ってきたデータ内に日本語があると、jupyter上の表示は問題ないけど、to_fileや、文字列連結などをしようとすると下記エラーが出る
UnicodeEncodeError: 'ascii' codec can't encode characters in position 1-3: ordinal not in range(128)
実行する前に下記追加で直った
import sys reload(sys) sys.setdefaultencoding("utf-8")