読者です 読者をやめる 読者になる 読者になる

uyamazakのブログ

仕事中の問題と解決メモ。PythonとGoogle Cloudがメイン。bizoceanで新規事業の企画と開発担当。 BigQueryを使ったビッグデータ収集・解析・リアルタイム処理プロジェクト進行中 https://github.com/uyamazak/oceanus

Google Cloud Datalab(jupyter)で日本語の文字コードエラーを止める

Python3を使うようになってから、全然苦労しなくなった文字コード周りのエラーだけど、DatalabはPython2。

日本語使いとしては、いい加減Googleも3系に移行してほしいんだけどしょうがない。英語環境だと困らないんだろうな。


BigQueryから取ってきたデータ内に日本語があると、jupyter上の表示は問題ないけど、to_fileや、文字列連結などをしようとすると下記エラーが出る


UnicodeEncodeError: 'ascii' codec can't encode characters in position 1-3: ordinal not in range(128)

実行する前に下記追加で直った

import sys
reload(sys)
sys.setdefaultencoding("utf-8")