2018年6月22日金曜日

[Python]ウェブページの文字エンコーディングをurllibで調べる

日本語のページだと文字化けになったりします。URLを開いてエンコーディングを調べる方法です。

たとえば、はてなブックマークのトップページでやってみると
 # python3
import urllib
url = 'http://b.hatena.ne.jp/'
resource = urllib.request.urlopen(url)
resource.headers.get_content_charset()

# Out
'utf-8'
となります。

https://stackoverflow.com/questions/4981977/how-to-handle-response-encoding-from-urllib-request-urlopen

0 件のコメント:

コメントを投稿