Python chardetライブラリで文字列のエンコーディングを取得する方法

環境
Python 3.9.13
Windows 10 Home 64bit
PyCharm 2022.2.1 (Community Edition)

構文
1.「chardet」ライブラリをインストールします
pip install chardet
2. chardet.detect(文字列)
chardet.detect()関数を使って文字列の文字コードを取得します。

使用例

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
import chardet
def funA(str):
#文字コードの取得
res = chardet.detect(str)
return res['encoding']
#文字コードをUTF-8に変換
str = 'テスト'.encode('utf-8')
print(funA(str))
#文字コードをshift_jisに変換
strB = 'あいうえお'.encode('shift_jis')
print(funA(strB))
import chardet def funA(str): #文字コードの取得 res = chardet.detect(str) return res['encoding'] #文字コードをUTF-8に変換 str = 'テスト'.encode('utf-8') print(funA(str)) #文字コードをshift_jisに変換 strB = 'あいうえお'.encode('shift_jis') print(funA(strB))
import chardet

def funA(str):
      #文字コードの取得
      res = chardet.detect(str)
      return res['encoding']

#文字コードをUTF-8に変換
str = 'テスト'.encode('utf-8')
print(funA(str))

#文字コードをshift_jisに変換
strB = 'あいうえお'.encode('shift_jis')
print(funA(strB))

実行結果
utf-8
Windows-1252

Python

Posted by arkgame