サイト内の文字コード関連(文字コード判定/文字コード変換)のページを集めました。
WEBエンコード/デコードツール URLデコード/エンコード方法 HTMLデコード/エンコード方法
URLエンコード(GETパラメタのみ可)/URLデコード/HTMLエンコード/HTMLデコード/文字コード表示
文字コード判定&変換ツール.NET
SJIS/JIS/EUC/UNICODE/UTF-7/UTF-8対応。File/Folder(SubFolder)可。コマンドライン/送るメニュー可。
文字コード判定/変換ツール(VB6のソース付)
SJIS、JIS、EUC、UNICODE(UTF-16)、UTF-7、UTF-8の文字コード判定/変換(コマンドライン可)
文字コードを変換する方法
ネット時代の現在は、いろんな文字コードのOSがインターネットに繋がっているため、ダウンロードしたファイルの文字コード
が自分が使っているOSの文字コードと異なる事があります。また、大手サイトのWEBページは文字コードにUTF−8を
使っている事が多いです・・・
文字コード表示ツールについて
ある文字の文字コードを調べる時に、今まではその文字が含まれるテキストファイルを作りバイナリエディタで表示して文字コードを確認していました。
面倒でしたが、それが手っ取り早かったのです。
最近ちょっとやる気になり、文字コード表示ツールを作る事にしました。概要は「入力した文字の文字コードを表示するツール」・・・
文字コードを判定して指定の文字コードに変換するサンプル(VB.NET)
文字コードを自動判定(判別と言うべきか?)して指定の文字コードに変換するサンプルです。
文字コードの変換にはVB.NETのSystem.Text.Encodingを使用しています。
System.Text.Encodingを使用する事で簡単に文字コードの変換が出来るようです。
フォルダ内の文字コード一覧を表示するサンプル(VB.NET)
指定フォルダ内に存在する全てのファイルの文字コードを判定(判別)し一覧表示するサンプルです。
「文字コード判定のサンプル(VB6/VB.NET)」を使用しています。
文字コード判定のサンプル(VB6/VB.NET)
文字コード判定のサンプル(VB6)は以下の流れで文字コードを判定しています。
100%完璧な文字コード判定は難しいですが出来るだけ精度の高い判定を目指しています。
努力の甲斐あって、判定精度が上がって来たように感じます。。が如何でしょうか。。。
ADODB.Streamによる文字コード変換のサンプル(VB6/VB.NET)
ADODB.Streamを使用しSJIS、JIS、EUC、UTF-7、UTF-8 からVB6内部文字コードであるUNICODE(UTF-16)に変換します。
また、UNICODEからの逆変換もします。
全ての文字コードをUNICODEに変換出来て、その逆変換も出来れば全ての文字コード間の変換がUNICODEを通して出来る事になります。
UNICODEを通す事による処理速度等は気にしていません。
WideCharToMultiByteとMultiByteToWideCharによる文字コード変換のサンプル(VB6/VB.NET)
WideCharToMultiByteとMultiByteToWideCharを使用しSJIS、JIS、EUC、UTF-7、UTF-8からVB6内部文字コードであるUNICODE(UTF-16)に変換します。
また、UNICODEからの逆変換もします。
全ての文字コードをUNICODEに変換出来て、その逆変換も出来れば全ての文字コード間の変換がUNICODEを通して出来る事になります。
UNICODEを通す事による処理速度等は気にしていません。
WideCharToMultiByteとMultiByteToWideCharによる方法はADODB.Streamによる方法よりも文字化けが気になりますが、そう言うものなのでしょう。
文字コード変換クラスのサンプル(VB6)
「ADODB.Streamによる文字コード変換のサンプル」のモジュールと「WideCharToMultiByteとMultiByteToWideCharによる文字コード変換のサンプル」のモジュールを使用し
SJIS、JIS、EUC、UTF-7、UTF-8からVB6内部文字コードであるUNICODE(UTF-16) に変換します。
またUNICODEからの逆変換もします。
全ての文字コードをUNICODE に変換出来て、その逆変換も出来れば全ての文字コード間の変換がUNICODEを通して出来る事になります。
UNICODEを通す事による処理速度等は気にしていません。
その他の機能としては「文字コード判定のサンプル」のモジュールによる文字コード判定、BOM 付加/削除、改行コードがあります。100%完璧な文字コード判定は難しいですが出来るだけ精度の高い判定を目指しています。
BOMとはUNICODEやUTF-8を判別するためにファイルの先頭付くコードで、UNICODEの時は&HFF,&HFE、UTF-8の時は&HEF,&HBB,&HBF です。
|