FreeBSD QandA 1254

FreeBSD QandA

Q. ファイル中に使われている日本語部分の文字コードの種類を知るには
   どうしたらいいですか?

A. port/package に textproc/coco というアプリケーションがあります
   (元々は mule に付属していたコマンドで、2002年3月に独立した port
    になりました。textproc/coco が見つからなければ mule をインストール
    してください)。

   EUC・JIS・SJIS のファイルを読ませると、それぞれ
     % coco -q < file-euc
     In (*euc-china*unix):   3209 bytes
     % coco -q < file-jis
     In (*junet*unix):   3221 bytes
     % coco -q < file-sjis
     In (*sjis*unix):   3209 bytes
   と出力します。

   なお、実際は日本語 EUC コードであるのにも関わらず、euc-china と判定して
   しまうというバグがあります。

   他にも、
     jless を起動して C-g
     ack -c 
     kcc -c
     wkf -c
     kanji-type    (むかし fj.sources に流れた)
     jcode.pl      (単体のコマンドではないが、perl script 中で 
                    &jcode::getcode(*line) で判定可能)
   などの方法があります。

   ファイルの文字コードを変換するには [管理番号 1253] を参照してください。

同一グループへのリンク

グループ名: kanji-code

[管理番号 663] Q.muleを使って、漢字コードを変換したいのですが。A. ファイルをセーブする...
[管理番号 1253] Q.ファイルの文字コードを変換したいのですが。A.nkf、qkc あるいは ic...
[管理番号 1254] Q.ファイル中に使われている日本語部分の文字コードの種類を知るにはどうしたらいい...
[管理番号 1289] Q.新規ファイルをエディタで作成したときの、文字コード (JIS、EUC など)...

間違い・追加情報を見付けた場合は、修正案の投稿のしかたを読んだ上で、
QandA@jp.FreeBSD.org までお知らせください。

このQandAの更新履歴 (CVSweb)
最終更新: 2002/03/07 15:32:11