ファイルのエンコード

  1. いつも便利にMeryを使わせていただいております。
    ファイルのエンコードについて確認があります。

    日本語(シフトJIS),CR+LF(Windows)で新規ファイルを作成します。
    半角カタカナで先頭行に"ピッキングルール"とだけ書きます。
    ファイルを閉じて、再度Meryで開くとファイルのエンコードが
    日本語(EUC)と自動判定されてしまいます。

    これはどうしようもないでしょうか?

     |  PicoPicoQ  |  返信
  2. Mery をご愛用いただきありがとうございます。

    ファイルのエンコードの自動判定ですが、半角カタカナのみのシフト JIS のファイルの場合、EUC と判定されてしまうケースはあります。

    これは文字コードの自動判定においては非常に難しい問題で、結論から申し上げますとどうしようもない感じです。

    説明するとちょっと長くなってしまうのですが、細かい説明は省略してなるべくざっくり簡単に書いてみます。

    シフト JIS の半角カタカナの領域は EUC の漢字・非漢字でよく使われる領域とほぼ同じなので、半角カタカナのみのシフト JIS のファイルはシフト JIS なのか EUC なのかを判定することは難しいです。

    シフト JIS を優先するか EUC を優先するかという話になってくるのですが、それはテキストエディターの実装次第ということになります。

    Mery では、一般的に半角カタカナのみのファイルが使われることは少ないことと、EUC ではその領域の使用頻度が高いことを考慮して優先度をつけているため、「ピッキングルール」のように完全に EUC の領域のみになっている文字だけのファイルの場合、EUC と判定されてしまいます。

    シフト JIS と認識させたい場合は、ひらがなを一文字でも混ぜておくといった感じでご対応いただければと思います。

    いくつか国産のテキストエディターで試してみましたが、「ピッキングルール」のみのシフト JIS のファイルだとほとんどが EUC 判定されてしまいますね。サクラエディタさんだけはきちんとシフト JIS 判定されましたが、それはそれで逆に EUC のファイルを扱うときに誤判定が出そうな気はしますし…。

    本当、難しいです。

     |  Kuro  |  返信
  3. ざっくりとした詳しい説明でよく分かりました。
    これは、こういう物であり正常であると認識できました。
    ひらがなを1文字入れることで回避できることも確認しました。

    素晴らしいソフトをありがとうございます。
    体調を崩されませぬようご自愛ください。

    何にしても半角カタカナを使わなければ良いだけなんですけどね…(大人の事情あり)

     |  PicoPicoQ  |  返信
スポンサーリンク