UTF-8のU+10000以上に関する処理について

  1. 初めまして。Meryをいつも愛用しております。
    多機能で使いやすく、動作の軽さも大変助かっております。

    ただ、1つだけ気がついた点があるので。
    U+10000以上の文字を扱ったとき、サロゲート文字が2文字表示されるのは
    どうにかならないでしょうか?
    特にUTF-8で保存した時にそのままというのは、
    UTF-8の規格から外れているそうですので、セキュリティ上に問題があるそうで。
    ここを改善していただければ、他のテキストエディタがいらなくなるんですが…。

     |  wani!  |  返信
  2. はじめまして、ご愛用ありがとうございます。

    > 多機能で使いやすく、動作の軽さも大変助かっております。

    最近は何のためにテキストエディタなんて開発してるんだ、と苦悩の日々、、、なんてのは
    冗談ですが、こうしてご愛用して頂いて嬉しいお言葉を頂くことでとっても励みになります!

    > ただ、1つだけ気がついた点があるので。
    > U+10000以上の文字を扱ったとき、サロゲート文字が2文字表示されるのは
    > どうにかならないでしょうか?

    サロゲートですか、ハイ・・・。申し訳ございませんが、対応していません。
    今後もたぶん、無理かと思います。

    > 特にUTF-8で保存した時にそのままというのは、
    > UTF-8の規格から外れているそうですので、セキュリティ上に問題があるそうで。
    > ここを改善していただければ、他のテキストエディタがいらなくなるんですが…。

    Meryのエディタエンジンとして使用させて頂いているTNotePadですが、これが
    そもそもサロゲートペアには一切手出ししないことで、データも破壊しないという仕様のようですので。
    サロゲートペアを扱う作業をされるのであれば、きちんと対応しているテキストエディタを使用されたほうが
    良いかと思います。。。力不足で申し訳ない限りです。。。

     |  Kuro  |  返信
  3. > サロゲートですか、ハイ・・・。申し訳ございませんが、対応していません。
    > 今後もたぶん、無理かと思います。

    > Meryのエディタエンジンとして使用させて頂いているTNotePadですが、これが
    > そもそもサロゲートペアには一切手出ししないことで、データも破壊しないという仕様のようですので。
    > サロゲートペアを扱う作業をされるのであれば、きちんと対応しているテキストエディタを使用されたほうが
    > 良いかと思います。。。力不足で申し訳ない限りです。。。

    なるほど、エディタエンジンの問題だったのですね。原因が分かって安心しました。
    しかしそれでも、使いやすさと機能のバランスでMeryを必要としていることが非常に多いですし
    今後も末永く使いたいエディタです。ご返答ありがとうございました。

     |  wani!  |  返信
  4. ほんと、申し訳ないです。。。

    > なるほど、エディタエンジンの問題だったのですね。原因が分かって安心しました。
    > しかしそれでも、使いやすさと機能のバランスでMeryを必要としていることが非常に多いですし
    > 今後も末永く使いたいエディタです。ご返答ありがとうございました。

    ご理解のほど感謝します。
    サロゲートて規格自体がアレな感じですし、きっちり対応してるテキストエディタがあるのか分かりませんが・・・。

     |  Kuro  |  返信
  5. > サロゲートて規格自体がアレな感じですし、きっちり対応してるテキストエディタがあるのか分かりませんが・・・。

    U+10000以上の表示に対応しているエディタではGreenPadとかNotepad2(海外産)などがありますね。
    ただ、あちらもあちらでU+10000を使った極端に短い文章をUTF-8で保存すると、
    開いた時にS-JISと誤認してほぼ全部文字化けするもっと深刻な現象がありますが…(Meryにはないです)

     |  wani!  |  返信
  6. > U+10000以上の表示に対応しているエディタではGreenPadとかNotepad2(海外産)などがありますね。

    おお!両者ともにシンプルで、好感が持てるテキストエディタですね。
    GreenPad、ソースも公開されてるんですね、スゴイ。こりゃ参考になりそうです。

    > ただ、あちらもあちらでU+10000を使った極端に短い文章をUTF-8で保存すると、
    > 開いた時にS-JISと誤認してほぼ全部文字化けするもっと深刻な現象がありますが…(Meryにはないです)

    やっぱサロゲの対応って難しいんでしょうね。。。特に外国語になると二文字で一文字になる文字とか
    フォントによって描画の動作が変わる文字とか、涙が出そうになるぐらいやらなきゃいけないことが多そうです。

     |  Kuro  |  返信