𠮟 U+20B9F の強調表示

  1. 文化庁常用漢字表2136字中、Shift-JIS では表示できない文字が四字あります。
    最初の三文字は着色表示できたのですが、最後の 𠮟 U+20B9F (しかる) だけ、着色表示できないでいます。
    ご存じの方がおられたら、ご教示ください。
    目的:Meiryo UI と イワタ明朝(JIS90字形) を交互に使い分けているため。
    > 塡剝頰 𠮟

     |  Peggy  |  返信
  2. > 塡剝頰 𠮟

    Mery で [既定のエンコード] を [日本語 (シフト JIS)] に設定し、 [ファイル] → [新規作成] を実行。

    この状態で、上記の 4 文字をコピーして Mery に貼り付けてみたところ、最後の「𠮟」(U+20B9F) も問題なく着色されました。

    「𠮟」(U+20B9F) と「叱」(U+53F1) は見た目がよく似ているため、着色されていない場合は、念のため該当の文字コードをご確認ください。

    「𠮟」を選択した状態でAlt + Xを押すか、 [編集] → [選択範囲の変換] → [文字コードの切り替え] を使うと、文字と文字コードを相互に変換できます。

    【検証環境】

    Mery: 3.7.16 (x64, Portable)
    Onigmo: 6.2.0
    C/Migemo: 1.3
    Tidy: 5.8.0
    Hunspell: 1.7.1
    uchardet: 0.0.8
    アウトライン: 3.2.3 (Outline.dll)
    OS: Windows 11 (Version 24H2, OS Build 26100.4061, 64-bit Edition)

     |  Kuro  |  返信
  3. 鬼雲 文字コード正規表現 で検索したら、ようやくそれらしいサイトにヒットして解決しました。

    https://github.com/k-takata/Onigmo/blob/master/doc/RE.ja
    \x{7HHHHHHH} 拡張十六進数表現 コードポイント値
    \uHHHH 拡張十六進数表現 コードポイント値
    ----
    [\x{0020b9f}\u9830\u525d\u5861]
    𠮟のコードは五桁(U+20B9F)。四桁の表示とは体裁が違うようです。先頭にゼロを二つ並べて七桁にしたら、
    常用漢字2136字中の四文字(Shift-JISでは保存出来ない字)を着色表示出来ました。
    やっと、解決しました。お騒がせしました。

     |  Peggy  |  返信
  4. > 鬼雲 文字コード正規表現 で検索したら、ようやくそれらしいサイトにヒットして解決しました。

    なるほど、鬼雲のお話だったのですね。最初に「鬼雲」や「正規表現」っていうワードが出ていれば、もうちょっとお力になれたかもしれません。

    てっきり、Mery 標準の文字コードチェック機能のお話かと思ってました。

    でも、解決されたようで良かったです。

     |  Kuro  |  返信
  5. 舌足らずですいませんでした。
    文字コードは普段ステータスバーに表示されていても、あまり意識することもないですが、コードが四桁と五桁で書き方が変わるのには分からず、あれこれ探し回っていました。正規表現に関する話題は大量にあり、思わず見入っていました。
    お騒がせしました。

     |  Peggy  |  返信
スポンサーリンク