𠮟 U+20B9F の強調表示
-
文化庁常用漢字表2136字中、Shift-JIS では表示できない文字が四字あります。
最初の三文字は着色表示できたのですが、最後の 𠮟 U+20B9F (しかる) だけ、着色表示できないでいます。
ご存じの方がおられたら、ご教示ください。
目的:Meiryo UI と イワタ明朝(JIS90字形) を交互に使い分けているため。
> 塡剝頰 𠮟| Peggy | 返信 -
> 塡剝頰 𠮟
Mery で [既定のエンコード] を [日本語 (シフト JIS)] に設定し、 [ファイル] → [新規作成] を実行。
この状態で、上記の 4 文字をコピーして Mery に貼り付けてみたところ、最後の「𠮟」(U+20B9F) も問題なく着色されました。
「𠮟」(U+20B9F) と「叱」(U+53F1) は見た目がよく似ているため、着色されていない場合は、念のため該当の文字コードをご確認ください。
「𠮟」を選択した状態で
Alt + Xを押すか、 [編集] → [選択範囲の変換] → [文字コードの切り替え] を使うと、文字と文字コードを相互に変換できます。【検証環境】
Mery: 3.7.16 (x64, Portable)
Onigmo: 6.2.0
C/Migemo: 1.3
Tidy: 5.8.0
Hunspell: 1.7.1
uchardet: 0.0.8
アウトライン: 3.2.3 (Outline.dll)
OS: Windows 11 (Version 24H2, OS Build 26100.4061, 64-bit Edition)| Kuro | 返信 -
鬼雲 文字コード正規表現 で検索したら、ようやくそれらしいサイトにヒットして解決しました。
https://github.com/k-takata/Onigmo/blob/master/doc/RE.ja
\x{7HHHHHHH} 拡張十六進数表現 コードポイント値
\uHHHH 拡張十六進数表現 コードポイント値
----
[\x{0020b9f}\u9830\u525d\u5861]
𠮟のコードは五桁(U+20B9F)。四桁の表示とは体裁が違うようです。先頭にゼロを二つ並べて七桁にしたら、
常用漢字2136字中の四文字(Shift-JISでは保存出来ない字)を着色表示出来ました。
やっと、解決しました。お騒がせしました。| Peggy | 返信 -
> 鬼雲 文字コード正規表現 で検索したら、ようやくそれらしいサイトにヒットして解決しました。
なるほど、鬼雲のお話だったのですね。最初に「鬼雲」や「正規表現」っていうワードが出ていれば、もうちょっとお力になれたかもしれません。
てっきり、Mery 標準の文字コードチェック機能のお話かと思ってました。
でも、解決されたようで良かったです。
| Kuro | 返信 -
舌足らずですいませんでした。
文字コードは普段ステータスバーに表示されていても、あまり意識することもないですが、コードが四桁と五桁で書き方が変わるのには分からず、あれこれ探し回っていました。正規表現に関する話題は大量にあり、思わず見入っていました。
お騒がせしました。| Peggy | 返信