し+゛?の文字について

  1. どうもお世話になってます
    質問なんですが
    外国からダウンロードしたファイルでたまに
    じ
    など
    し+゛?の文字が有り
    https://imgur.com/3cHSabr
    (どの文字か覚えてませんがさしすせそたちつてとなど他の濁点の文字も)
    手持ちのソフトで文字化け?(おじさんがおしさ゛んなど変なところに゛)
    やエラーで
    扱えないのでじにリネームしてます
    Meryでリネームしようとして気になったのですが
    Meryに貼り付けるとじ一文字になり(選択は2文字)
    通常のじと区別し難くどの文字だったと迷うときがあり
    ゛をマークして探そうとしてもヒットせずしならヒットします
    これなぜ1文字ずつにならないのでしょうか?また方法はありますか?
    それともこれU+3057になってますが元々そういう文字ですか?
    よろしくお願いします

    Mery: 3.7.2 (x64, Portable)
    Onigmo: 6.2.0
    Tidy: 5.8.0
    Hunspell: 1.7.1
    アウトライン: 3.2.1 (Outline.dll)
    プロ生ちゃん: 1.1.0 (KureiKei.dll)
    半角/全角変換: 2.4.0 (Conversion.dll)
    Webプレビュー: 2.4.0 (WebPreview.dll)
    MeryCsvList: 1.08 (MeryCsvList.dll)
    MeryCsvText: 1.00 (MeryCsvText.dll)
    お気に入り2: (2.3.3-FH) (Favorites2.dll)
    Zen モード時計: 1.1.0 (ZenClock.dll)
    Markdown プレビュー: 1.0.7 (MarkdownPreview.dll)
    Tablacus Dark: 21.12.28 (tablacusdark64.dll)
    Markdown バー: 1.0.2 (MarkdownBar.dll)
    検索 バー: 1.0.6 (FindBar.dll)
    OS: Windows 10 (Version 22H2, OS Build 19045.4651, 64-bit Edition)

     |  kiyohiro  |  返信
  2. ご愛用いただきありがとうございます。

    調べてみましたところ、U+3099 (濁点) は Unicode の結合文字に分類されるようです。

    【参考】とほほの文字コード入門 - とほほのWWW入門
    https://www.tohoho-web.com/ex/charset.html#combining-character

    結合文字は、2 文字以上の文字を組み合わせて 1 文字として表示する特殊な文字です。

    Mery はこの Unicode の結合文字を正しく表示できるので、結合文字は 1 文字に結合して表示されます。

    結合文字を分割して表示したい場合、結合文字に対応していないエディターを使う必要があります。

    たとえば、TeraPad さんなら結合文字に対応していないので、「じ」(U+3057 U+3099)は結合されず、2 文字として表示されるようです。

     |  Kuro  |  返信
  3. ご回答ありがとうございます
    なるほどそんな機能があったのですね
    TeraPadさんも試しましたが
    Meryでも
    よく考えればマークでヒットしないので失念してましたが
    いちいちマークして確認せずとも
    じをじにリネーム目的なので置き換えで出来ました
    検索でもヒット

    あと
    今回のじですが
    TeraPadに貼り付けたじをMeryに貼り付けると
    U+3057 U+309Bになり結合しないですね
    また
    し+だくてんで文字変換した ゛(U+309B)結合しない
    し+濁点(U+3099)は文字変換候補になく入力方法がわからず
    濁点もU+3099やU+309Bなどややこしいですね
    何にせよ置き換えで解決しました

     |  kiyohiro  |  返信
  4. ひとまず解決したとのことで、良かったです。

    > TeraPadに貼り付けたじをMeryに貼り付けると
    > U+3057 U+309Bになり結合しないですね

    なるほど、これは失礼しました。

    TeraPad さんのツイートで、結合文字などでファイルを壊さないように配慮した、との旨が書かれていたので、内部的に U+3099 を U+309B に置き換えることで結合文字を処理しているのかもしれないですね。

    > し+濁点(U+3099)は文字変換候補になく入力方法がわからず

    Mery では、「しU+3099」という文字列を入力し、その後に Alt + X (または、[編集] > [選択範囲の変換] > [文字コードの切り替え]) で入力できます。

     |  Kuro  |  返信
  5. >Mery では、「しU+3099」という文字列を入力し、その後に Alt + X (または、[編集] > [選択範囲の変換] > [文字コードの切り替え]) で入力できます。

    区別のためか表示出来ないのかわかりませんが文字コードがのってる場合とか
    入力方法わからない文字とかあるし
    今回のようなじは分解して調べられるしこの機能便利ですね
    確かにしU+3099になりました
    文字コードの切り替えのキーは何故か空白だったのでAlt + Xに登録しました

     |  kiyohiro  |  返信
スポンサーリンク