「
文章で使用されている文字をユニーク抽出
」を編集中
2018年6月6日 (水) 22:43時点における
Admin
(
トーク
|
投稿記録
)
による版
(ページの作成:「== 概要 == 日本語 Web フォントをサブセット化するときに[https://opentype.jp/subsetfontmk.htm サブセットフォントメーカー]で設定する...」)
(差分) ← 古い版 |
最新版
(
差分
) |
新しい版 →
(
差分
)
ナビゲーションに移動
検索に移動
警告: このページの古い版を編集しています。
公開すると、この版以降になされた変更がすべて失われます。
警告:
ログインしていません。編集を行うと、あなたの IP アドレスが公開されます。
ログイン
または
アカウントを作成
すれば、あなたの編集はその利用者名とともに表示されるほか、さまざまなメリットもあります。
スパム攻撃防止用のチェックです。 決して、ここには、値の入力は
しない
でください!
== 概要 == 日本語 Web フォントをサブセット化するときに[https://opentype.jp/subsetfontmk.htm サブセットフォントメーカー]で設定する「フォントに格納する文字」を生成したかったので作ってみました。 Mery で開いている文書で使用されている文字を抽出してソートして重複を取り除きます。データベースからブログ記事をすべて出力したものにこのマクロをかければ、サブセット化で使えるユニーク文字に変換できます。 データが大きければそれなりに時間がかかりますが、25MB のテキストファイルで 2 分ぐらいでした。 サロゲートペアに対応していますが、IVS には対応していません。(サブセット化するのに IVS いりませんよね…) <source lang="javascript"> if (document.selection.Text == "") document.selection.SelectAll(); var s1 = document.selection.Text.match(/[\uD800-\uDBFF][\uDC00-\uDFFF]|[\s\S]|^$/g).filter(Boolean).sort(); var s2 = new Array(); for (var i = 0; i < s1.length; i++) { if (i == 0 || s1[i-1] != s1[i]) s2.push(s1[i].trim()); } document.selection.Text = s2.join(""); </source> ついでに、「第一水準漢字、記号、ローマ字、カタカナ、ひらがな」です。サブセットフォントメーカーに以下のテキストを貼り付けて、そのテキストの末尾にこのマクロで抽出した文字列を追記するだけです。 重複する文字が含まれていてもサブセットフォントメーカーは自動で取り除いてくれるようですので、出来上がったフォントファイルのサイズに影響はありません。
編集内容の要約:
MeryWikiへの投稿はすべて、他の投稿者によって編集、変更、除去される場合があります。 自分が書いたものが他の人に容赦なく編集されるのを望まない場合は、ここに投稿しないでください。
また、投稿するのは、自分で書いたものか、パブリック ドメインまたはそれに類するフリーな資料からの複製であることを約束してください(詳細は
MeryWiki:著作権
を参照)。
著作権保護されている作品は、許諾なしに投稿しないでください!
このページを編集するには、下記の数式を計算してその答えを欄に入力してください (
ヘルプ
):
いちたすには =
キャンセル
編集ヘルプ
(新しいウィンドウで開きます)
スポンサーリンク
ナビゲーション メニュー
個人用ツール
ログインしていません
トーク
投稿記録
アカウント作成
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
編集
履歴表示
その他
検索
スポンサーリンク
スポンサーリンク
案内
メインページ
ヘルプ
よくある質問
マクロリファレンス
マクロライブラリ
プラグインライブラリ
構文ファイル
テーマ
寄付・開発支援
練習用ページ
開発室
開発者のブログ
ツール
スポンサーリンク