単語を抽出

提供: MeryWiki
移動先: 案内検索

文書から単語を抽出します。

// -----------------------------------------------------------------------------
// 単語を抽出
//
// Copyright (c) Kuro. All Rights Reserved.
// www:    http://www.haijin-boys.com/
// -----------------------------------------------------------------------------
 
// 単語の区切りでぶった切って昇順に並べ替える
var s1 = document.Text.split(/[^0-9A-Z_a-z]+?/).sort();
var s2  = new Array();
// 重複する単語と数字で始まる単語は除外する
var r = new RegExp("^[0-9]+?", "i");
for (var i = 0; i < s1.length; i++) {
    if (i == 0 || s1[i-1] != s1[i])
        if (!r.exec(s1[i]))
            s2.push(s1[i]);
}
editor.NewFile();
// 大文字小文字を無視して昇順に並べ替える
editor.ActiveDocument.Text = s2.sort(function(a, b) {
    var s1 = a.toLowerCase();
    var s2 = b.toLowerCase();
    return ((s1 < s2) ? -1 : ((s1 > s2) ? 1 : 0));
}).join("\n");