スクリプツ・ラボ ホームページ
>
N-gram検索エンジン MindSearch
>
オンラインマニュアル
>
MindSearchHyperマニュアル
MindSearch Hyper マニュアル (Version 2)
システム解説
準備
オペレーションガイド
プログラミングガイド
システム解説
MindSearch概要
モジュール構成
ディレクトリ構成
処理限界値
準備
Mindのランタイムのコンパイル (Turbolinux Appliance Server 4 など一部のOSのみ必要な作業)
空きポート番号の確認
環境変数の設定、共有メモリの最大ブロック変更
オペレーションガイド
MindSearchデーモンの起動と停止
デーモンの起動
├─
プロセスの説明
├─
デーモンの起動(手動によるもの)
└─
デーモンの起動(自動起動))
デーモンの停止
開発関連ツールの使い方
msctrl(デーモン制御)
├─
インデックスのロード方法
└─
APIを使ってインデックスをロードする方法
freeshm(共有メモリの状況表示・解放)
msclient(標準対話プログラム)
msstat(稼動状態表示)
msindexinfo(インデックスファイル情報)
mscancelindex(インデックス作成の中止)
サンプルのデータ/プログラム
サンプルデータ
msclientを使ったインデックス作成と検索
├─
インデックスを作成してみる
├─
インデックスをロードする
└─
検索してみる
Perlで書いた対話プログラム(perlClient)
Javaで書いた対話プログラム(javaClient)
Perlで書いた簡易検索サイト(perlCGI)
Javaで書いた簡易検索サイト(javaCGI)
プログラミングガイド
MindSearchデーモンとの通信方法
接続
送受信
Perlの通信ライブラリ
Javaの通信ライブラリ
PHPの通信ライブラリ
文字コードについて
セッション管理とログファイル
セッション管理
同時接続するセッション数
ログファイル
アプリケーションの開始・終了時のコマンド
「INI」コマンド
レスポンスのチェック方法
「STA」コマンド(作業開始)
「FIN」「SUS」コマンド(作業終了)
「RES」コマンド(作業再開)
「CHR」コマンド(文字コード指定))
検索の仕組み
正規化
├─
フィルタ(プレーンテキスト化)
├─
文の切り出し
├─
文字の正規化
└─
キーワードの正規化
検索
├─
パターンマッチング
└─
ヒット文の出力
正規化の詳細と各種動作モード
文の切り出し
文字の正規化(記号と英字)
├─
記号の処理
├─
英字の処理
└─
漢数字と算用数字の同一視
文字の正規化(ひらがな)
└─
平仮名とカタカナの同一視
文字の正規化(カタカナ)
├─
カタカナ正規化とは
├─
「中黒外しをオン/オフ」コマンド
├─
「末尾音引き除去をオン/オフ」コマンド
├─
「カタカナ正規化レベル設定」コマンド
└─
カタカナ正規化とインデックスとの関係
「オン」「オフ」コマンド(モードの切り替え)
その他のモード設定(オン/オフ以外のもの)
├─
「最大検索数設定」コマンド
├─
「最大検索数取得」コマンド
├─
「精密検索数設定」コマンド
├─
「精密検索数取得」コマンド
├─
「エンジン側タイムアウト設定」コマンド
├─
通信文字種の指定
└─
「モード確認」コマンド
インデックス作成
検索パスの指定
├─
パスやファイル名の表記方法
├─
検索ベースパス設定
├─
検索パス設定
├─
複数の検索パスの指定
├─
検索ベースパスと検索パスとの配分
└─
検索ベースパスと検索パスの取得
インデックス生成パスの指定
インデックス作成コマンド(ファイルから作成)
├─
ファイルからインデックス作成
├─
上位URLを指定したインデックス作成
├─
代替絞り込みキーについて
└─
その他のモード指定
インデックス作成コマンド(データーベースから作成)
├─
インデックス作成コマンド
├─
インデックス作成の詳細
├─
アクションについて
├─
「レコードID」について
├─
ソートキータイプ設定
├─
絞り込みキータイプ設定
├─
ソートキー1から絞り込みキー1への自動転写
├─
代替絞り込みキーについて
├─
日時情報について
├─
その他のモード指定
├─
差分インデックシング
├─
擬似的なデーターベースのインデックス作成
└─
擬似データーベース向けのデータフォーマット
インデックス作成時のその他機能
└─
モニタ機能
フィルタ定義ファイル
├─
フィルタ定義ファイル
├─
フィルタ定義ファイルの明示
├─
特殊な指定
└─
標準装備以外のフィルタを使うには
ファイルからのインデックス作成に msclient をアプリとして使う
検索系コマンド
インデックスのロード操作
検索パスの指定
└─
検索パス設定
「検索」コマンド
├─
キーワードの表記方法
├─
キーワード中の空白文字
├─
検索コマンドとモードとの関係
├─
CHK:コマンド
├─
キーワード群の組み立て方
├─
レスポンスへの応対(GETコマンド)
├─
SS:レスポンス
├─
SB:/SR:レスポンス
├─
ヒットセンテンス出力(サマリ出力)の抑制
├─
検索結果の読み出し単位
└─
タイトルを分離出力する方法
ソート指定
絞り込み検索
代替絞り込みキーを使う検索
その他の機能
└─
「全文取得」コマンド
検索結果のシークとGET
├─
シークをおこなえるタイミング
└─
シークの方法(GET:?/GET:n コマンド)
その他のコマンド
ファイル取得
バージョン番号取得
スクリプト構文規則
Copyright(C) 2000-2009 Scripts Lab. Inc.