スクリプツ・ラボ ホームページ > N-gram検索エンジン MindSearch > オンラインマニュアル > MindSearchFuzzyマニュアル



MindSearch Fuzzy マニュアル (Version 3.1)



システム解説   準備   オペレーションガイド   プログラミングガイド  





システム解説

MindSearch概要

モジュール構成

ディレクトリ構成

処理限界値



準備


Mindのランタイムのコンパイル (Turbolinux Appliance Server 4 など一部のOSのみ必要な作業)

空きポート番号の確認

環境変数の設定、共有メモリの最大ブロック変更



オペレーションガイド

MindSearchデーモンの起動と停止


デーモンの起動
  ├─プロセスの説明
  ├─デーモンの起動(手動によるもの)
  └─デーモンの起動(自動起動))


デーモンの停止



開発関連ツールの使い方


msctrl(デーモン制御)
  ├─インデックスのロード方法
  └─APIを使ってインデックスをロードする方法


freeshm(共有メモリの状況表示・解放)


msclient(標準対話プログラム)


msstat(稼動状態表示)


msindexinfo(インデックスファイル情報)


mscancelindex(インデックス作成の中止)



サンプルのデータ/プログラム


サンプルデータ


msclientを使ったインデックス作成と検索
  ├─インデックスを作成してみる
  ├─インデックスをロードする
  └─検索してみる


Perlで書いた対話プログラム(perlClient)


Javaで書いた対話プログラム(javaClient)


Perlで書いた簡易検索サイト(perlCGI)


Javaで書いた簡易検索サイト(javaCGI)



プログラミングガイド

MindSearchデーモンとの通信方法


接続


送受信


Perlの通信ライブラリ


Javaの通信ライブラリ


PHPの通信ライブラリ


文字コードについて



セッション管理とログファイル


セッション管理


同時接続するセッション数


ログファイル



アプリケーションの開始・終了時のコマンド


「INI」コマンド


レスポンスのチェック方法


「STA」コマンド(作業開始)


「FIN」「SUS」コマンド(作業終了)


「RES」コマンド(作業再開)


「CHR」コマンド(文字コード指定))

検索の仕組み


正規化
  ├─フィルタ(プレーンテキスト化)
  ├─文の切り出し
  ├─文字の正規化
  └─キーワードの正規化


検索
  ├─パターンマッチング
  └─ヒット文の出力


正規化の詳細と各種動作モード


文の切り出し


文字の正規化(記号と英字)
  ├─記号の処理
  ├─英字の処理
  └─漢数字と算用数字の同一視


文字の正規化(ひらがな)
  └─平仮名とカタカナの同一視


文字の正規化(カタカナ)
  ├─カタカナ正規化とは
  ├─「中黒外しをオン/オフ」コマンド
  ├─「末尾音引き除去をオン/オフ」コマンド
  ├─「カタカナ正規化レベル設定」コマンド
  └─カタカナ正規化とインデックスとの関係


「オン」「オフ」コマンド(モードの切り替え)


その他のモード設定(オン/オフ以外のもの)
  ├─「最大検索数設定」コマンド
  ├─「最大検索数取得」コマンド
  ├─「精密検索数設定」コマンド
  ├─「精密検索数取得」コマンド
  ├─「エンジン側タイムアウト設定」コマンド
  ├─通信文字種の指定
  └─「モード確認」コマンド

インデックス作成


検索パスの指定
  ├─パスやファイル名の表記方法
  ├─検索ベースパス設定
  ├─検索パス設定
  ├─複数の検索パスの指定
  ├─検索ベースパスと検索パスとの配分
  └─検索ベースパスと検索パスの取得


インデックス生成パスの指定


インデックス作成コマンド(ファイルから作成)
  ├─ファイルからインデックス作成
  ├─上位URLを指定したインデックス作成
  ├─代替絞り込みキーについて
  └─その他のモード指定


インデックス作成コマンド(データーベースから作成)
  ├─インデックス作成コマンド
  ├─インデックス作成の詳細
  ├─アクションについて
  ├─「レコードID」について
  ├─ソートキータイプ設定
  ├─絞り込みキータイプ設定
  ├─ソートキー1から絞り込みキー1への自動転写
  ├─代替絞り込みキーについて
  ├─日時情報について
  ├─その他のモード指定
  ├─差分インデックシング
  ├─擬似的なデーターベースのインデックス作成
  └─擬似データーベース向けのデータフォーマット


インデックス作成時のその他機能
  └─モニタ機能


フィルタ定義ファイル
  ├─フィルタ定義ファイル
  ├─フィルタ定義ファイルの明示
  ├─特殊な指定
  └─標準装備以外のフィルタを使うには


ファイルからのインデックス作成に msclient をアプリとして使う

検索系コマンド


インデックスのロード操作


検索パスの指定
  └─検索パス設定


「検索」コマンド
  ├─キーワードの表記方法
  ├─キーワード中の空白文字
  ├─検索コマンドとモードとの関係
  ├─CHK:コマンド
  ├─キーワード群の組み立て方
  ├─レスポンスへの応対(GETコマンド)
  ├─SS:レスポンス
  ├─SB:/SR:レスポンス
  ├─ヒットセンテンス出力(サマリ出力)の抑制
  ├─検索結果の読み出し単位
  └─タイトルを分離出力する方法


ソート指定


(曖昧検索) ヒット率を加味したソート


絞り込み検索


代替絞り込みキーを使う検索


(曖昧検索) 最低合致率設定


(曖昧検索) 曖昧検索キーワード最小文字数設定


その他の機能
  └─「全文取得」コマンド


検索結果のシークとGET
  ├─シークをおこなえるタイミング
  └─シークの方法(GET:?/GET:n コマンド)

その他のコマンド


ファイル取得


バージョン番号取得




スクリプト構文規則






Copyright(C) 2000-2009 Scripts Lab. Inc.