|
性能/限界値 2019/07/16 書き換え
性能
■走行環境
Linux (Intel86系CPU) 環境で利用可能。 (32bit OS、64bit OSいずれも可)
実績のあるOSは以下の通り。
・Red Hat Enterprise Linux 5.2
・Turbolinux Appliance Server 3、4
・CentOS 5、6、7
■最大データ規模
MindSearch Hyper MindSearch Fuzzy ファイル数(物理ファイル)または件数(DB) 2,000万件
(index単位では1,000万件)2,000万件
(index単位では1,000万件)1ファイル/レコード当りのテキストサイズ
(プレーンテキスト換算)256KB
(全角換算)256KB
(全角換算)
■計測条件
テストに使ったコンテンツ 埼玉県庁ホームページ(2006年5月収集)
予めHTML→プレーンテキスト変換、
さらに件数を増やすため200バイト平均でスプリットマシン環境 Model: DELL PowerEdge T300
CPU: Core2 Duo 2.4GHz
Memory: 16GB
HD: SATA 500GB 7,200RPM
OS: Red Hat Enterprise Linux 5.2 Base Server
(注:OSは64bit走行, MindSearchは32bit走行)コンテンツ データーベースモードで作成
300万件、総サイズ:556MB
1件平均200バイト長検索条件 1000件までヒット計数および検索結果蓄積
(日付順ソート)
■インデックス作成
MindSearch Hyper MindSearch Fuzzy 処理件数 300万件 300万件 インデックス作成時間 97分 116分 インデックス総サイズ 24.9GB 27.7GB
■検索速度
ベンチマークに使ったキーワード
検索キーワード 選定理由 さいたま 多量にヒットするもの センター 平成 ボランティア 予算案 少量ヒットのもの 第1回 デイサービス 埼玉県庁 1〜3文字目までの綴りは多数有るが、
4文字目付加でヒット数が激減するもの自動車税 サポート体制 その後の発展 わざとノーヒットのもの
検索時間
検索キーワード MindSearch Hyper
(300万件)MindSearch Fuzzy
(300万件)さいたま 477ミリ秒 415ミリ秒 センター 311ミリ秒 297ミリ秒 平成 204ミリ秒 166ミリ秒 ボランティア 616ミリ秒 525ミリ秒 予算案 316ミリ秒 346ミリ秒 第1回 296ミリ秒 300ミリ秒 デイサービス 609ミリ秒 537ミリ秒 埼玉県庁 468ミリ秒 440ミリ秒 自動車税 466ミリ秒 432ミリ秒 サポート体制 757ミリ秒 760ミリ秒 その後の発展 720ミリ秒 679ミリ秒 全キーワード平均 476ミリ秒 445ミリ秒 √(キャッシュ無 x キャッシュ有²)³ による加重相乗平均をとっています(通常はかなりディスクキャッシュが効くため)
より詳しいデータは以下のリンクをご参照ください
MindSearch Hyper の検索速度詳細 MindSearch Fuzzy の検索速度詳細
限界値
ファイル数、ディレクトリ数といった各種処理限界値はマニュアルの以下の部分をご参照願います。
- MindSearch Hyper 限界値
- MindSearch Fuzzy 限界値