特徴
用途
- 類似した文書・ファイルの照合・探し出し
- 類似した論文・記事の既出調べ
- 類似特許の検索
- 誤字のある住所、名前、顧客情報、顧客データの名寄せまたは新規登録時の重複チェック
- OCR読み出しの後処理(名刺整理など)
- サポートセンターにて過去の類似した質問の検索
- 図書館にてうろ覚えのタイトルでの検索
- うろ覚えの歌詞の一部から原典を見つける
- うろ覚えの商品の特徴などからそれに近い商品を特定
- 自然文風の長いキーワードを許容する検索
高速であること
被照合文書の登録時、照合時のいずれも高速に類似文書検索を行います。
(例:新聞記事1,000文書に対して1文書を照合)
被照合1,000文書を登録する時間: 約7秒 照合1つに要する時間: 約35ミリ秒
曖昧処理
住所録など、少ない文字数にもかかわらず重要度の高い情報では、通常のマッチングでは 脱字や誤挿入(「港北区」対「港区」など)があると合致度が大きく下がりますが、本システムは誤字・脱字への特殊対応によりそのようなケースでの合致度の低下が抑えられます。
人手による表記やOCR読み込みなど誤字のあるデータについて名寄せに使っていただくと威力を発揮します。
WebAPI/SaaS形態のため利用が容易
文書照合を行うコア機能をWebAPIでご提供する方式であり、さまざまなアプリケーションから利用できます。
インターフェースはRESTライクなWebAPIのため、Webアプリケーションから利用する場合、OSやプログラム言語の種類を問わず、どのような環境からも利用できます。(基本的にはHTTP経由でインターネットアクセスができる環境でありさえすれば利用可能です)
安定したサーバ環境
本システムはクラウド上で走行しており、安定した高品質のサービスが可能です。
情報管理・セキュリティのため、あるいは多量文書・高頻度アクセスのため仮想サーバごと設置のご契約も可能です。
少量であれば無料
被照合文書数(照合される側の文書の数)から算出される月額費用となります。
少量であれば無料でご利用になれます。
実例は青空文庫のタイトル検索で
実際のサイトでの応用例として、弊社運用の 「青空文庫 うろ覚えタイトル検索」 をお試しください。
まずは無料でお試しください (少量であれば無料でご利用できます)
↓
匿名試用、アカウント取得