ようこそ!
今日は全文検索エンジンElasticsearch(以下ES)についてお話します。
Docsvision 5.5 プラットフォームが実行されています。
1. インストール
現在のバージョンは次のリンクからダウンロードできます。
以下のインストーラーのスクリーンショット:
2. 機能チェック
インストールが完了したら、次の場所に移動します。
ES ステータス ページが表示されます。例は次のとおりです。
ページが開かない場合は、Elasticsearch サービスが実行されていることを確認してください。 Windows ではこれは
エラスティックサーチサービス。
3. Docsvision に接続する
Elasticsearch への接続はフルテキスト サービス ページで設定されます
インデックス作成。
ここで次を指定する必要があります。
1. Elasticsearch サーバーのアドレス (インストール時に設定)。
2. DBMS への接続文字列。
3. Docsvision アドレス (ConnectAddress= の形式)
asmx
4. [カード] タブと [ディレクトリ] タブで、次のデータを設定する必要があります。
インデックスを作成する必要があります。
また、Docsvision サービスが実行されているアカウントを確認する必要があります。
フルテキスト インデックス サービスは、MS SQL 上の Docsvision データベースにアクセスします。
接続後、次のプレフィックスを持つジョブが MS SQL データベースに作成されていることを確認する必要があります。
"DV:FullText_<DBNAME>_CardWithFilesPrepareRange"
設定が完了すると、Windows クライアントの検索バーのロックが解除されます。
4. REST API エラスティック
管理者は、Elasticsearch の動作に関するさまざまな情報を取得できます。
REST APIによって提供されます。
次の例では、Insomnia Rest クライアントを使用します。
一般的な情報の取得
サービスが起動して実行されたら (ブラウザーでは http://localhost:9200/)、次のことができます。
リクエストを実行します:
Elasticsearch サービス (ブラウザー内) の状態に関する応答を取得してみましょう。
不眠症の状態に対する反応:
ステータス - 緑、黄、赤に注目してみましょう。 公式ドキュメントにはステータスについて次のように記載されています。
• 緑 — すべて順調 (クラスターは完全に動作しています)
• 黄色 - すべてのデータが利用可能ですが、クラスター内の一部のレプリカがまだ割り当てられていません。
• 赤 - 何らかの理由でデータの一部が利用できません (クラスター自体は正常に機能しています)。
クラスター内のノードとその状態に関する状態を取得します (ノードが 1 つあります)。
すべての ES インデックス:
Docsvision のインデックスに加えて、他のアプリケーション (ハートビート、ハートビート、
kibana - 使用する場合。 必要なものと不要なものを仕分けることができます。 例えば、
名前に %card% が含まれるインデックスのみを取得しましょう。
Elasticsearch の設定
Elasticsearch 設定の取得:
結果は、ログへのパスを含め、非常に広範囲になります。
インデックスのリストを見つける方法はすでにわかっています。Docsvision はこれを自動的に実行し、次の形式でインデックスに名前を付けます。
<データベース名+インデックスカードの種類>
独自の独立したインデックスを作成することもできます。
これだけが GET ではなく PUT リクエストになります。
結果:
次のクエリは、新しいインデックス (顧客) を含むすべてのインデックスを表示します。
5. インデックス付きデータに関する情報の取得
Elasticsearch インデックスのステータス
Docsvision による初期構成が完了すると、サービスは動作し、データのインデックス作成を開始する準備が整います。
まず最初に、すでによく知られているクエリを使用して、インデックスが埋められており、そのサイズが標準の「バイト」よりも大きいことを確認しましょう。
その結果、EDMS の観点から言えば、87 の「タスク」と 72 の「ドキュメント」がインデックス付けされたことがわかります。
しばらくすると、結果は次のようになります (デフォルトでは、インデックス作成ジョブは 5 分ごとに開始されます)。
書類の数が増えていることがわかります。
必要なカードがインデックス化されていることをどのようにして確認できますか?
• まず、Docsvision のカード タイプが Elasticsearch 設定で指定されたデータと一致することを確認する必要があります。
• 次に、カードの配列にインデックスが付けられるまで待ちます。カードが Docsvision に取り込まれると、データがストレージに表示されるまでに時間がかかる必要があります。
• XNUMX 番目に、CardID でカードを検索できます。 これは、次のリクエストで実行できます。
カードがストレージにある場合は、その「生」データが表示されますが、そうでない場合は、次のような内容が表示されます。
Elasticsearch ノードでのカードの検索
[説明] フィールドと完全に一致するドキュメントを検索します。
結果:
説明に「受信」というエントリがあるドキュメントを検索します。
結果:
添付ファイルの内容からカードを検索
結果:
次のドキュメント タイプのカードをすべて見つけてみましょう。
またはタスク タイプのすべてのカード:
デザインの使用 & Elasticsearch が JSON 形式で提供するパラメーターを使用して、次のリクエストを組み立てることができます。
FirstName = Konstantin で、Orel Office に所属するユーザーのうち、タスク タイプのすべてのカードが表示されます。
除く LIKE 他にも文書化されたパラメータがあります。
フィールド、ドキュメント、コンテンツなどとは異なります。
それらすべてが説明されています
それが今日のすべてです!
#docsvision #ドキュメントビジョンECM
便利なリンク:
- インソムニアレストクライアント
https://insomnia.rest/download/#windows https://www.elastic.co/guide/en/elasticsearch/reference/current/docs-get.html https://www.elastic.co/guide/en/elasticsearch/reference/1.4/_exploring_your_data.html https://stackoverflow.com/questions/50278255/elasticsearch-backup-on-windows-and-restore-on-linux https://z0z0.me/how-to-create-snapshot-and-restore-snapshot-with-elasticsearch/ https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl-mlt-query.html#_document_input_parameters http://qaru.site/questions/15663281/elasticsearch-backup-on-windows-and-restore-on-linux
出所: habr.com