Hyper Estraier

PDFの全文検索環境を整える2〜estwaver

投稿日:

はじめに

PDFの全文検索環境を整える1〜Hyper Estraierのインストールの続き。

クローラの登録・設定・起動

クローラはweb上のリンクをたどって文書を登録してくれるプログラム。クローラは別PCでも構いません。

クローラガイドを参照

クローラのルートディレクトリの作成

クローラの設定

“test_crawl/_conf”ファイルで設定します。

とりあえず、seed先、対象言語を設定。

必要に応じて、proxyや検索先ホストの限定など。

クローラの起動

*メモリが足りないと止まってしまうことがある。そういう時はスレッド数や一度に登録する文書数を減らす。

インデックスが壊れてアクセス出来ないときは”estcmd repair”を試す。(未検証)

-Hyper Estraier
-,

執筆者:

関連記事

Bash on WindowsでDocumentsのpdfを全文検索〜hyperestraier

By: Samm – CC BY 2.0 目次1 Bash on Windows2 HyperEstraierのインストール3 ドキュメントのインデックス登録4 apache2のインストー …

no image

Redmine2.0のDMSFファイルをHyper Estraierで全文検索~PDF検索編

参照 PDFの全文検索環境を整える3〜日本語PDFを検索できるようにする xpdf     estcmdの-fxオプションは「ファイル名の接尾辞に関連づけた外部コマンドを指定」する …

no image

PDFの全文検索環境を整える3〜日本語PDFを検索できるようにする xpdf

目次1 はじめに2 xpdfのインストール3 日本語に対応させる4 テスト5 docやxlsなどのMS Officeファイル6 クローラの設定7 estcmd gatherを使う場合 はじめに Hyp …

no image

Redmine2.0のDMSFファイルをHyper Estraierで全文検索

環境 Redmine2.0にファイル管理プラグインを導入~redmine_dmsf Ubuntu12.04でRubyからHyper Estraierを使う~Ruby Binding 目次1 ソース修正 …

Ubuntu Serverで簡単に全文検索付きの共有ファイルサーバをつくる〜samba4、HyperEstraier

By: Kevin Jarrett – CC BY 2.0 目次1 環境2 Samba43 HyperEstraier 環境 Ubuntu Server 14.04 Samba4 参考 ほ …