Hyper Estraier

PDFの全文検索環境を整える2〜estwaver

投稿日:

はじめに

PDFの全文検索環境を整える1〜Hyper Estraierのインストールの続き。

クローラの登録・設定・起動

クローラはweb上のリンクをたどって文書を登録してくれるプログラム。クローラは別PCでも構いません。

クローラガイドを参照

クローラのルートディレクトリの作成

クローラの設定

“test_crawl/_conf”ファイルで設定します。

とりあえず、seed先、対象言語を設定。

必要に応じて、proxyや検索先ホストの限定など。

クローラの起動

*メモリが足りないと止まってしまうことがある。そういう時はスレッド数や一度に登録する文書数を減らす。

インデックスが壊れてアクセス出来ないときは”estcmd repair”を試す。(未検証)

-Hyper Estraier
-,

執筆者:

関連記事

Bash on WindowsでDocumentsのpdfを全文検索〜hyperestraier

By: Samm – CC BY 2.0 目次1 Bash on Windows2 HyperEstraierのインストール3 ドキュメントのインデックス登録4 apache2のインストー …

no image

Redmine2.0のDMSFファイルをHyper Estraierで全文検索

環境 Redmine2.0にファイル管理プラグインを導入~redmine_dmsf Ubuntu12.04でRubyからHyper Estraierを使う~Ruby Binding 目次1 ソース修正 …

no image

Ubuntu12.04でRubyからHyper Estraierを使う~Ruby Binding

1 Hyper Estraierの準備

libestraier-devはruby bindingのコンパイルに必要 2 ソースの準備 …

no image

Redmine2.0のDMSFファイルをHyper Estraierで全文検索~PDF検索編

参照 PDFの全文検索環境を整える3〜日本語PDFを検索できるようにする xpdf     estcmdの-fxオプションは「ファイル名の接尾辞に関連づけた外部コマンドを指定」する …

no image

RubyからHyper Estraierを使う2~Ruby Binding

環境:Ruby 1.9.3 Hyper Estraierのソースに含まれるRubyバインディングから検索する。 Rubyバインディングの文書 1 RubyGemはコンパイルが通らない [crayon- …