Hyper Estraier

PDFの全文検索環境を整える2〜estwaver

投稿日:

はじめに

PDFの全文検索環境を整える1〜Hyper Estraierのインストールの続き。

クローラの登録・設定・起動

クローラはweb上のリンクをたどって文書を登録してくれるプログラム。クローラは別PCでも構いません。

クローラガイドを参照

クローラのルートディレクトリの作成

クローラの設定

“test_crawl/_conf”ファイルで設定します。

とりあえず、seed先、対象言語を設定。

必要に応じて、proxyや検索先ホストの限定など。

クローラの起動

*メモリが足りないと止まってしまうことがある。そういう時はスレッド数や一度に登録する文書数を減らす。

インデックスが壊れてアクセス出来ないときは”estcmd repair”を試す。(未検証)

-Hyper Estraier
-,

執筆者:

関連記事

no image

PDFの全文検索環境を整える1〜Hyper Estraierのインストール

目次1 環境2 コンパイラとzlibのインストール3 libconvインストール4 mecabインストール5 QDBMインストール6 hyper estraierコンパイル7 簡単なテスト 環境 Ce …

no image

PDFの全文検索環境を整える3〜日本語PDFを検索できるようにする xpdf

目次1 はじめに2 xpdfのインストール3 日本語に対応させる4 テスト5 docやxlsなどのMS Officeファイル6 クローラの設定7 estcmd gatherを使う場合 はじめに Hyp …

no image

Redmine2.0のDMSFファイルをHyper Estraierで全文検索

環境 Redmine2.0にファイル管理プラグインを導入~redmine_dmsf Ubuntu12.04でRubyからHyper Estraierを使う~Ruby Binding 目次1 ソース修正 …

PDFの全文検索環境を整える4〜hyper estraierのcgiを使ってみる

参考: PDFの全文検索環境を整える3〜日本語PDFを検索できるようにする xpdf 環境: Ubuntu Server 12.04 LTS 目次1 apacheを準備2 hyperestraierを …

no image

Ubuntu12.04でRubyからHyper Estraierを使う~Ruby Binding

1 Hyper Estraierの準備

libestraier-devはruby bindingのコンパイルに必要 2 ソースの準備 …