Railsで使えるGem

Rails4.0で添付したpdfファイルの中身を全文検索の対象にする〜carrierwave、pdftotext、pg_bigm

投稿日:

環境

Ubuntu server 12.04

sunspot_cellにしようとおもってたけど、ライブラリとか勉強することが多くて諦めて自製することにした

準備1 pg_bigmをつかえるようにしておく

Rails4とPostreSQL9.3で全文検索〜pg_bigm

準備2 pdftotextコマンドを使えるようにしておく

 

 PDFの全文検索環境を整える3〜日本語PDFを検索できるようにする xpdf

CarrierWave

CarrierWaveでファイルをアップロードできるようにしておく

Ruby on Rails 3.2でファイルアップロード〜CarrierWave & RMagick

**_uploader.rbに次のようなプロセスを作成

current_pathでテンポラリーファイルの絶対パスを取ることができる

modelで扱ってるActiveRecordオブジェクトを取ることができる

(contentはtextプロパティ)

なお、保存前なのでidはまだない。

デバッグはRails.logger.debug “aaa”

 uploaders/pdf_to_text.rbを作成

モジュールにしたほうがいいかも

まだテストつくってない。。。

まあ動いてる

-Railsで使えるGem
-,

執筆者:

関連記事

Rubyでd3.jsのapiリファレンスの一覧を取得してくる~mechanize

  d3.jsにはlayoutというおおまかに準備されたレイアウトがあって、その中にあるTreeレイアウトを試してみることにした d3.js自身のapiリファレンスが階層構造になっているので …

Rails3.2でフォームの順番をjQuery UI sortableで並べ替えてSubmit~acts_as_list

no image

Rails3でTwitter Bootstrapのサーチフォームを実装する~form_tag

目次1 git & gitolite2 仕組みを考える3 フィーチャの作成4 Viewの作成5 Controllerの作成6 Modelの作成7 テストが通らない!8 mergeして終わり g …

no image

MongoidでMapReduceに挑戦中

MongoDBの薄い本の素材をMongoidでやろうとしたけど途中経過 MapReduceをやることの利点は、並列処理ができるということとSQLより柔軟な処理なできるということらしい(MongoDBに …

今度こそRails3.2からdocxを生成する

目次1 前提2 構想3 アップロード4 スキームの保存5 docxの生成6 レイアウトと画面遷移を考える7 データの更新8 データの削除 前提 Rubyからdocxを生成する 前回、イキオイアマって自 …