Railsで使えるGem

Rails4.0で添付したpdfファイルの中身を全文検索の対象にする〜carrierwave、pdftotext、pg_bigm

投稿日:

環境

Ubuntu server 12.04

sunspot_cellにしようとおもってたけど、ライブラリとか勉強することが多くて諦めて自製することにした

準備1 pg_bigmをつかえるようにしておく

Rails4とPostreSQL9.3で全文検索〜pg_bigm

準備2 pdftotextコマンドを使えるようにしておく

 

 PDFの全文検索環境を整える3〜日本語PDFを検索できるようにする xpdf

CarrierWave

CarrierWaveでファイルをアップロードできるようにしておく

Ruby on Rails 3.2でファイルアップロード〜CarrierWave & RMagick

**_uploader.rbに次のようなプロセスを作成

current_pathでテンポラリーファイルの絶対パスを取ることができる

modelで扱ってるActiveRecordオブジェクトを取ることができる

(contentはtextプロパティ)

なお、保存前なのでidはまだない。

デバッグはRails.logger.debug “aaa”

 uploaders/pdf_to_text.rbを作成

モジュールにしたほうがいいかも

まだテストつくってない。。。

まあ動いてる

-Railsで使えるGem
-,

執筆者:

関連記事

RailsでReactコンポーネントをつかう

By: justine warrington – CC BY 2.0 目次1 React on rails2 インストール3 react on railsで生成されるファイル4 mater …

Rails4とD3.jsでローソク足グラフを描く〜Rails準備編

By: Manuel Calavera – CC BY 2.0 前回 Rails4で複雑な検索〜Ransack こちらのサンプルを使用させてもらいました。 datawarehouse.we …

多対多の関係でまだ関連を持っていない候補を探す〜active_record、pluck、not in

By: Kevin Dooley – CC BY 2.0 目次1 前提2 やりたいこと3 解4 解説 前提 PersonとProjectは、ProjectsPersonという中間モデル(テ …

Rubyでデータクリーニング~mechanize & active_support

  オライリー・ジャパンから「d3をはじめよう」という本が発売されたので読んだ 棒グラフ、折れ線グラフ、インタラクション(マウスオーバーで丸が大きくなるとかラベル表示とか、横のリストからグラ …

Railsでhtmlファイルやリンク先のスクリーンショットを撮影~IMGKit&wkhtmltoimage

  github.com/csquared/IMGKit 目次1 環境2 wkhtmltoimageのインストール3 imgkitのインストール4 試す5 日本語フォント 環境 ubuntu …