Railsで使えるGem

Rails4.0で添付したpdfファイルの中身を全文検索の対象にする〜carrierwave、pdftotext、pg_bigm

投稿日:

環境

Ubuntu server 12.04

sunspot_cellにしようとおもってたけど、ライブラリとか勉強することが多くて諦めて自製することにした

準備1 pg_bigmをつかえるようにしておく

Rails4とPostreSQL9.3で全文検索〜pg_bigm

準備2 pdftotextコマンドを使えるようにしておく

 

 PDFの全文検索環境を整える3〜日本語PDFを検索できるようにする xpdf

CarrierWave

CarrierWaveでファイルをアップロードできるようにしておく

Ruby on Rails 3.2でファイルアップロード〜CarrierWave & RMagick

**_uploader.rbに次のようなプロセスを作成

current_pathでテンポラリーファイルの絶対パスを取ることができる

modelで扱ってるActiveRecordオブジェクトを取ることができる

(contentはtextプロパティ)

なお、保存前なのでidはまだない。

デバッグはRails.logger.debug “aaa”

 uploaders/pdf_to_text.rbを作成

モジュールにしたほうがいいかも

まだテストつくってない。。。

まあ動いてる

-Railsで使えるGem
-,

執筆者:

関連記事

RailsにTwitter Bootstrapを設定する~twitter-bootstrap-rails

環境 ruby 1.9.3  & rails 3.2.8 適当なscaffoldを作っておく

  github.co …

no image

Mongoidのandとorで悩み中

and

or

  orの方はハッシュで[crayon-58 …

RailsでECサイト構築7 デプロイ~spree+apache2+passenger

  前提 Rails3.2のアプリをデプロイ~apache+passenger+postgresql Rails3.2+Apache2+Passenger環境でSSLを使ってみる &nbsp …

no image

Rails3.2でOpenDocumentText(.odt)を作成~serenity

  これも途中経過デス   odtはOpenOffice.orgのwriterなんかの保存形式 serenityはerbライクなodtテンプレートから変数を利用して文書を作成してく …

Rubyでdocxをいろいろ分析してみた

  目次1 解凍~minizip2 ファイルを開く~File.open3 全ファイルを解凍せずにzip内の必要なファイルだけを開く~zipruby4 置換~gsub5 xmlの操作~noko …