Railsで使えるGem

Rails4.0で添付したpdfファイルの中身を全文検索の対象にする〜carrierwave、pdftotext、pg_bigm

投稿日:

環境

Ubuntu server 12.04

sunspot_cellにしようとおもってたけど、ライブラリとか勉強することが多くて諦めて自製することにした

準備1 pg_bigmをつかえるようにしておく

Rails4とPostreSQL9.3で全文検索〜pg_bigm

準備2 pdftotextコマンドを使えるようにしておく

 

 PDFの全文検索環境を整える3〜日本語PDFを検索できるようにする xpdf

CarrierWave

CarrierWaveでファイルをアップロードできるようにしておく

Ruby on Rails 3.2でファイルアップロード〜CarrierWave & RMagick

**_uploader.rbに次のようなプロセスを作成

current_pathでテンポラリーファイルの絶対パスを取ることができる

modelで扱ってるActiveRecordオブジェクトを取ることができる

(contentはtextプロパティ)

なお、保存前なのでidはまだない。

デバッグはRails.logger.debug “aaa”

 uploaders/pdf_to_text.rbを作成

モジュールにしたほうがいいかも

まだテストつくってない。。。

まあ動いてる

-Railsで使えるGem
-,

執筆者:

関連記事

backbone-railsのscaffoldで生成されるコードでルーティングとCRUDの処理をどうやってるのか読んでみた

By: asobi tsuchiya   目次1 はじめに2 サンプルの準備3 初期化4 ルーター5 READ6 CREATE7 UPDATE8 DELETE はじめに backbone-r …

Rubyで静的ページをジェネレート〜middleman

静的ページのジェネレータとしてはjekyllやこれを使ったoctopressなどがメジャーなようで middlemanもそんな静的なページのメジャーなジェネレータの1つ middlemanの利点は次の …

ActionCableのサンプルをみてみた

By: Samantha Brough – CC BY 2.0 目次1 ActionCableとは2 rails4での利用3 redisサーバーの準備4 cableサーバーの準備5 チャッ …

no image

Ubuntu ServerのGuardからネットワーク経由でWindowsのブラウザをリロードする~guard-livereload

Ubuntu12.04.1でCoffeeScriptの自動makeとブラウザの自動リロード~guard-coffeescript   Ubuntu ServerのGuardからGrowl f …

ThoughtBotの『Backbone.js on Rails』の目次と見出しをななめ読み

By: John – CC BY 2.0 learn.thoughtbot.com/products/1-backbone-js-on-rails 買いました 電子書籍で137ページに$4 …