Railsで使えるGem

Rails4.0で添付したpdfファイルの中身を全文検索の対象にする〜carrierwave、pdftotext、pg_bigm

投稿日:

環境

Ubuntu server 12.04

sunspot_cellにしようとおもってたけど、ライブラリとか勉強することが多くて諦めて自製することにした

準備1 pg_bigmをつかえるようにしておく

Rails4とPostreSQL9.3で全文検索〜pg_bigm

準備2 pdftotextコマンドを使えるようにしておく

 

 PDFの全文検索環境を整える3〜日本語PDFを検索できるようにする xpdf

CarrierWave

CarrierWaveでファイルをアップロードできるようにしておく

Ruby on Rails 3.2でファイルアップロード〜CarrierWave & RMagick

**_uploader.rbに次のようなプロセスを作成

current_pathでテンポラリーファイルの絶対パスを取ることができる

modelで扱ってるActiveRecordオブジェクトを取ることができる

(contentはtextプロパティ)

なお、保存前なのでidはまだない。

デバッグはRails.logger.debug “aaa”

 uploaders/pdf_to_text.rbを作成

モジュールにしたほうがいいかも

まだテストつくってない。。。

まあ動いてる

-Railsで使えるGem
-,

執筆者:

関連記事

Mac OSXにHyper EstraierのRuby Bindingをインストールする

By: Kanko* – CC BY 2.0 目次1 環境2 Hyper Estraierのインストール3 ソースのダウンロード4 パッチを適用する5 rvmのためにconfigureファ …

RubyでTwitter〜twitter & t

By: Pete Simon – CC BY 2.0 目次1 はじめに2 twitter.gemのインストール3 Twitterアプリへの登録4 サンプルから試してみる5 cliでTwit …

連続的な位置情報の取得とHerokuへのアップ~HTML5 Geolocation API

  目次1 連続的な位置情報の取得2 heroku3 結果 連続的な位置情報の取得 連続的な位置情報の取得はこんなかんじで書いてみた [crayon-5d5fc7f780a7c8578839 …

Rails3.2のアプリにユーザー機能を追加する~Devise

By: Ethan Lofton – CC BY 2.0 目次1 はじめに2 インストール3 次にやること4 メッセージを日本語化する5 デバイスモデルにカラムを追加6 サインアップできな …

WindowsのRubyでxlsxファイルにアクセスする~roo

By: Hajime NAKANO – CC BY 2.0 目次1 rooのインストール2 rooを使ってみる(基本)3 シートを指定する4 セルの値を確認する5 行列を数える rooのイ …