スタッフブログ

  • カテゴリ 技術全般 の最新配信
  • RSS

PDFやwordファイルの中身まで全文検索できる WEKO

Ryuji : 技術全般 2009/1/8 13:01

Blogger's Avatar

回を重ねる毎に参加人数が増えつづけているCMSナイト。昨夜も盛況でした。

毎回、様々なCMSや、CMSの拡張機能についての紹介や利用事例などの紹介があるのですが、昨夜はNetCommons2用モジュールの「WEKO」の紹介がありました。

WEKO

このwekoの発表の中で「お!」と思ったのが、登録した wordやpdfの中身の全文検索機能があったことでした。

仕組みとしては、word や pdfの中身を登録したときに、別のソフトウェアで、ファイルからテキストを取り出して、データベースに登録しておき、wekoからはデータベースを検索するという形でした。

このテキスト抽出に使っているソフトウェア名をお聞きすることができたので、それを利用してXOOPSのダウンロードモジュールに全文検索機能を追加してみようかと思います。

実際に各ソフトウェアをどうやって呼び出してるのかは、WEKO のソースコードを読んで調べてみようと思ってます。(こういうときにオープンソースだと、簡単にノウハウを知ることができて便利ですね)

というわけで、誰かチャレンジしてみてね>RYUSスタッフ

トラックバック

スタッフブログ最新
カテゴリ一覧

〒104-0061 東京都中央区銀座1丁目3番3号 G1ビル7階
お問い合わせ TEL 03-3524-8860

Copyright(c) 2012 RYUS.All Rights Reserved.