【Fess】5分で構築!全文検索サーバ【専用スレ】
Fessは全文検索のJavaアプリケーションサーバです。
インストールから起動までが5分もかからずに検索サーバを構築することができます。
OS非依存でJavaの実行環境があれば利用可能です。
Seasar2 ベースで構築され、検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。
ドキュメントクロールには S2Robot を利用することで、ウェブやファイルシステムに対するクロールが可能になり、
MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。
(旧ページ)http://fess.sourceforge.jp/ja/index.html
(新ページ)http://fess.codelibs.org/ja/
<最新バージョンダウンロード>
http://fess.codelibs.org/ja/downloads.html
なかったので作りました。
ユーザーさん!語らいの場所としませう。 >>6
つ >検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。 >>7
つまりJAVAなのか。
JAVAいれないとイカンのかー嫌だなあ 今から帰るのでその後軽く触ってみようと思ってるけど、Fessって solr のフロントエンドみたいなの?
それとも、それらも含めたパッケージってこと? あ、勘違いしてた。
solr をdb として動くwebアプリケーションって感じか
elasticsearch と比較とかトンチンカンだったな。すまん >>8
サーバ用JREなら邪魔なプラグインとか入らないぞ
32bit用はないけどな >>8
JAVAなんて、centosのデスクトップ版だったら、最初から入っていたよ >>10
>ドキュメントクロールには S2Robot を利用することで、ウェブやファイルシステムに対するクロールが可能になり、
>MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。
S2Robotがなんかよく知らないけど、このへんがすごそうでしょ
googleロボットのようなものだと理解している。 >>14
javaが検索処理するわけではないようだよ
あくまでフロントエンドのWEBアプリがJAVAで書かれているってことじゃないの?
WEBアプリだったら、JAVA以外になにを使いたいっての? Solrがエンジンて書いてあるからJavaベースだろ。 訊く前に自分で調べてみないヤツはいつまで経ってもアホのまま 試しに使おうと思うんですが、空きメモリって512MBほどあれば十分でしょうか。 質問いいでしょうか。
Fess 9.1.0を、CentOS 6.5 64bitにインストールして、
./startup.shを起動したのですが、ブラウザからlocalhost:8080/fessへアクセスできません。
jdkは、yum install java-1.7.0-openjdk* で入っています。
環境変数は、
# echo ${JAVA_HOME}
/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.55.x86_64
# echo ${JRE_HOME}
/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.55.x86_64
となっています。
ip6tables iptablesは無効になっています。
結構いろいろ試行錯誤して、粘りましたが、お手上げです。
5分どころか、4時間もかかってもできません・・・疲れた。 >>26
こっちはFess9.2.0 serverをCentOS6.5 32bitに入れてみたが、ダメだな。Tomcatが動かん。
試しに、Fessに入ってるのと同じverのTomcat7.0.54を別に入れてみたらデフォルトでTomcatの起動だけはうまくいった。
だから26もTomcatに対するjdkのパスの通し方は問題ないと思うよ。
http://fess.sourceforge.jp/ja/4.0/config/install-on-tomcat.html
こんなページも見つけて試してみたけど、やっぱりTomcatがそもそも起動しなくなる。
fessとopenjdkの組み合わせがダメなのか、別な何かがダメなのかわからん。オレは趣味でやってみただけだから諦めたよ。 Fess9.2.0をScientific Linux 6のマシンにインストールして使ってます
ジョブとクローラの関係について理解したいので、教えてください
現在は試験運用として、過去の古いファイルを置いてるファイルサーバをクロールさせて
インデックスを作っています
クロールには、差分クロールを有効にしても数時間かかること、また格納されてるファイルは
更新されないことから、「Crawler」ジョブを無効にしています
(ファイルシステムクロールとCrawlerジョブがどこで関連づけられてるのか分かってないのですが)
このマシンで、新たに最新のファイルを置いてるファイルサーバを、こちらは定期的に
クロールさせたいと思ってます
とりあえず、ファイルシステムクロールで2つめの設定を加えたのですが、ジョブで
・古いファイルはクロールさせない
・最新のファイルは週に一度クロールさせる
という設定をするためには、どういう設定を施せばよいのでしょうか
公式サイト等みてるのですが、どうにも糸口がつかめず Fess 9.3.0だけど、ファイルシステムクロールでzip(書庫)の展開を無効化するにはどうしたらええのん? ファイルの中身を見ないでファイル名だけでインデックス作成したいんだけど、どうもできなさそうね。 fess、人気が出てきたな。
メーリングリストからメールが結構回ってくる。 メールディレクトリのメッセージをすべてsolrに登録して
imap searchコマンドでメール本文を全文検索させたいんご
検証環境つくるかな
dnsとsquidとwikiとbackupサーバとldapとftpとフロントエンドWebサーバのリプレイスの後に
ニヤリ UniJISだかAdobe Japanだか言う文字コードのPDFが化け化けでクロールできない
仕様?
ttp://sourceforge.net/p/pdfbox/bugs/_discuss/thread/66f3c682/1353/attachment/UniJIS-UCS2-HW-H_sample.pdf 誰でも簡単にパソコン1台で稼げる方法など
参考までに、
⇒ 『宮本のゴウリエセレレ』 というブログで見ることができるらしいです。
グーグル検索⇒『宮本のゴウリエセレレ』
9BJF3O5E8R 僕の知り合いの知り合いができた副業情報ドットコム
関心がある人だけ見てください。
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』
G7BK2 リバースプロキシ経由で、http://サーバIP/fess/に接続したらfessのトップの検索ページにアクセスできるようにしたいです
fessですが、HTML内にURIとして/js/とか/image/とかって書かれていて、
どうもそのままだとリバースプロキシに対応してないようなのですが、
リバースプロキシに対応させられるようにURLを変更するためには
どうすればよいよいのでしょう 「リバースプロキシ 相対URL」でぐぐれ
多分/fess/imageとかにしたらけるかと Excelファイルとか検索してダウンロードするとファイル名が全て
「ダウンロード.xlsx」になってしまうんだけど
どこら辺を調べれば良いのでしょう?