【Fess】5分で構築！全文検索サーバ【専用スレ】

**Fess** · 2014/02/18(火) 01:09:31.31

Fessは全文検索のJavaアプリケーションサーバです。
インストールから起動までが5分もかからずに検索サーバを構築することができます。
OS非依存でJavaの実行環境があれば利用可能です。

Seasar2 ベースで構築され、検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。
ドキュメントクロールには S2Robot を利用することで、ウェブやファイルシステムに対するクロールが可能になり、
MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。

（旧ページ）http://fess.sourceforge.jp/ja/index.html
（新ページ）http://fess.codelibs.org/ja/

＜最新バージョンダウンロード＞
http://fess.codelibs.org/ja/downloads.html

なかったので作りました。
ユーザーさん！語らいの場所としませう。

**login:Penguin** · 2014/02/18(火) 07:10:42.92

落ちないか心配なので２

**login:Penguin** · 2014/02/18(火) 14:58:03.56

elasticsearch と比較してどうなの？

**login:Penguin** · 2014/02/18(火) 17:20:15.70

**login:Penguin** · 2014/02/18(火) 19:34:02.48

>>3
日本語に対応。5分でできることか。

**login:Penguin** · 2014/02/18(火) 19:37:38.58

検索エンジンはJAVAなの？

**login:Penguin** · 2014/02/19(水) 20:02:09.81

>>6
つ　>検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。

**login:Penguin** · 2014/02/19(水) 20:11:04.96

>>7
つまりJAVAなのか。
JAVAいれないとイカンのかー嫌だなあ

**login:Penguin** · 2014/02/19(水) 21:57:15.37

今から帰るのでその後軽く触ってみようと思ってるけど、Fessって solr のフロントエンドみたいなの？
それとも、それらも含めたパッケージってこと？

**login:Penguin** · 2014/02/19(水) 22:07:26.10

あ、勘違いしてた。
solr をdb として動くwebアプリケーションって感じか

elasticsearch と比較とかトンチンカンだったな。すまん

**login:Penguin** · 2014/02/20(木) 00:03:30.94

>>8
サーバ用JREなら邪魔なプラグインとか入らないぞ
32bit用はないけどな

**login:Penguin** · 2014/02/20(木) 01:49:13.23

>>8
JAVAなんて、centosのデスクトップ版だったら、最初から入っていたよ

**login:Penguin** · 2014/02/20(木) 01:51:16.57

>>10
>ドキュメントクロールには S2Robot を利用することで、ウェブやファイルシステムに対するクロールが可能になり、
>MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。

S2Robotがなんかよく知らないけど、このへんがすごそうでしょ
googleロボットのようなものだと理解している。

**login:Penguin** · 2014/02/21(金) 10:49:04.93

JAVAって時点でイラネ

**login:Penguin** · 2014/02/21(金) 13:09:11.16

シッタカほどそう言うね

**login:Penguin** · 2014/02/24(月) 06:04:17.02

age

**login:Penguin** · 2014/02/25(火) 02:22:54.32

>>14
javaが検索処理するわけではないようだよ
あくまでフロントエンドのWEBアプリがJAVAで書かれているってことじゃないの？
WEBアプリだったら、JAVA以外になにを使いたいっての？

**login:Penguin** · 2014/02/25(火) 08:53:43.40

無知は黙ればいいと思うよ

**login:Penguin** · 2014/02/26(水) 07:57:45.29

Solrがエンジンて書いてあるからJavaベースだろ。

**login:Penguin** · 2014/02/26(水) 09:09:57.04

Solrは、JAVAで書かれているのか？

**login:Penguin** · 2014/02/26(水) 10:57:13.26

訊く前に自分で調べてみないヤツはいつまで経ってもアホのまま

**login:Penguin** · 2014/02/27(木) 08:16:51.28

試しに使おうと思うんですが、空きメモリって512MBほどあれば十分でしょうか。

**login:Penguin** · 2014/03/08(土) 15:46:27.85

試してみればいいだろ

**age** · 2014/05/08(木) 20:31:34.46

raise this up

**login:Penguin** · 2014/05/24(土) 01:05:51.32

いいよこれ

**login:Penguin** · 2014/05/28(水) 03:51:04.45

質問いいでしょうか。

Fess 9.1.0を、CentOS 6.5 64bitにインストールして、
./startup.shを起動したのですが、ブラウザからlocalhost:8080/fessへアクセスできません。

jdkは、yum install java-1.7.0-openjdk*　で入っています。

環境変数は、
# echo ${JAVA_HOME}
/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.55.x86_64
# echo ${JRE_HOME}
/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.55.x86_64

となっています。

ip6tables iptablesは無効になっています。

結構いろいろ試行錯誤して、粘りましたが、お手上げです。
5分どころか、4時間もかかってもできません・・・疲れた。

**login:Penguin** · 2014/05/28(水) 03:51:49.11

質問↑
age させてください。

**login:Penguin** · 2014/07/14(月) 01:35:23.16

>>26
こっちはFess9.2.0 serverをCentOS6.5 32bitに入れてみたが、ダメだな。Tomcatが動かん。
試しに、Fessに入ってるのと同じverのTomcat7.0.54を別に入れてみたらデフォルトでTomcatの起動だけはうまくいった。
だから26もTomcatに対するjdkのパスの通し方は問題ないと思うよ。

http://fess.sourceforge.jp/ja/4.0/config/install-on-tomcat.html
こんなページも見つけて試してみたけど、やっぱりTomcatがそもそも起動しなくなる。
fessとopenjdkの組み合わせがダメなのか、別な何かがダメなのかわからん。オレは趣味でやってみただけだから諦めたよ。

**login:Penguin** · 2014/07/23(水) 02:34:41.76

Fess9.2.0をScientific Linux 6のマシンにインストールして使ってます
ジョブとクローラの関係について理解したいので、教えてください

現在は試験運用として、過去の古いファイルを置いてるファイルサーバをクロールさせて
インデックスを作っています
クロールには、差分クロールを有効にしても数時間かかること、また格納されてるファイルは
更新されないことから、「Crawler」ジョブを無効にしています
(ファイルシステムクロールとCrawlerジョブがどこで関連づけられてるのか分かってないのですが)

このマシンで、新たに最新のファイルを置いてるファイルサーバを、こちらは定期的に
クロールさせたいと思ってます

とりあえず、ファイルシステムクロールで2つめの設定を加えたのですが、ジョブで
・古いファイルはクロールさせない
・最新のファイルは週に一度クロールさせる
という設定をするためには、どういう設定を施せばよいのでしょうか

公式サイト等みてるのですが、どうにも糸口がつかめず

**login:Penguin** · 2014/11/10(月) 16:13:53.79

Fess 9.3.0だけど、ファイルシステムクロールでzip（書庫）の展開を無効化するにはどうしたらええのん？

**login:Penguin** · 2014/11/10(月) 17:14:03.01

通常ファイルにして書庫に入れない

**login:Penguin** · 2014/11/15(土) 11:48:48.11

ファイルの中身を見ないでファイル名だけでインデックス作成したいんだけど、どうもできなさそうね。

**login:Penguin** · 2014/11/25(火) 02:04:47.97

fess、人気が出てきたな。
メーリングリストからメールが結構回ってくる。

**login:Penguin** · 2015/01/05(月) 10:59:52.53

age

**login:Penguin** · 2015/02/21(土) 12:17:11.83

CvsDataStoreの解説まだかなー

**ブロンチョ** · 2015/05/04(月) 00:38:44.00

メールディレクトリのメッセージをすべてsolrに登録して
imap searchコマンドでメール本文を全文検索させたいんご
検証環境つくるかな
dnsとsquidとwikiとbackupサーバとldapとftpとフロントエンドWebサーバのリプレイスの後に
ニヤリ

**login:Penguin** · 2015/06/23(火) 12:05:56.92

UniJISだかAdobe Japanだか言う文字コードのPDFが化け化けでクロールできない
仕様？

ttp://sourceforge.net/p/pdfbox/bugs/_discuss/thread/66f3c682/1353/attachment/UniJIS-UCS2-HW-H_sample.pdf

**login:Penguin** · 2017/06/16(金) 14:11:25.56

鉄板の検索エンジンってあるの？

**login:Penguin** · 2017/12/29(金) 16:19:52.29

誰でも簡単にパソコン1台で稼げる方法など
参考までに、
⇒　『宮本のゴウリエセレレ』というブログで見ることができるらしいです。

グーグル検索⇒『宮本のゴウリエセレレ』

9BJF3O5E8R

**login:Penguin** · 2018/05/22(火) 09:17:06.85

僕の知り合いの知り合いができた副業情報ドットコム
関心がある人だけ見てください。
グーグルで検索するといいかも『ネットで稼ぐ方法　モニアレフヌノ』

G7BK2

**login:Penguin** · 2018/10/29(月) 00:04:51.21

ここは誰もいないのか

**login:Penguin** · 2018/10/29(月) 07:54:58.73

|・ω・*)ﾁﾗ

**login:Penguin** · 2019/03/31(日) 14:25:15.46

ちんぽいらね

**login:Penguin** · 2019/04/06(土) 21:50:42.27

FESS使ってるよ

**login:Penguin** · 2019/04/29(月) 22:43:59.19

Elasticsearchにものすごく時間かかる

**login:Penguin** · 2020/07/16(木) 15:53:20.12

リバースプロキシ経由で、http://サーバIP/fess/に接続したらfessのトップの検索ページにアクセスできるようにしたいです

fessですが、HTML内にURIとして/js/とか/image/とかって書かれていて、
どうもそのままだとリバースプロキシに対応してないようなのですが、
リバースプロキシに対応させられるようにURLを変更するためには
どうすればよいよいのでしょう

**login:Penguin** · 2020/07/17(金) 11:11:22.85

「リバースプロキシ相対URL」でぐぐれ
多分/fess/imageとかにしたらけるかと

**login:Penguin** · 2020/07/17(金) 11:12:41.14

いや違ったか
まあぐぐって見て

**login:Penguin** · 2021/12/11(土) 22:39:46.78

log4j地味に直撃

**login:Penguin** · 2023/06/27(火) 02:32:39.52

Excelファイルとか検索してダウンロードするとファイル名が全て
「ダウンロード.xlsx」になってしまうんだけど
どこら辺を調べれば良いのでしょう？