X



トップページLinux
50コメント12KB
【Fess】5分で構築!全文検索サーバ【専用スレ】
0001Fess2014/02/18(火) 01:09:31.31ID:TuEYQrKl
Fessは全文検索のJavaアプリケーションサーバです。
インストールから起動までが5分もかからずに検索サーバを構築することができます。
OS非依存でJavaの実行環境があれば利用可能です。

Seasar2 ベースで構築され、検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。
ドキュメントクロールには S2Robot を利用することで、ウェブやファイルシステムに対するクロールが可能になり、
MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。

(旧ページ)http://fess.sourceforge.jp/ja/index.html
(新ページ)http://fess.codelibs.org/ja/


<最新バージョンダウンロード>
http://fess.codelibs.org/ja/downloads.html

なかったので作りました。
ユーザーさん!語らいの場所としませう。
0002login:Penguin2014/02/18(火) 07:10:42.92ID:k9q+Q5uA
落ちないか心配なので2
0003login:Penguin2014/02/18(火) 14:58:03.56ID:L4L0RMMT
elasticsearch と比較してどうなの?
0005login:Penguin2014/02/18(火) 19:34:02.48ID:TuEYQrKl
>>3
日本語に対応。5分でできることか。
0006login:Penguin2014/02/18(火) 19:37:38.58ID:tvLRNv1w
検索エンジンはJAVAなの?
0007login:Penguin2014/02/19(水) 20:02:09.81ID:PXrp0UA1
>>6
つ >検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。
0008login:Penguin2014/02/19(水) 20:11:04.96ID:wCfvPVsx
>>7
つまりJAVAなのか。
JAVAいれないとイカンのかー嫌だなあ
0009login:Penguin2014/02/19(水) 21:57:15.37ID:E0ScXIs3
今から帰るのでその後軽く触ってみようと思ってるけど、Fessって solr のフロントエンドみたいなの?
それとも、それらも含めたパッケージってこと?
0010login:Penguin2014/02/19(水) 22:07:26.10ID:E0ScXIs3
あ、勘違いしてた。
solr をdb として動くwebアプリケーションって感じか

elasticsearch と比較とかトンチンカンだったな。すまん
0011login:Penguin2014/02/20(木) 00:03:30.94ID:ZidauIr6
>>8
サーバ用JREなら邪魔なプラグインとか入らないぞ
32bit用はないけどな
0012login:Penguin2014/02/20(木) 01:49:13.23ID:qJ5W4xZq
>>8
JAVAなんて、centosのデスクトップ版だったら、最初から入っていたよ
0013login:Penguin2014/02/20(木) 01:51:16.57ID:qJ5W4xZq
>>10
>ドキュメントクロールには S2Robot を利用することで、ウェブやファイルシステムに対するクロールが可能になり、
>MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。

S2Robotがなんかよく知らないけど、このへんがすごそうでしょ
googleロボットのようなものだと理解している。
0014login:Penguin2014/02/21(金) 10:49:04.93ID:4JjEExTM
JAVAって時点でイラネ
0015login:Penguin2014/02/21(金) 13:09:11.16ID:kYL4Kz4u
シッタカほどそう言うね
0017login:Penguin2014/02/25(火) 02:22:54.32ID:qqzTNRIm
>>14
javaが検索処理するわけではないようだよ
あくまでフロントエンドのWEBアプリがJAVAで書かれているってことじゃないの?
WEBアプリだったら、JAVA以外になにを使いたいっての?
0018login:Penguin2014/02/25(火) 08:53:43.40ID:pylh68Lc
無知は黙ればいいと思うよ
0019login:Penguin2014/02/26(水) 07:57:45.29ID:xfsdUR/1
Solrがエンジンて書いてあるからJavaベースだろ。
0020login:Penguin2014/02/26(水) 09:09:57.04ID:4VNT7tqy
Solrは、JAVAで書かれているのか?
0021login:Penguin2014/02/26(水) 10:57:13.26ID:/+fsmmiT
訊く前に自分で調べてみないヤツはいつまで経ってもアホのまま
0022login:Penguin2014/02/27(木) 08:16:51.28ID:BtwaOiyQ
試しに使おうと思うんですが、空きメモリって512MBほどあれば十分でしょうか。
0023login:Penguin2014/03/08(土) 15:46:27.85ID:zLZACqEZ
試してみればいいだろ
0024age2014/05/08(木) 20:31:34.46ID:aKBoMILe
raise this up
0025login:Penguin2014/05/24(土) 01:05:51.32ID:OMaMNgDg
いいよこれ
0026login:Penguin2014/05/28(水) 03:51:04.45ID:FnLmjL/R
質問いいでしょうか。

Fess 9.1.0を、CentOS 6.5 64bitにインストールして、
./startup.shを起動したのですが、ブラウザからlocalhost:8080/fessへアクセスできません。

jdkは、yum install java-1.7.0-openjdk* で入っています。

環境変数は、
# echo ${JAVA_HOME}
/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.55.x86_64
# echo ${JRE_HOME}
/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.55.x86_64

となっています。

ip6tables iptablesは無効になっています。

結構いろいろ試行錯誤して、粘りましたが、お手上げです。
5分どころか、4時間もかかってもできません・・・疲れた。
0027login:Penguin2014/05/28(水) 03:51:49.11ID:FnLmjL/R
質問↑
age させてください。
0028login:Penguin2014/07/14(月) 01:35:23.16ID:ZbPu+eyy
>>26
こっちはFess9.2.0 serverをCentOS6.5 32bitに入れてみたが、ダメだな。Tomcatが動かん。
試しに、Fessに入ってるのと同じverのTomcat7.0.54を別に入れてみたらデフォルトでTomcatの起動だけはうまくいった。
だから26もTomcatに対するjdkのパスの通し方は問題ないと思うよ。

http://fess.sourceforge.jp/ja/4.0/config/install-on-tomcat.html
こんなページも見つけて試してみたけど、やっぱりTomcatがそもそも起動しなくなる。
fessとopenjdkの組み合わせがダメなのか、別な何かがダメなのかわからん。オレは趣味でやってみただけだから諦めたよ。
0029login:Penguin2014/07/23(水) 02:34:41.76ID:uh+cSX8+
Fess9.2.0をScientific Linux 6のマシンにインストールして使ってます
ジョブとクローラの関係について理解したいので、教えてください

現在は試験運用として、過去の古いファイルを置いてるファイルサーバをクロールさせて
インデックスを作っています
クロールには、差分クロールを有効にしても数時間かかること、また格納されてるファイルは
更新されないことから、「Crawler」ジョブを無効にしています
(ファイルシステムクロールとCrawlerジョブがどこで関連づけられてるのか分かってないのですが)

このマシンで、新たに最新のファイルを置いてるファイルサーバを、こちらは定期的に
クロールさせたいと思ってます

とりあえず、ファイルシステムクロールで2つめの設定を加えたのですが、ジョブで
・古いファイルはクロールさせない
・最新のファイルは週に一度クロールさせる
という設定をするためには、どういう設定を施せばよいのでしょうか

公式サイト等みてるのですが、どうにも糸口がつかめず
0030login:Penguin2014/11/10(月) 16:13:53.79ID:ssEKguwc
Fess 9.3.0だけど、ファイルシステムクロールでzip(書庫)の展開を無効化するにはどうしたらええのん?
0031login:Penguin2014/11/10(月) 17:14:03.01ID:MJiRF7py
通常ファイルにして書庫に入れない
0032login:Penguin2014/11/15(土) 11:48:48.11ID:oZ6QSUo5
ファイルの中身を見ないでファイル名だけでインデックス作成したいんだけど、どうもできなさそうね。
0033login:Penguin2014/11/25(火) 02:04:47.97ID:94ngxVaV
fess、人気が出てきたな。
メーリングリストからメールが結構回ってくる。
0035login:Penguin2015/02/21(土) 12:17:11.83ID:S9F0w3qg
CvsDataStoreの解説まだかなー
0036ブロンチョ2015/05/04(月) 00:38:44.00ID:WBQqPO1n
メールディレクトリのメッセージをすべてsolrに登録して
imap searchコマンドでメール本文を全文検索させたいんご
検証環境つくるかな
dnsとsquidとwikiとbackupサーバとldapとftpとフロントエンドWebサーバのリプレイスの後に
ニヤリ
0037login:Penguin2015/06/23(火) 12:05:56.92ID:ks5pbfUO
UniJISだかAdobe Japanだか言う文字コードのPDFが化け化けでクロールできない
仕様?

ttp://sourceforge.net/p/pdfbox/bugs/_discuss/thread/66f3c682/1353/attachment/UniJIS-UCS2-HW-H_sample.pdf
0038login:Penguin2017/06/16(金) 14:11:25.56ID:SDXyAFC+
鉄板の検索エンジンってあるの?
0039login:Penguin2017/12/29(金) 16:19:52.29ID:S/CsVkMC
誰でも簡単にパソコン1台で稼げる方法など
参考までに、
⇒ 『宮本のゴウリエセレレ』 というブログで見ることができるらしいです。

グーグル検索⇒『宮本のゴウリエセレレ』

9BJF3O5E8R
0040login:Penguin2018/05/22(火) 09:17:06.85ID:Czl6p0FW
僕の知り合いの知り合いができた副業情報ドットコム
関心がある人だけ見てください。
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』

G7BK2
0041login:Penguin2018/10/29(月) 00:04:51.21ID:7tTWBMqX
ここは誰もいないのか
0042login:Penguin2018/10/29(月) 07:54:58.73ID:v/2jA1j3
|・ω・*)チラ
0043login:Penguin2019/03/31(日) 14:25:15.46ID:uyzTGgTF
ちんぽいらね
0044login:Penguin2019/04/06(土) 21:50:42.27ID:D34QLrab
FESS使ってるよ
0045login:Penguin2019/04/29(月) 22:43:59.19ID:epKJVUe2
Elasticsearchにものすごく時間かかる
0046login:Penguin2020/07/16(木) 15:53:20.12ID:ZSfeRuR9
リバースプロキシ経由で、http://サーバIP/fess/に接続したらfessのトップの検索ページにアクセスできるようにしたいです

fessですが、HTML内にURIとして/js/とか/image/とかって書かれていて、
どうもそのままだとリバースプロキシに対応してないようなのですが、
リバースプロキシに対応させられるようにURLを変更するためには
どうすればよいよいのでしょう
0047login:Penguin2020/07/17(金) 11:11:22.85ID:o2cjs4Y4
「リバースプロキシ 相対URL」でぐぐれ
多分/fess/imageとかにしたらけるかと
0048login:Penguin2020/07/17(金) 11:12:41.14ID:o2cjs4Y4
いや違ったか
まあぐぐって見て
0049login:Penguin2021/12/11(土) 22:39:46.78ID:KdSXAxOL
log4j地味に直撃
0050login:Penguin2023/06/27(火) 02:32:39.52ID:FFNmut2F
Excelファイルとか検索してダウンロードするとファイル名が全て
「ダウンロード.xlsx」になってしまうんだけど
どこら辺を調べれば良いのでしょう?
レスを投稿する


ニューススポーツなんでも実況