自宅サーバーの底力。。。
はじめまして。MYFILER.NETをはじめました。
詳細は、http://www.myfiler.net/
現在、どこにでもありそうな検索エンジンっす。
というか、自宅サーバーでロボット型の検索エンジンはスペック的に
無理がある!絶対ある。実際ある。
そこで、賛同者の自宅サーバーを連携させて他の検索エンジンに
負けないシステムを作ろうと考えたのですが、
馬鹿なので、何も思いつきません。というわけで、先輩方の
アイデアを募集!!ぜひよろしくお願いします!!
スレタイと内容が違うスレッド立てるな氏ね。
それとクラスタリングくらい勉強して来い。 googleにゃ勝てないし2ch過去ログ検索くらいが現実的で実用的じゃまいか 今日の日記を書いてやったぞ。
コピペしとけ
---コピーここから---
おっ 怒られた〜〜
2chの自宅サーバ板で...
2chの自宅サーバ板でmyfiler.netを宣伝してみた...
トピックと内容が違っていたらしく、おそらくかなり若いと思われる少年に
怒られた...
ごもっともな内容のため、反論できず...
がんばります...
---コピーここまで--- あぁぁぁ また怒られてしまいました...
反論はまったくありません...すみません。
自宅サーバの底時からは、他社の検索サイトと同等の
検索サイトが自宅サーバー郡でできれば面白いかと
思ってつけました。。いずれにしても、わかりづらかったですね。
すみません...
クラスタリングよいですね。ロードバランサーを導入して
賛同者(いればれすが)と実際に行ってみるのもよいかもしれません。
ただ、ロードバランサーの負荷は結構なものになりそう...
インターネット経由でクラスタリングってできるのでしょうか。
ちょっと調べてみます。
データベースについては、現在考え中。。。
データの量が膨大すぎて、自宅サーバ1台では、およそ
ページ10000000分がやっとといった感じです。
なんで、レプリケーションではなく、NASか、NFSをインターネット
経由で行うのが良いかと思ってるんですが、調査不足で
とにかくインターネット経由で上記のようなことがスムーズに
行えるか調査してみます。
しばらくは、ちびちび1台の自宅サーバーでがんばります...
最後に、改めまして失礼しました!!
あっ。何度もすみません。
自宅サーバの底時からは ではなく
自宅サーバーの底力でした。。。
ブラインドタッチから勉強します。 というか全体的にぼろぼろですね。
日本語から勉強します! DNS未登録さん厳しいね。。。
うざがらないで!! 全国2ch・PINKちゃんねる共催模試 実施結果:
受験者数:1642016人
合計点:900点
最高点:894点
最低点:11点
平均点:564点
MYFILER.NETの国語の偏差値:28.4 MYFILER.NET、がんばれ。応援してるよ。
そう簡単に検索エンジンなんて作れないしね 14さんは、多分知り合いですね〜〜
ありがとうございます!
30.2は低いですね。。もうちょっとあげてくれ! >>15
あなたの努力次第です。
1年で30台前半から70台までageた人もいます。 了解です。ありがとうございました。
まだまだバグバグの状態ですが、努力して、偏差値上げます。
では、メンテして今日は寝ます! そもそも、ロボット型やるなら、
・クロール用ボットを走らせるマシン
・DBサーバ
・Webサーバ
の3つはいると思うんだけど、どれもそれなりの数がいると思う。
とりあえず、Webサーバの部分をインターネット経由でいろんなサーバに分けることを考えると、
ロードバランサーよりもDNSラウンドロビンの方が手軽じゃないかと思う。
クロール用ボットを走らせるマシンは、UDとかFolding@Homeのような分散コンピューティングのように、
ある程度(例えば10サイト)クロールしたら、中央サーバにそのデータを送信する見たいな形がいいかもしれない。
あと、スポンサー広告ちょっとでかすぎない?
テキストリンクにするか、右側に移したほうが見やすそう。 怒られるのが恐くて18以降見てませんでした。
返信ありがとうございます。
19さん>
現在、クロール用マシン/Web+DBサーバ の2台で動いています。
金銭的な問題で2台になってます。。。
なので、自宅サーバー郡で何とか他の検索サイトに匹敵するものを
作りたかったのですが。。。難しそうですね。
20さん>
スポンサー広告はとりあえず張ってみたというのが現状です。
今、検索キーワードに合わせた広告表示機能の作成に加えて
配置を考えています。20さんの意見を元に配置を考えてみます。
ありがとうございます。
21さん>
バグバグですが、なんとか一人でやってます。
皆様に認めて頂けるようなサイトを目指して頑張ります。 P2P型の検索ロボット は面白そうだね (ー。ー)ボソォ >>3 同意
もっと対象を絞ったほうがよいと思うよ。
2ch検索とか、RSS検索とか、アイディア勝負で。
んでユーザ増えて負荷が上がったら分散なりなんなりやればよい。
って落ちてるのか。 空で検索を押したら
Warning: mysql_fetch_assoc(): supplied argument is not a valid MySQL result resource in /usr/local/apache2/htdocs/lib/action/default/search2Action.php on line 143
ってエラー出たぞ^^;
PHPだね オマケに3347899078978660715 件 - 0.111569秒とか出てるし^^;;; あぁぁ ご指摘ありがとうございます。
Warning: mysql_fetch_assoc(): supplied argument is not a valid MySQL result resource in /usr/local/apache2/htdocs/lib/action/default/search2Action.php on line 143
↑は、どうしようか悩んでいます。。。
検索結果が0件の場合、でてしまいます。というのも、検索SQLに
SQL_CALC_FOUND_ROWS(MySQL) を使用して検索しているのですが、
mysql_fetch_assocする前に、SELECT FOUND_ROWS()で検索結果の件数を
取得すると、当然、検索結果はクリアーされてしまいますので、
0件の場合、mysql_fetch_assocしないという処理が、できません。。
たぶん回避方法はあるので、勉強して直します!
accelerator調べてみますね!ありがとうございます。 >↑は、どうしようか悩んでいます。。。
単に@を付けてエラーを抑制しておいて
裏側でエラー取得して回避すりゃいいだけじゃないかと。
34さん>返信有難うございます。
「@」←でエラーを制御出来るのですね。まだPHPは始めてまもないため
恥ずかしながら、それほど詳しくありません。
「@」について調べてみます。有難うございます。 よーしパパ有り金はたいてWayback Machine作っちゃうぞ。 >>1
どうでもいいけど、アフ「ィ」リエイトな。
後広告出したいんだけど受け付けてもらえる?
その場合の料金の目安もおしえて。 38さん>アフ「ィ」リエイトでした。
このまま一生間違って生きていくとこでした。ご指摘有難うございます。
>後広告出したいんだけど受け付けてもらえる?
>その場合の料金の目安もおしえて。
アフ「ェ」リエイトと間違えるほど、広告のことがわかっていませんので
詳細をお聞かせください。 >>40
そっちのPVによるけど、月いくらで469x60程度のバナー広告出したいです。 >>41
遠慮せずに800x600くらいいっとけ。
男は勢いが大事だ。 >>40
投資してくださるみたいだし甘えてぼっておきなさい(笑 バナーの種類など詳細を教えてください!!
myfiler_net@yahoo.co.jp
上記までお願いします。
ただ、現状はあくまでBETA版なので、システムがしょっちゅう止まる情况です
ので、ご期待に添えないかとおもいます。
PVは、TOP頁のアクセスログを参照してください。(あまり詳しくは私もわかりません)
自分で検索エンジン作ったの?性能うんぬんはおいといて
俺にはできないから、素直に尊敬するよ。がんばってね。 Likeしてたら1000件くらいで重くなるから検索方法を考えないときついよね >>48
phpSiteAnalyser −サイトアクセス解析システム− TOP
ぐぐるだけでアクセスはせんw 50さん>違いますが、非常にお世話になってます。アクセス解析する際はぜひ。
47さん>Like文ではなくNグラムで検索しています。
性能についてですが、検索スピードは他には劣りますが、ADSL+サーバー1台で
やってる割には速いほうかと思っています。
何より問題は、HPの評価方法ですね。。。
Googleと検索しても、Googleは後ろの方にしかでてきません。。。
実際にほしい情報を検索するために使用するというよりは、
なんか面白そうなホームページないかな〜〜くらいの時に使って
いただくと便利かもしれません。。。 >>52
私もNグラムによる方法を利用してサーチエンジンをPHPで作った事があるのですが、
評価で悩んでしまいますね。利用者を巻き込むという点では利用者に判断させる方法
もあるのですが、これだと不正が横行してしまう可能性もあるので厳しいものがあり
ます。本文から判断する方法、キーワードランキングによる方法などもありますが、
これもやりようによっては不正に評価をあげる事が出来てしまいますしね。
どのみちヒットする情報を厳選するなり特殊分野に拘るなりの特色がなければ競合
するサーチエンジンからは抜きに出る事が出来ないかも(-_-;)と想って私の
サーチエンジンは放置しております。笑 53さん>
なるほど、26さんもおっしゃっていましたが、検索対象を特殊分野に絞った
方が良さそうですね。
検索対象についてじっくり考えてみます。
>私のサーチエンジンは放置しております。笑
ぜひURLを!参考にさせてください! でも、Yahoo!とかググールとかは大手だから、今作っても使われないとおもわれ。。。。。 >>1
マシンは提供できないけど、クローラー公開すれば手元のマシンで走らせるよ >>1 さん。応援してます。
>>60 さん同様に俺も協力しますよ。公開してくれれば。 >大阪府三島郡島本町の小学校や中学校は、暴力イジメ学校や。
島本町の学校でいじめ・暴力・脅迫・恐喝などを受け続けて、心も身体も壊されて廃人同様になってしもうた僕が言うんやから、
まちがいないで。精神病院へ行っても、ちっとも良うならへん。教師も校長も、暴力やいじめがあっても見て見ぬフリ。
そればかりか、イジメに加担する教師もおった。 誰かがイジメを苦にして自殺しても、「本校にイジメは
なかった」と言うて逃げるんやろうなあ。
島本町の学校の関係者は、僕を捜し出して口封じをするな
>島本町って町は、暴力といじめの町なんだな
>「口封じ」なんかしません。どうぞ、気が済むまでお書き込み下さい。
島本町は日本の恥!島本町は日本の迷惑!