昔大手サーバやってた人がリアルの知り合いに居て、色々聞いたんだけど、OpenNapの場合
ネックになるのは、メモリと回線だそうな。その人はUNIX系で運営してたんだけど、Win系もほぼ同じ傾向だと言ってた。
CPUってサーバー起動直後のラッシュ時以外は、それほど食わないんだとさ。
そういう意味では、データ構造や検索の仕組みを改善する方向がいいと思う。検索の改善はリソース消費の低減にも関わる。
ソース一通り読んだけど、今のハッシュ検索は、トークン区切りが多いファイルがあればあるほど、リソースを食う。
形態素解析の結果、わずか1文字の単語が切り出されたとしても、10文字の単語が切り出されたとしても
それは両方同じ長さのハッシュコードになってしまう。
ハッシュ関数の仕組みを、今のようなMD5の汎用関数じゃなくて、もっと特化した関数にするか
もしくは、上の方でも言ったけどもっと単純なn-gram検索を使う事かなぁ。これもうまくやればそれほどメモリを食わないと思う。
精度重視でbigramであっても入力文字列に対してたかが2倍。それで部分一致も、マルチランゲッジ化も出来るんだから安い。
単語レベルの一致が欲しいのであれば、可変長にしてしまえばいいだけだし、少なくとも今の方法よりマシだと思う。
今は、ファイル名+固定長のハッシュコードだから、そりゃメモリも食うさ。
あと、リンクサーバーの今の実装もかなり疑問だなぁ。
シーケンス番号でもデータに割り当てて(重複・エラー訂正用)、全サーバーで完全結合すれば良いのに。
リンク先のサーバーが落ちたら、落ちてないサーバーまで割れるんじゃない?この実装だと。
レスポンスの遅いサーバーがあったら、それだけで全体のサーバーのパフォーマンスも落ちちゃうよ。
探検
ニュース
- 【少子化】少子化は女のせい?男のせい?SNSで不毛すぎる議論が勃発…「産ませる発言」vs「淘汰される遺伝子」泥沼バトルへ ★2 [ぐれ★]
- 植田日銀総裁 「利上げが遅れれば、米欧のように非常に高いインフレが起きて、日本は大幅な利上げが必要となる」 [お断り★]
- 【東京】東村山市が全市民に現金4千円給付へ 食料品の価格高騰対策で [ぐれ★]
- 【TV】ファン5万人がガチで投票! プロ野球総選挙、栄えある1位は [牛丼★]
- 【速報】政府、与党がNISA未成年解禁を検討 ★2 [蚤の市★]
- 【*彡】巨人・坂本勇人 『流れ星に何を願うか』の質問に「結婚相手」と即答、結婚願望告白 女性ファンから歓声と悲鳴 [鉄チーズ烏★]
- 【高市悲報】明治時代の日本人さん、奈良公園の鹿を殴り殺して密売し、滅亡寸前まで追い込んでいたことが判明 [253245739]
- プラトンの「哲人政治」は正しかったのでは? アホな大衆に政治家を選ばせるとロクなことにならない [653462351]
- 昼休憩中に賃金が発生してないのって意味分からくね?
- 早苗のおまんこパンパンパン🏡
- 【動画】おにぎり職人、手に味噌をぬりぬりしておにぎりに染みこませるwwwwwwwwwwwwww [856698234]
- ガチでイライラする
