昔大手サーバやってた人がリアルの知り合いに居て、色々聞いたんだけど、OpenNapの場合
ネックになるのは、メモリと回線だそうな。その人はUNIX系で運営してたんだけど、Win系もほぼ同じ傾向だと言ってた。
CPUってサーバー起動直後のラッシュ時以外は、それほど食わないんだとさ。
そういう意味では、データ構造や検索の仕組みを改善する方向がいいと思う。検索の改善はリソース消費の低減にも関わる。
ソース一通り読んだけど、今のハッシュ検索は、トークン区切りが多いファイルがあればあるほど、リソースを食う。
形態素解析の結果、わずか1文字の単語が切り出されたとしても、10文字の単語が切り出されたとしても
それは両方同じ長さのハッシュコードになってしまう。
ハッシュ関数の仕組みを、今のようなMD5の汎用関数じゃなくて、もっと特化した関数にするか
もしくは、上の方でも言ったけどもっと単純なn-gram検索を使う事かなぁ。これもうまくやればそれほどメモリを食わないと思う。
精度重視でbigramであっても入力文字列に対してたかが2倍。それで部分一致も、マルチランゲッジ化も出来るんだから安い。
単語レベルの一致が欲しいのであれば、可変長にしてしまえばいいだけだし、少なくとも今の方法よりマシだと思う。
今は、ファイル名+固定長のハッシュコードだから、そりゃメモリも食うさ。
あと、リンクサーバーの今の実装もかなり疑問だなぁ。
シーケンス番号でもデータに割り当てて(重複・エラー訂正用)、全サーバーで完全結合すれば良いのに。
リンク先のサーバーが落ちたら、落ちてないサーバーまで割れるんじゃない?この実装だと。
レスポンスの遅いサーバーがあったら、それだけで全体のサーバーのパフォーマンスも落ちちゃうよ。
探検
ニュース
- 【東京】清潔感がない?タイル直置きのドーナツに賛否 「I'm donut?」運営会社「運用の改善を含め検討」 [少考さん★]
- 【西東京・母子4人死亡】 亡くなった知人男性の携帯電話 母親の車内から見つかる 事件3日前「体調不良で会社を休む」と会社に欠勤連絡 [ぐれ★]
- 「今の日本では希望を抱けない」年末の食品配布会で悲痛な声を聞いた 物価高の2025年、利用者は過去最多に:東京新聞 [少考さん★]
- 高市政権、続く高支持率 積極財政や対中強硬姿勢評価か 「なぜこんなに高いのか」政権内に困惑も ★3 [ぐれ★]
- 米国防総省、中国軍は「2027年の台湾侵攻へ着実に前進」 分析公表 ★2 [蚤の市★]
- 【📱】PCだけじゃなかった… スマホも「世界的メモリ不足」で値上がりへ 26年はスペックダウンも頻発か [ぐれ★]
- 首都高、値上げへ。上限は普通車2130円に🛣🛣 [256556981]
- 【悲報】コンビニバイトのJKにラブレターを送ったオッサン、無事手紙を晒される [834922174]
- 🤥ゆめめ王国🏰
- ラーメン二郎(怒)「残す!?さっきは食べれるって言ったじゃねーか!!」(ヽ´ん`)「」 言い返せる? [592058334]
- 家族と「脱毛器」共有ってだいぶイヤじゃね? [377482965]
- 久々に好きになれたAVがあったよ
