>>392
すみません
あとでゆっくり読んで見ます。
プログラミングはサッパリなので、読むのに苦労します。
>>393
えええ
それは随分酷い設計ですな・・・。
あと、書いてて気づいたんですが
日本語検索に弱いってのは、ようするにトークン文字に 【】 とか2バイトの記号が含まれてないので
そもそも、【mp3】を形態素解析(もどき)で分割出来ないという話なんですよね?
う〜ん。
本当に酷い設計ですな。
n-gramかSuffix Arrayを使った方が良いような・・・
メモリリソースを食べまくりだろうから、可変長n-gramを使って
登録時にうまい具合にハッシュ化するべきか、もしくは検索時に処理するべきか・・・
前者だとメモリの問題が(あと起動直後のログインラッシュ時のCPU負荷)、後者だとCPU負荷の問題があるねぇ。
やっぱ、後者でビタビアルゴリズムを使ってCPU負荷を減らしつつ、n-gramによる共起頻度探索をやってキャッシュを整備
ってのが、ベストか?
#受信したデータから順次クライアントで表示する方式だから、頻度の高い上位の結果を即座に返せば、後はゆっくり返しても体感上はスッキリ出来るはず
いや、試してないから、どうなるかサッパリだけどw
探検
ニュース
- 【東京】清潔感がない?タイル直置きのドーナツに賛否 「I'm donut?」運営会社「運用の改善を含め検討」 [少考さん★]
- 【西東京・母子4人死亡】 亡くなった知人男性の携帯電話 母親の車内から見つかる 事件3日前「体調不良で会社を休む」と会社に欠勤連絡 [ぐれ★]
- 三重・四日市市の地下駐車場 冠水で274台被害 車の所有者に国が一定額支援へ [どどん★]
- 高市政権、続く高支持率 積極財政や対中強硬姿勢評価か 「なぜこんなに高いのか」政権内に困惑も ★3 [ぐれ★]
- 「今の日本では希望を抱けない」年末の食品配布会で悲痛な声を聞いた 物価高の2025年、利用者は過去最多に:東京新聞 [少考さん★]
- 米国防総省、中国軍は「2027年の台湾侵攻へ着実に前進」 分析公表 ★2 [蚤の市★]
- 韓国、虚偽捏造情報根絶法が国会に上程。YouTuber等が不当な利益を得るためにデマを流したら損害額の5倍の責任を負うことに。高市 [931948549]
- 【悲報】コンビニバイトのJKにラブレターを送ったオッサン、無事手紙を晒される [834922174]
- 🤥ゆめめ王国🏰
- 小野田経済安全保障大臣(拓殖大学卒)、受験生に勉強のコツを伝授「私は漫画のおかげで成績爆上がりしました」 [834922174]
- 粗品の記事は消すのにSKY-HIさんの記事は消さないのな
- 首都高、値上げへ。上限は普通車2130円に🛣🛣 [256556981]
