mozc / Google 日本語入力 #4
昨今流行りのAI系技術を応用して既存の文書からかな漢字変換用辞書を作れないのかな
単語だけでなく優先度や依存関係も同時生成する感じで 既存の文書からの自動学習なんて二十年以上前のATOKやWXGの時点で実装されてたぞ >>300
その「既存の」文のライセンスの扱いが微妙
青空文庫でも使え? まあ辞書部分については
1. 文字情報技術促進協議会の成果物から、二次的著作物を作成します
2. CC BY-SA 2.1 JP第5条bに基づき、二次的著作物を全体としてCC BY-SA 4.0で頒布します
3. 二次的著作物を用いて、GPLv3の成果物を作成・頒布します
で合法と主張する余地があるからなあ。
二次的著作物のうち「本作品」由来の部分につきCC BY-SA 4.0で頒布することを禁止する条項が無い。 私は弁護士ではありません。弁理士資格・司法書士資格・行政書士資格も有しておりません。
上記書き込みに関しては、適切な法・書面・電磁的記録等での同意によって命ぜられない限り、利用ないし利用不能の結果生じた一切のことについて、通常損害・特別損害・偶発損害・間接損害等、一切の責任を負いませんのでご了承ください。損害が生ずる可能性について忠告されていたとしても同様です。 >>300
あれだと変換結果が望ましくないものであってもその原因の調査や調整ができない
>>301
それはちょっと前に法改正されて障害ではなくなった
無償で読めるニュースサイトなどの記事をもとに辞書を作成する程度なら問題にはならない 著作権法改正がAI開発に与える「衝撃」
ttps://h-bank.nict.go.jp/event/pdf/taichikakimuma190306.pdf fcitx5-mozcを入れると候補ウィンドウが正しく表示されない環境がある。その環境でもfcitx-mozcは正しく動作する。なんで? Linux板ですみません、Windows向けにビルド済みのUTってどこかからDL出来たりしませんでしょうか
mozcはGithubのガイドに従って他の方がビルドされたものをDL出来たのですがUT系はやっぱり自分でビルドする他ないのでしょうか >>309
候補文字と説明がオーバーラップするやつかな >>318
copyleftじゃないと長期に続けるのはなかなか難しいけどな
*BSDもOpenAMも開発リソースが分散しちゃってどうにもならない >>311
ttps://github.com/google/mozc/blob/master/docs/build_mozc_in_windows.md
UT辞書を↓に突っ込んでからmozcをビルドしてください
/mozc/src/data/dictionary_oss/dictionary00.txt 最近Linuxでmozc-ut使ってるけど、アップデートする度むちゃくちゃアホな変換出てくるのあらかじめ削除できんもんかのう。 gnomeにibus-mozc入れてみたがgeditを始めgnomeアプリだけで挙動がおかしいな
単語を変換するとカーソルに同じ単語が挿入されて二重入力みたいになる
ちなみに他のアプリじゃ特に不具合無くいい感じ うちの Debian11、Ubuntu22.04LTS では確認出来なかった
Gnome、ibus-mozc、gedit で正常に動く >>325
俺はソースコードのdictionary_ossディレクトリから「!」で終わる単語を抽出して「抑制単語」として登録した辞書を作ってる
タイトルや流行語がほとんどなのでなんじゃこりゃってなる候補が大幅に減った、気がする >>326>>329
GTK_IM_MODULE消せばOK >>330
ありがとう
gnomeアプリで正常に文字入力ができるようになったが
mozcの文字入力・変換で使われるキーを含むショートカットキーが機能しないな…
それでも入力ソースを切り替えればいいだけだし、kkcを常用するよりは快適だね