mozc / Google 日本語入力 #4
>>165
よくわからないけど本当にそれmoz使用できている?
家の同等の環境だと一瞬 moz が起動した後なぜかKKCに切り替わっている >>167
目立ったのは
androidフロントエンドが消えた。
対応protobufバージョンアップ。
くらいかね。 >>170
細かいところでは、
gcc-8以降への対応
新元号への対応
手書き文字入力の削除
かな。
あと、インプットメソッドとのAPI (?) が変更されたようで、
fcitx-mozcやuim-mozcが今までのコードではビルドできなくなった。 >>171
そういや、dockerイメージのubuntu20.04対応もあったな。
gypはそのままか。cmakeとかに切り替えないかなぁ。 2.25.4100.102
python3に対応した模様 depot_toolsがpython3に移行でもするのかね。それはそれで面倒くさい…… そういうのはαとかβとか「開発版バージョン」とかでやれよ常識ねえな MSの新IMEと合わせて嫌な予感がするぞ
WSL2絡みじゃあるまいな 個人的な作業みたい。感謝
https://twitter.com/komatsuh/status/1295026125488287759
ただ現状だとビルドが通らないかも
https://github.com/google/mozc#build-status
辞書は1169219行から1154398行に減
wc -l src/data/dictionary_oss/dictionary0*
「堺雅人」などの人名がほぼ入ってないのは変わらず
辞書だけ差し替えたものはビルド通ったけど、劇的な違いはなさそう
https://twitter.com/5chan_nel (5ch newer account) openSUSE 15.2 で mozc-2.25.4100.102 がビルドできた。
ただ、GUIのツール類の起動が不安定で、起動できたりできなかったりする。
起動できない時は Segmentation fault 落ちている。 今のGit版だとMac用のオプションが渡る?のかビルドできない
sed -i -e 's/-stdlib=libc++//' src/gyp/common.gypi
sed -i -e 's/-lc++//' src/gyp/common.gypi
これで本体のビルドはできた
mozc-2.23.2815.102/src/gyp/common.gypi にはこの部分がない
ただビルドは通ったけど /usr/lib/mozc/mozc_tool --mode=config_dialog は
Segmentation fault
あと互換性がまた無くなったみたいでfcitx-mozcのビルドは通らない
結局ここの自動ビルドが通るまで手を出さないほうが良さそう
https://travis-ci.org/github/google/mozc/builds Mac用というかclang用>libc++
コンパイラ決め打ちでコード書かれてそうだね… >>181
ずいぶん昔にclang決め打ちにしてなかったっけ?
いつだが忘れたけど。 clang指定は前から
SUSEはパッチで変更してた
https://build.opensuse.org/package/view_file/M17N/mozc/mozc-build-gcc.patch?expand=1
うちの環境ではclangで問題なかったからいじってないけど、
今のGit版だと「-stdlib 不明なargument」的なエラーが出る
mozc-2.23.2815.102 からこんなふうに変更されてる
- '-std=gnu++0x',
+ '-std=c++17',
+ '-stdlib=libc++',
何だそれと思って見たらこのページがあったのでMac特有なのかなと
https://www.xlsoft.com/jp/products/intel/compilers/manual/cpp_all_os/GUID-E5C78EE6-2C78-42CB-9E18-6D7468B1C33D.htm 真偽不明だけど業務時間外しかGitHubにexportできないらしい
https://twitter.com/ikunya/status/1259462383027683328
Travis CIの自動ビルドが通るところまではお願いします
https://twitter.com/5chan_nel (5ch newer account) これでmozc-gitをビルドできてiBusでの入力もできた、
sed -i -e 's/-std=c++17/-std=gnu++17/' src/gyp/common.gypi
sed -i -e 's/-stdlib=libc++//' src/gyp/common.gypi
sed -i -e 's/-lc++//' src/gyp/common.gypi
けどMozcのGUIツールはSegmentation fault
ここ数年Fcitxしか使ってないからiBusよく分からないけど、警告がやたら出る
IBUS-WARNING **: --- has no capability of surrounding-text feature
7月頃にそうなったみたい
https://twitter.com/yassan168/status/1281420811941732353
https://twitter.com/5chan_nel (5ch newer account) >>183
LLVMのリポジトリにLinuxやBSDでも-stdlibを試すテストコードがあったから
Mac固有ってことはないと思う、けどよくわからん
clang自体のビルド時にlibc++の存在を認識させる必要があるとかかも 他スレから誘導されてきました。
日本語入力状態で数字の初期入力が全角になるのなんとかなりませんか?
半角数字使いたい派です。
F10押したり変換したりすればいいだけなのでしょうが… >>187
Mozcツールの入力補助のところに半角全角の設定があるぞ >>188
そういう設定ちゃんとあったんですね。
快適に入力できるようになりました。
ありがとうございました。 昨日の更新で、GUIツールがSegmentation faultで落ちる問題は修正されたみたいだな。 日曜日に作業してくださってありがたいような申し訳ないような
気になるのはMozc開発者で日常的にLinuxデスクトップを
使ってる人がいなさそうなところ
GUIツールが落ちるのは、実機で使ってればすぐ気づくと思う ibusはgithubのmasterを使わないとVala 0.50.1ではビルドエラー
ibusのconfigureオプションには --disable-surrounding-text を付ける
そうしないと入力時のWarningが激しい
ただし公式パッケージで無効にすると他言語のユーザーから苦情が来そう
https://github.com/ibus/ibus/issues/798
なので ibus-master/client/gtk2/ibusimcontext.c の389-396行を消して、
警告メッセージを出さないようにするほうがいいかもしれない(試してない)
一応動いたけどFcitx非対応なのがつらいところ もともとMozcはFcitxをサポートしてない
サポートしてるのはemacsとibusだけ
https://github.com/google/mozc/tree/master/src/unix
Mozcの仕様変更があるとFcitxでは動かなくなる
今まではFcitxの開発者が後追いで対応してたけど、
今回だいぶ間が空いたから放置になるかも そういや、ibus-mozc削除の話はどうなったのかね。いつの間にか立ち消えかしらん。
Androidとnaclは消えたよね?話題にならんけど。
しかし、今の状態だといろいろとやりづらいなぁ。
Androidは旧コードでもLolipopぐらいまでしか対応していないから、どこかのタイミングで大幅に手を入れなきゃいけないんだよね。
でも今のmozcはコードが安定していないからフォークする度胸が……
あと、今回のコミットでbazelとかabseilとかを採用しているけど、google謹製ツールはドキュメントとか不安でしょうがない。
(gypは酷かった) >>197
出来るならフォークした方がいいんじゃない?
一応、f-droidの方には最新版あがってるっぽいが >>197
出来ればここのこのキーボード実装していただければありがたい
f-droidにmozc改として上げていただければ
なんかtitaniumのこれビルドできない人続出らしいし
Titanium.X Mozc Custom for Android
https://titanium.locker.jp/mozc/
https://titanium.locker.jp/mozc/images960/p513.png >>198
>>199
android9でもまともに動いてる?
エミュレーターだとキーボード画面が潰れてまともに使えない状態。
もし動いているようなら参考にしようかと。 せんとくんと赤帽はibus-kkc主流っぽいけど
あっちって現状何か変わったっけ…
繁体字簡体字を使う人にはfcitx-mozc一択なのかも知れんが kkcって英語キーボードだとめっちゃ使いにくくね? わからん
21世紀に入ってから英語キーボード使ったことが一度も無い。。。。。
ウラジオストクのネカフェには日本語キーボードなんて無いだろうなあ 嫁がmozcでキーボードがローマ字入力しかないって泣いてる >>206
Linuxで「かな入力」をする方法
http://note.kurodigi.com/linux-input-kana/
fcitxでの設定方法も載ってます
「ibus ローマ字入力」でググったら何故かヒットしました https://mao.5ch.net/test/read.cgi/linux/1601066241/414
に誤爆しちゃった…。
でも大陸中国の人たちがfcitxを愛用する理由が良く分かる話でした
なお、大陸中国で、OS問わず最もメジャーらしいSogouは開発途上
manjaroさんに入れるには手順が大事だそうです
※これもまたfcitxと組み合わされる
See: https://www.codenong.com/js3dfb3796696c/ >>207
ありがとうございます
最新のcloudreadyをインストールしたら以前はGoogle日本語入力だったのに今回は入ってなくて困ってました
cloudreadyにGoogle日本語入力がインストール出来れば簡単なのですがみつからないのです >>209
実体はDebian 10 busterベースらしいので
$ sudo apt install fcitx-mozc
相当のコマンドを打つなり、synaptic相当のGUIアプリケーションなりを使うことになるとおもう
ただ、あくまで「制限」のあるものなので
リポジトリに無いかも知れない
その場合はソースからビルドしてdeb化…なんだけどビルド環境が無かったら…最悪debファイルをtar ballにすれば行けるか??
他のマシンでdebをtar ballへ変換してクラウド経由で持ち出せば行けるんじゃないかなあ、多分
あとはWayland関係の問題があるっぽい
「Google日本語入力」とは直接関係ないけど、フロントエンドの関係があるから
必要な範囲で調整が要るだろうね cloudready中心なblogとか
qiitaの記事とか
teratailとか
その辺が情報源になるかも 直接入力とひらがなが普通に切り替わる気がするんだけどibus-mozcの挙動変わったの? fcitx-mozcからfcitx5-mozcに切り替えようかと思ったけど、
KDEを使ってないからかfcitx5の設定画面がやたらフリーズする fcitx5設定ツールのオプションパッケージを入れたら設定ツールが落ちなくなった
kdeclarative kirigami2
この2つを入れるといろんなパッケージがいっしょに入るので、
どれが効果あったのかわからない ふぁいてぃくす5はqtが好きと
何処かで見たような GNOMEはibus以外死ねという感じなので
自然とfcitxはKDE寄りになる >>202
neologdの作者さん元気そうだった
twitterやめてmstdn.guruにしたみたい
何かあったのかと思った
>>215
git版がおすすめ
そろそろFcitx5に切り替わるかもなあ >>171
大した更新はないのね
Haiku版はそのままでいいや ttps://ja.wikipedia.org/wiki/Google_%E6%97%A5%E6%9C%AC%E8%AA%9E%E5%85%A5%E5%8A%9B
>言葉と言葉のつながり(コロケーション)をもって変換精度を高める処理[注釈 2]や、言い間違い[注釈 3]を訂正する処理については実装されているものの、
>それを実現するための対応するデータが実質的に含まれていない点もGoogle 日本語入力と異なる点である[35]。
これって今でもそうなの?この辺の処理に必要なデータを登録し使用することは出来ないのか・・・ >>223
「対応するデータ」があれば変換精度に反映させられるようにも読める >>223
> 言い間違いを訂正する処理
このファイルに追加登録すればいいと思う
src/data/dictionary_oss/reading_correction.tsv
雰囲気 ふいんき ふんいき
> 言葉と言葉のつながり(コロケーション)をもって変換精度を高める処理
これかな?
src/data/dictionary_oss/collocation.txt
猫を飼いたい
マグロを解体
// これは有効になってないかも >>220
> 大した更新はないのね
差分はかなり大きい
新バージョンのgccとかpythonに公式が対応してくださるのは助かる
土日にgoogleのひとがプライベートでやってくださってるようで感謝しかない
debianの kinput2_3.1-13.diff をみたら2421行あった
こうなるとたいへん >>224-225
サンクス、そこか。コロケーション辞書ってそういう形式なのか
がんばってデータを用意しても連文節変換能力はお察しなのかな
この辺の話ってググっても詳しい情報が出てこない気がします Fcitx 、Flatpak版があるけど、Flatpakアプリに入力出来ないってなぜ? 現状flatpakアプリはIM使えない
IM側がflatpakかどうかは関係ないと思う コピーしてきた日本語をペーストはできるんでしょう? そんな不自由がまかり通るなら一般の日本人は使いたくないだろう
とはいえFlatpak自体は良いものだとは思う 自分はfcitx4使ってるんですけど
fcitx5使っている方、使い心地はどうですか? 5使いたいけどcitx-mozc-ut-unifiedが対応してくれたら >>233
5のutパッケージあったから切り替えてカタカナ英語辞書をサジェストのみで追加して使ってるけど問題ない4より軽い気がする mozc文字パレットの起動時
文字の大きさがいつも'最小'になっている。見づらいので
起動時から'中'か'大'にしたいけど、どこを弄れば
よいか教えてお願いデス。 >>96
とても気になるコメントですね。
過去ログにMozcが個人情報と関係するという
コメントがあったので >>227
collocation_rewriterのコードを読むのが一番早い FcitxかiBusと連携するかな漢字変換ツールを作りたいんですが、どこかにドキュメントあったりしますか? 某iOSキーボードアプリがこれ使ってるのだけど、
変換が本当にクソ。
これって作者の実装が悪い? user_dictionary.dbはprotobuf。ソースはmozc。mozcのレポジトリにprotoファイルあるからそれ使えばおk ローマ字のテーブルなんて長年変わらないと思ってたけど
地味にsw行やzw行の定義が増えてんのな GYP build will stop supporting IBus client. · Issue #567 · google/mozc
https://github.com/google/mozc/issues/567
・ Gtk2 based candidate window for IBus will be removed.
Qt based candidate window is the alternative.
・ GYP build will stop supporting the build of IBus client.
Bazel build is the alternative.
・ Then, pull requests for IBus client and Qt based candidate window will be acceptable. >>257
arch linux とかgyp ビルドのままだけど、どうすんのかな。 >>258
bazel ビルドに移行するしかないのでは?
移行できないのなら、gyp ビルドをサポートしたバージョンで留まるしかない >>258
fcitx5-mozcは既にbazelに移行してる >>260
bazelビルドに対応しているということと、bazelビルドに移行するということは全く別の話。
確かにfcitx5-mozcはbazelビルドの際に必要となるファイルを既に提供済みだが、
gypビルドにするのかbazelビルドにするのかは、各ディストリビューションのパッケージャーさんの判断にかかっている。
現状では、ほとんどのディストリビューションでgypビルドを行っている。 自分でandroidビルドをメンテナンスしているんだけど、bazelでのビルドは失敗するから未だにgyp使っているんだよなぁ。
bazelそのものが最新NDKに対応できていないから、いっそのことAndroid公式のcmakeに移行したほうがいいかね。
誰かcmake対応してたりしない? 1人で頑張らずにフォークして公開した方がいいのでは??
androidビルドしたい人なら多いだろうし >>263
上げるんだったらgyp削除してコード整理してからにしたいなぁ。その目処が全然立たないけど。
誰かandroid mozcのbazelビルドsoファイルを動かせた人いる? androidビルドのフォントサイズ問題が解決できない
どうやってandroid版をメンテしてるのか気になる >>265
フォントサイズは気にしない。
配列プレビューでレイアウト崩れているけど後回し。 fcitx5-mozcの辞書ツールとか単語登録とかが右クリックで出ない場所に隠してあって草も生えない メモ
NDK,SDKを更新,NDKはr18bにする
SDK更新の際には旧SDKから上書き保存する
android-22 → android-29
TargetApi(21) → TargetApi(28)
'ndk_target_api_level': '28'
android:minSdkVersion="25"
android:targetSdkVersion="29"
implements InputConnection → extends InputConnectionWrapper
org.apache.http.legacy.jar → android/libs
細かいエラーを修正 メモ
wayland環境でchromeとfcitx5を共存する方法
→ chromeの起動オプションに「--gtk-version=4」を追記
>>268
×SDK更新の際には旧SDKから上書き保存する
○SDK更新の際には旧SDKを上書き保存する
あとdxとdx.jarを過去のSDKから流用する fcitx5-mozcは変換候補欄がスッキリして好き
それ以外は4と特に違いは感じないな arch系ってfcitx5が自動起動できなくなるが持病化しているよね fcitx5-mozcいつの間にかオレンジ色の○あ右クリックから単語登録できるようになってた
ありがとうございました >>274
うちの Arch 及び Arch 派生は自動起動するけどな Garudaだけどここ最近インスコしたものは持病克服してる
半年ぐらい前のやつはできるときとできないときがあるな なんかfcitxのほうが人気やけどibusのほうが良くないか
MX_Linuxでfcitxの方インストールしたら
ひらがな入力中に半角/全角キー押したら勝手に入力した文字消されるし >>279
操作をまちがってる可能性が高いよ
上書きモードになっていると前に入力した文字が消えます ディストロ開発者がmozc-utはライセンス的に標準IMEとしては使えない的な事をツイートしたら、直接言った訳じゃないのにmozc-ut開発者がそれを見つけてスネて配布止めると言い出した
みたいな感じに受け取った >fcitx5一択
というコメントには同意できません >>284
オリジナルデータごとにプロジェクトを分割して、
単一のライセンスのUT辞書を配布
使ってるだけの身なのでよく分からないんだけど
一生懸命やって下さってる方がいるんだね いい歳したおっさんが公開停止という強権を持ちだして
まだ学生のガキンチョを悪者に見立てて潰そうとしているようにしか見えん。。。
今まで苦心惨憺あって続けて来たのだろうけど見てて気持ちの良いものではない まぁ、UTは「ディストリビューション向けのパッケージを公開している人は、削除してください。」なんて主張できるんだから、ライセンス的に危険というのは正しかったな。 >>285
「mozcに変更を加えるのにライセンス上同一パッケージで配布できないのでディストリ開発者からすると使いづらい」のはそうだろうけど
それは周りが好意的に解釈した結果であって、元発言はそんなこと考えてないと思う… >>292
alter linuxで聞かれているんだから、ディストリ開発者の視点で回答しているのは当然だろ。
発言を切りぬいた断片で、ロクに調べない無能が脊髄反射して暴れるのはtwitterの問題点だな。 そもそもIPAdicの1999年のライセンスの時点でnon-freeだし、canna / Wnn系以外の著作権者不明の辞書ほぼ全部アウトだからなあ。。 >>291
そのためにCC BY-SA 4.0が出来てGPL v3と互換性が確立された訳でし 昨今流行りのAI系技術を応用して既存の文書からかな漢字変換用辞書を作れないのかな
単語だけでなく優先度や依存関係も同時生成する感じで 既存の文書からの自動学習なんて二十年以上前のATOKやWXGの時点で実装されてたぞ >>300
その「既存の」文のライセンスの扱いが微妙
青空文庫でも使え? まあ辞書部分については
1. 文字情報技術促進協議会の成果物から、二次的著作物を作成します
2. CC BY-SA 2.1 JP第5条bに基づき、二次的著作物を全体としてCC BY-SA 4.0で頒布します
3. 二次的著作物を用いて、GPLv3の成果物を作成・頒布します
で合法と主張する余地があるからなあ。
二次的著作物のうち「本作品」由来の部分につきCC BY-SA 4.0で頒布することを禁止する条項が無い。 私は弁護士ではありません。弁理士資格・司法書士資格・行政書士資格も有しておりません。
上記書き込みに関しては、適切な法・書面・電磁的記録等での同意によって命ぜられない限り、利用ないし利用不能の結果生じた一切のことについて、通常損害・特別損害・偶発損害・間接損害等、一切の責任を負いませんのでご了承ください。損害が生ずる可能性について忠告されていたとしても同様です。 >>300
あれだと変換結果が望ましくないものであってもその原因の調査や調整ができない
>>301
それはちょっと前に法改正されて障害ではなくなった
無償で読めるニュースサイトなどの記事をもとに辞書を作成する程度なら問題にはならない 著作権法改正がAI開発に与える「衝撃」
ttps://h-bank.nict.go.jp/event/pdf/taichikakimuma190306.pdf fcitx5-mozcを入れると候補ウィンドウが正しく表示されない環境がある。その環境でもfcitx-mozcは正しく動作する。なんで? Linux板ですみません、Windows向けにビルド済みのUTってどこかからDL出来たりしませんでしょうか
mozcはGithubのガイドに従って他の方がビルドされたものをDL出来たのですがUT系はやっぱり自分でビルドする他ないのでしょうか >>309
候補文字と説明がオーバーラップするやつかな >>318
copyleftじゃないと長期に続けるのはなかなか難しいけどな
*BSDもOpenAMも開発リソースが分散しちゃってどうにもならない >>311
ttps://github.com/google/mozc/blob/master/docs/build_mozc_in_windows.md
UT辞書を↓に突っ込んでからmozcをビルドしてください
/mozc/src/data/dictionary_oss/dictionary00.txt 最近Linuxでmozc-ut使ってるけど、アップデートする度むちゃくちゃアホな変換出てくるのあらかじめ削除できんもんかのう。 gnomeにibus-mozc入れてみたがgeditを始めgnomeアプリだけで挙動がおかしいな
単語を変換するとカーソルに同じ単語が挿入されて二重入力みたいになる
ちなみに他のアプリじゃ特に不具合無くいい感じ うちの Debian11、Ubuntu22.04LTS では確認出来なかった
Gnome、ibus-mozc、gedit で正常に動く >>325
俺はソースコードのdictionary_ossディレクトリから「!」で終わる単語を抽出して「抑制単語」として登録した辞書を作ってる
タイトルや流行語がほとんどなのでなんじゃこりゃってなる候補が大幅に減った、気がする >>326>>329
GTK_IM_MODULE消せばOK >>330
ありがとう
gnomeアプリで正常に文字入力ができるようになったが
mozcの文字入力・変換で使われるキーを含むショートカットキーが機能しないな…
それでも入力ソースを切り替えればいいだけだし、kkcを常用するよりは快適だね