mozc / Google 日本語入力 #4
- ibus-mozc Mozc に同梱 (サポートしているのは ibus-1.4 以降のみ) - fcitx-mozc fcitxプロジェクトによる提供 http://code.google.com/p/fcitx/ - uim-mozc macuimプロジェクトによる提供 http://code.google.com/p/macuim/ - scim-mozc mozc-1.6.1187.102 以降からサポート打ち切り ・Mozc 設定ダイアログ コマンドライン・ プロパティ /usr/lib/mozc/mozc_tool --mode=config_dialog 辞書ツール /usr/lib/mozc/mozc_tool --mode=dictionary_tool 単語登録 /usr/lib/mozc/mozc_tool --mode=word_register_dialog 文字パレット /usr/lib/mozc/mozc_tool --mode=character_palette 手書き文字認識 /usr/lib/mozc/mozc_tool --mode=hand_writing 前スレ落ちていたみたいなので立ててみた。 補完よろ。 >>4 環境によって /usr/lib/mozc/mozc_tool の部分は /usr/lib64/mozc/mozc_tool /usr/libexec/mozc/mozc_tool /usr/lib/mozc_tool /usr/lib64/mozc_tool /usr/libexec/mozc_tool に変わる場合があるので適時読み替えでよろ。 お約束 ttp://www.freebsd.org/ja/copyright/freebsd-license.html 本ソフトウェアについては、明示黙示を問わず、 商用品として通常そなえるべき品質をそなえているとの保証も、 特定の目的に適合するとの保証を含め、何の保証もなされません。 辞書関連、ライセンスが抜けてるので追記しておくよ。 Mozc UT Dictionary (GPL) http://www.geocities.jp/ep3797/mozc_01.html Mozc+dict (再配布可・商用利用不可) http://linux.ikoinoba.net/index.php?UID=1279543844 会社のPCにMozc+dictをインストールして使うのはライセンス的に×の可能性あり。 >>Mozc UT Dictionary (GPL) GPLじゃねえよ。 altcanna, jinmei, skk: GPL hatena: unknown edict: Creative Commons Attribution-ShareAlike Licence (V3.0) niconico: unknown ruby/shell scripts: GPL ・ニコニコ大百科IME辞書から単語を控えめに追加。 ライセンスに不安があるのでデフォルトでは無効にしています。 2年近く配布されていて、 トラブルになってはいないようですが。 ごめん、だれか解説よろ 18 名前:login:Penguin [sage] :2011/09/23(金) 12:00:32.29 ID:r4LuT+BE >>44 > 会社のPCにMozc+dictをインストールして使うのは > ライセンス的に×の可能性あり。 アホかと。 「商業利用」の意味を履き違えているな(w 無知すぎてワロタw <わからない9大理由> 1.読まない …参考書などを読まない。読む気などさらさらない。 2.調べない …過去スレ、ググるなど最低限の内容も自分で調べようとしない。 3.試さない …めんどくさいなどの理由で実行しない。する気もない。 4.覚えない …人から聞いて、楽して得た答えは身に付かないから、すぐに忘れる。 5.説明できない …何に困っているのか、第三者に正確に伝わる文章が書けない。 6.理解力が足りない …理解力以前の問題で理解しようとしない。 7.人を利用することしか頭にない …甘え根性でその場を乗り切ろうとする。 8.感謝しない …教えてもらって当たり前。事がすんだらさようなら。 9.逆切れする …自分の思うようにならないと逆切れする。 ★教えて君五大要素★ 1 読まない (文盲) 2 調べない (能なし) 3 試さない (発想力欠如のアホ) 4 理解力が足りない (馬鹿) 5 人を利用することしか頭にない (死ね) YES → 【見つかった?】 ─ YES → じゃあ聞くな死ね / \ 【探した?】 NO → なら、ねぇよ \ NO → 死ね mozc導入 @ ubuntu,LinuxMintとかとか 各OSの日本語化を行った後 ・ibus-mozc sudo apt-get install ibus-mozc mozc-server mozc-utils-gui ibus再起動、インプットメゾット日本語選択でmozc出るし ・fcitx-mozc sudo apt-get install fcitx fcitx-mozc fcitx-frontend-gtk3 fcitx-ui-classic fcitx-config-gtk im-config -n fcitx ログインしなおし これほんと? ttp://tkamada.blogspot.com/2012/02/mozcgoogle-update.html > 結論からいうと、mozcにはOmahaが入っています。したがって、mozcをインストール > したことはGoogleが把握していますし、どのバージョンが使われているかをGoogleは > 知っています。どのマシンで使わているかもGoogleは知っています。もしかしたら、 > 勝手に最新版に置き換えられているかもしれません。 軽くに grep したところ omaha は win32 かつ Google Japanese Input だけで使われる (Mozc なら使われない) 模様。 以前調べたときは curl で統計情報を送信する処理は Linux版の Mozc では実行されない。 前スレ350より で、まとめるとこんな感じの模様: ■Google日本語入力/Mozcプロジェクトには以下の3種類のプロダクトがありそれぞれ異なる。 1) Google日本語入力安定版 2) Google日本語入力開発版 3) Mozc ※プラットフォームに関係なくGoogle日本語入力開発版とMozcは別物。Winでも特に指定なくビルドした 場合MozcになりGoogle日本語入力開発版とは中身が異なる (Omahaとか)。 ■Google日本語入力がGoogleと通信する情報は少なくとも以下の3種類。 a) 使用統計データ b) 障害レポート (Google-Breakpad) c) 自動アップデート (WinはOmaha、その他のプラットフォーム用のコードは入ってない模様) ■プロダクトと送信情報の関係 使用統計データ 障害レポート 自動アップデート Google日本語入力安定版 任意 任意 Winは常に有効(?) Google日本語入力開発版 常に有効 常に有効 Winは常に有効(?) Mozc Linuxでは無効*1 無効 無効 *1 Linux以外は未確認 336のブログの中の人はGoogle日本語入力開発版とMozcがごっちゃになってると思われ。 893 名前:login:Penguin [sage] :2013/09/01(日) 23:46:21.05 ID:MJi1QPkC launchpadで非公式パッケージ公開してる人がいるから、 使わせてもらえばいいんじゃない https://launchpad.net/ ~ikuya-fruitsbasket/+archive/fcitx/+packages https://launchpad.net/ ~ikoinoba/+archive/depend/+packages 自分は使ってないのでパッケージの信頼性はわからない そこは自己責任で 1522はWindows用のバグ修正だから、1502でもいい http://code.google.com/p/mozc/wiki/ReleaseHistory >>12 ・Mozc と Google日本語入力 の比較・ http://code.google.com/p/mozc/wiki/AboutMozc このページを見てもMozcは送信していないことは明らかなのだけど、 Google日本語入力開発版とごっちゃにして物を言う人が今だに居るよね。 12.04でビルドしたけどあまりにも簡単すぎてビビった が、いちいち手動でファイルを配置しなきゃいかんってどういうことよ ut-dictionary入れるとmozc-serverが30M近くになるな これはどういうことなんだぜ? https://code.google.com/p/mozc/issues/detail?id=215 Moscではこれまでユーザーデータの保存時にOpenSSLで暗号化してましたがこれからはデフォルトではそれやめて (平文で) 保存しますよってこと? >>19 Mozcはメモリ量に応じてメモリ消費量が変わる(メモリが多ければそれだけ多く使う)みたいなこと過去スレで 誰か言ってたはず。 今まではとりあえず暗号化してたけど あんまちゃんと考えた暗号化じゃなったからもうやめます、ってことじゃね。 ちゃんと暗号化したかったらシステム側でやってね、と。 "user data" の定義がされてないからその意味があやふやなんだよな まあだいたいわかるけど、「まあだいたいわかる」ってのに依存して書いてるのがとても学生体質 モノがOSSのMozcとはいえ、サラリーマンの仕事としては失格と思うサラリーマンはオレだけなんだろうか Googleさんがトヨタあたり向けに情報サービスの仕事してみてほしいかな、と思ったり まぁ commit log ならこのくらいでいいんじゃね。 もっと詳細知りたければコード読めばいいよ。 Mozc-1.15.1785.102 をテストしているが、 これはこのままパッケージとして出していいか悩むな ibus-mozcの初回起動が必ず「直接入力」になる 全角半角を押して「a」を押すと「a」としか出ない ibus-mozcはGoogleではメンテしないらしいし、 そうなるといろんな人のパッチが雪だるまになって 昔のkinput2みたいになるのは時間の問題 そもそもfcitx-mozcもuim-mozcもibus-mozcも mozc本体にパッチ当てる形でしか作れないのが痛い かといって部外者がmozcチームに参加するのは難しく、 ポリシー的にバグ報告のパッチすら見られないという fcitxはfcitx-mozcリポジトリを作って、 自分らで好きなようにコミットできる場を作ってる しかしそこにibusやらuimやらのコミットを期待するのはお門違い ibusはたぶんmozcのサポートをやらない RedHatの日本語エンジンが動けばいいんだろう というかもうよく分からん 最近のibusはいろいろ問題起こした uimはmacuimの人がやってるけど、 Mozc-1.15.1785.102では追加対応が必要みたいだ そのままだとビルドできない 使い勝手は別として、 確実にLinuxでmozcを使いたいならfcitxとemacsか >>26 >ibus-mozcの初回起動が必ず「直接入力」になる >全角半角を押して「a」を押すと「a」としか出ない ibus-1.5 では ibus は常に有効状態であり、日本語入力と直接入力の切り替えは mozc の入力モードの変更によって行う、ということを理解してその様に使っている ユーザーにとっては、今回の "mozcの初回起動が必ず「直接入力」になる" という 仕様変更はむしろ歓迎されるべきもの。 逆に ibus-1.4 と同じ使い方に何時までもこだわって ibus の ON/OFF によって 日本語入力と直接入力を切り替えているユーザーにとっては >>26 の様な不満が 出て来るだろう。 >>27 uim-mozc は macuim の rev.334 で 1.15.1785.102 に対応した。 >>28 changelog を読むと分かるが、現在の ibus では日本人開発者が積極的に関わっている。 >>29 >>28 がダメって言ってるのはFcitxじゃね? FIX: The initial mode of ibus-mozc shouldn't be Hiragana with IBus 1.5+ ( Issue 201 ) >>29 > 仕様変更はむしろ歓迎されるべきもの。 uim/fcitxとの整合性が取れないし、とにかく面倒 「日本語入力と直接入力の切り替えはmozcの入力モードの変更によって行う」 を現状ibusでやろうとすると、 1. ibus-setupで「次の入力メソッド」のショートカットから 「Hankaku/Zenkaku」を外す(ibusにショートカットを取られないように) 2. mozcプロパティ => キー設定で Hankaku/Zenkakuキーへの機能割り当てを「入力モードの変更」にする (まんまそのものは無いし手元で動かないけど便宜的にそう書く) mozc本体のプロパティをいじるとuim/fcitxが巻き添えを食う ibus-mozcのツールバーはmozcアイコンしか表示されないから、 mozc内での入力モード変更だけになると今ひらがなモードか直接モードか分からない 「とにかく歓迎」っていうなら上の1.2.に合わせたショートカット変更パッチを 書かないと使い物にならない > 仕様変更はむしろ歓迎されるべきもの。 mozcを使うことに限って言うと、 ibus-mozcをサポートする人がいないまま、 ibusの仕様変更だけが進んでしまってる状況がまずい 仕様変更にあたってmozcとか影響を受けるプロジェクトに 事前説明をしてればまだ話が穏やかだったかもしれないが、 そういうのもなかったらしくGoogleの人もさじを投げた まあmozcも外の人から見れば全然過程が分からないけど uim-mozcのビルドもいきなり通らなくなったし 一番いいのはibusチームがibus-mozcリポジトリを作って、 fcitxみたいに自前対応してくれること ibus-mozcが宙に浮いてるのでどうしたものかと思う カットするにはユーザ数が多いし ポリシーを通したいならある程度周辺の面倒も見ないといかんのでは、 ibusチームさま >>32 事実誤認が有るように思う。 >1. ibus-setupで「次の入力メソッド」のショートカットから「Hankaku/Zenkaku」を外す ibus-1.5 のデフォルト設定では、このショートカットキーには Super+Space のみが割り当てられていて Hankaku/Zenkaku は割り当てられていない。 もっとも、ユーザーが過去に Hankaku/Zenkaku を割り当てていてその設定を引き継いでいる環境では、 ショートカットキーから Hankaku/Zenkaku を外す作業が必要となるが。 >2. mozcプロパティ => キー設定でHankaku/Zenkakuキーへの機能割り当てを「入力モードの変更」にする mozc のデフォルトのキー割り当てでは、Hankaku/Zenkaku で日本語入力(ひらがな入力)と直接入力の モード切り替えが出来る様に設定されている。 従って入力モードの切り替えに Hankaku/Zenkaku を使用している限りにおいては、mozcのキー割り当てを 変更する必要はない。 >「とにかく歓迎」っていうなら上の1.2.に合わせたショートカット変更パッチを書かないと使い物にならない 上に書いたことから判る様に、ショートカット変更パッチを書く必要などない。 >ibus-mozcのツールバーはmozcアイコンしか表示されないから、 >mozc内での入力モード変更だけになると今ひらがなモードか直接モードか分からない これは確かに指摘の通り。 だから ibus-1.5.5 以降ではプロパティパネルというものが実装された。 もっとも、これはちょろちょろと表示されて些かウザいと思われたか、ibus-1.5.7 ではデフォルトで 非表示設定となってしまった。 ちなみに、 openSUSE の ibus-mozc では mozc の入力モードに応じてステータスアイコンが 変化するパッチが当てられていて便利。 openSUSE の中の人はこのパッチを ibus 本体に取り入れてもらおうと交渉した様だが、ibus 側から拒否された。 フリーでオープンな世界で >>28 みたいなことを言うのがわからん が、時々見かける 日本人と知るやどうこう言ってくるヨーロッパの人もいるし 昔のanthy/uim周りの開発者の医学部生が >>28 ふうの臭いをブログで出してて、 (未来の)患者さん大丈夫かなと思ったりした 入力フレームワークって言語ごとに作ってたらキリがない だからいろんな国の人と協力する必要がある 英語でやり取りするし対面じゃないのであんまり国を意識することもないけど 日本語に対応するには日本語の知識が多少なり必要なわけだが、 作者さんのtwitterってこんな感じ https://twitter.com/CSSlayer https://www.csslayer.info/wordpress/diary/%E7%99%BE%E5%BA%A6%E6%9B%B4%E6%87%82%E6%97%A5%E6%96%87%EF%BC%88%E5%A4%A7%E6%A6%82%EF%BC%9F/ >>28 みたいなのは本当に恥ずかしい >>33 >ibus-mozcをサポートする人がいないまま これはどういう意味なんだろうか? ibus-mozc を提供しているのは今でも mozc 本体だろ? >uim-mozcのビルドもいきなり通らなくなったし mozc のバージョンが上がればビルドがいきなり通らなくなるのは当然あり得ることだろ? そんな状況に毎度対応してくれている uim-mozc の人には感謝だが。 >>34 を一部訂正 × openSUSE の ibus-mozc では ○ openSUSE の ibus では > uim/fcitxとの整合性が取れない > mozc本体のプロパティをいじるとuim/fcitxが巻き添えを食う 俺は mozc のひらがな入力と直接入力の切り替えに Shift+Space を割り当てるように変更している。 で、fcitx-mozc や uim-mozc も時々使う。 fcitx と uim ではその ON/OFF のショートカットキーに Shift+Space を割り当てている。 そんな環境でも「uim/fcitxとの整合性が取れない」と感じたことはないし、 mozc のキー割り当てを変更したことで uim/fcitx が変な巻き添えを食らったなどと感じたことはないけどなぁ。 >>34 フォローありがとう 今バテバテなので、あとでいろいろ考える 流れ的には、 ・ibus-1.5.7のsidアップデート来ない バグトラッカー見たらパッケージャーさん苦労してるみたい ・mozcのソースパッケージが出ない そういうポリシーになったんだっけ ・uim-mozcのビルド通らない 解決したらしい ・ディストロのprotobufだとmozcツールが起動しない gitリポジトリのやつじゃないと動かない ・ibus-mozcの初回起動が直接入力になる 前までは問題なかったが ↓ どうしたものかと久しぶりにこのスレ mozcそのものもあれだし、 ibus-1.5.7との兼ね合いを見ずにmozcをアップデートするのもあれだし >>36 > ibus-mozc を提供しているのは今でも mozc 本体だろ? 入ってはいるけど、今後ibusの仕様変更などには対応しない https://code.google.com/p/mozc/issues/detail?id=194 > Jul 16, 2013 > Mozc team is no longer actively developing IBus-mozc nor > catching up with new releases of IBus. >>38 過去の使い勝手に近い設定を考えていくしかないのかな >>34 のパッチとかショートカットも試して、と >>36 > ビルドがいきなり通らなくなるのは当然あり得ることだろ? mozcの人がmacuimの人にそう言ったら破綻しそう しっかり読めてなかったけど >>34 のパッチがいい感じで動けばいいな >>34 >>37 「次の入力メソッド」のショートカットから全角半角キーを外して、 openSUSEのibusパッチを当てたら、 全角半角キーでステータス表示が変わっていい具合になった 感謝 ftp://ftp.jaist.ac.jp/pub/Linux/openSUSE/ports/aarch64/source/factory/repo/oss/suse/src/ibus-1.5.6-1.1.src.rpm 7z x ibus-1.5.6-1.1.src.rpm -oibus_suse cd ibus_suse 7z x ibus-1.5.6-1.1.src.cpio 「show-input-mode-icon.patch」をibus-1.5.7に当てる ibus周りは各人で対処してねってことでいいか 去年のやり取りを見るとほんとみんなibus-1.5で困ったんだな http://web.archiveorange.com/archive/v/vAtTlMXUwbpnVtZMVGUN >>40 > 入ってはいるけど、今後ibusの仕様変更などには対応しない そうだったのか。 それならば >>33 での「一番いいのはibusチームがibus-mozcリポジトリを作って、 fcitxみたいに自前対応してくれること」という提案にも納得。 >>41 ね、入力モードによってステータスアイコンが変化すると便利っしょ。 ただこのパッチ、ibus側が拒否したということは、ひょっとすると他言語の入力システムで 何かの問題が起きる可能性があるのかもしれない。 mozcは自身をライブラリする気がないからIM側が対応すんのめんどくさいんだよ。 だからuimもfcitxもmozcのソースツリーにてめえのプラグインソースを追加してビルドするという手段にするしか無い。 あと、fcitx (だけじゃないかもだが) のネタに書き込んでる輩には中国人か在日中国人も混じってるから(台湾人は除く)。 ut+mozc1.15.1785.102をビルドした(12.04) ibus-1.4だから上の書き込みの影響なし それと、out_linux下のgen_の一個がなくなった なんか普通のOSSみたいにcommitが始まった is why? 文字通りMozcブランチのtrunk(のミラー)になったってことかな? branchのtrunkってのもなんか変だけど。 つうかそういう運営ポリシーの変更の通知とか相変わらず全然してくれないのな。 反確全角キーで入力切替するのって、mozcの仕事? それともibusとかそっちの方の仕事? フォーカスが書き込み不可のところにあっても入力切り替えたい iOS8でIMをサードパーティに解放って騒ぎになってんだけど、 iOSでもmozc使えるようにでける? 部首変換ができて感動した 隹 幺 鬯 曰 日 艹 屮 糸 殳 又 阝 阜 刂 彡 羽 屮 どこでも好きなタイミングでON/OFFしたいなぁ どうすれば出来るようになるんだろうか コミットログに新バージョン番号の通知も書かなくなったか。 タグ付けもしねーし。 いまさらmecabのコスト自動推定使ってみたが、 あれは同じ品詞だと同じコストを返すだけなのか mecab-ipadic-2.7.0-20070801 mecab-ipadic-2.7.0-20070801.model // 推定前 本田泰人,,,,名詞,固有名詞,人名,一般,*,*,本田泰人,ホンダヤスト,ホンダヤスト 本田圭佑,,,,名詞,固有名詞,人名,一般,*,*,本田圭佑,ホンダケイスケ,ホンダケイスケ 本田けいすけ,,,,名詞,固有名詞,人名,一般,*,*,本田けいすけ,ホンダケイスケ,ホンダケイスケ 岡崎慎司,,,,名詞,固有名詞,人名,一般,*,*,岡崎慎司,オカザキシンジ,オカザキシンジ // 推定後 本田泰人,1289,1289,6976,名詞,固有名詞,人名,一般,*,*,本田泰人,ホンダヤスト,ホンダヤスト 本田圭佑,1289,1289,6976,名詞,固有名詞,人名,一般,*,*,本田圭佑,ホンダケイスケ,ホンダケイスケ 本田けいすけ,1289,1289,6976,名詞,固有名詞,人名,一般,*,*,本田けいすけ,ホンダケイスケ,ホンダケイスケ 岡崎慎司,1289,1289,6976,名詞,固有名詞,人名,一般,*,*,岡崎慎司,オカザキシンジ,オカザキシンジ 読みと表記の単語帳だけ作って、 そこそこのコスト推定ができればmozcの追加辞書作成が楽になると思ったが JUMANを作ってた人のメモ http://rekken.g.hatena.ne.jp/murawaki/20140402 ド素人が読んでも形態素解析の概略がわかる 全体に面白いけどmozcユーザ的にはやっぱりこれ > MeCab は完全にコーパスから学習するので、あらゆる連接が可能。 > もちろん変な連接には大きなコストが設定されるので、 > 普段は問題が顕在化しない。しかし、未知語が入ってきたときなどに、 > どう考えてもありえない解析結果を吐いたりする。 > MeCab も連接制約のホワイトリストかブラックリストを作って > 入れたらいいのに。 1.15.1834.102 (r271) https://code.google.com/p/mozc/wiki/ReleaseHistory ビルドに Ninja を使うようになったでござる。ニンニン >>66 > Note that you don't need to install Ninja manually, since depot_tools maintains pre-built Ninja binaries. これ今はninjaのインスコが必要だけどそのうち要らなくなるよってことか? なんかめんどくせえな。 違うだろ 手動でninja入れなくていいよ、depot_toolsがバイナリ含んでるから >>70 自分でやったことないくせにしったかしてカキコするやつしかできないレスだな。 こういうバカは2chビギナーなの? >>70 と同じこと思ったけど、>>69 みたいな書き方する奴に教えてあげても嫌な思いすることばっかりだから無視してて正解だったようだ。 sinceには「なぜなら」みたいな意味もあることをしらんのやろうね 1.15.1870.102 Release Historyまだー めーる っていれたら自分のメールアドレスが出るように辞書登録したのだが、(もちろん半角で登録した)変換すると全角で出てきてしまう。 候補選択ウィンドウ内では半角で表示されているので、登録内容は正しいと思うのだが。 Enterで確定したときに全角で貼ってしまうようだ。 似たようなことした人いませんか... EDICTをCapsLock以外で有効にする方法ってあります? Issue 287 - Deprecation of the iBus client code https://code.google.com/p/mozc/issues/detail?id=287 > we will remove the code of ibus from our repository by the end of August 2015 at the latest. 単漢字変換したとき、次から変換順位あげてほしいんだけど どうしたら学習してもらえる? 変換学習って、mozcのしごとだよね? read.cgi ver 07.5.5 2024/06/08 Walang Kapalit ★ | Donguri System Team 5ちゃんねる