日本語入力総合スレッド 5
■ このスレッドは過去ログ倉庫に格納されています
日本語入力ならM$IMEをWineかき混ぜスクリプトで組み込んだ方が早い話 月額版ATOK for Windowsでそれが出来たらええなあ・・。 http://code.google.com/p/sj3/
SJ3はスルーか!
フリーでは多分一番変換まともなのになぜスルーするか
sj3辞書を揃えねばならない メンテが止まってんのはみんな外しちゃえばいいじゃん。 いやや やめて いや
canna wnn prime iiimf scimは削除でええんか メンテが止まってても最近のディストリで使えるものは削除しないほうがいいと思う。
俺は文書書きのメインは WindowsXP で WXG を使ってて、現状はかなり満足してるんだが
今後はどうしようかと。
IME がバージョンアップしてクセが変わるとまたイチから調教しなきゃいけないし。
で、たとえば linux の cannna が DOS の WX3 くらい賢く(最低限 WX2+ 程度でもいい)、
変換のクセも把握しやすくて辞書登録で自分好みの表記にコントロールできるなら、
移行しようかと考えてる。
mozc は? うーん、完璧な変換は無理でしょ。
「彼は言う」「〜という」なんかの「いう」を漢字にするかひらくか、「癖」と書くか「クセ」にするかなど、
自分の思い通りには絶対にならないと思う。
それなら、完璧は無理にしても、辞書登録のやり方で自分好みの表記に大枠をコントロールできるほうが
ストレスがたまらない。
SKK は表記を完璧にコントロールできるんだけど、コントロールするための負担が大きすぎて
オレにはあわなかったw
3週間ぐらい頑張ってみたんだけどね。 >>13
「最近のディストリ」っていうのの定義が曖昧だけどね。
まあ、メンテが止まってても受け皿としてこのスレがあってもいいような気もしてきた。 未だにwxg for linuxをがんばって使っている人もいるぞ(俺) >>13
Mozc今、使ってる。
最適化辞書をユーザー辞書として登録すればかなり使いやすいけど >>15
そんなにがんばらなくてもいいと思います。 >>20
uim-skk
scim-skk
iBus-skk
困らん >>21
しかし、Emacsのddskkと機能が違ったりするんだよね。
日本語入力関係ないが、english-dvorakをEmacs以外で使えないものか。 >>22
細かい部分はね。
本格的に文章を入力する時はEmacsだから問題ないなあ。 >>22
しかも、どれもこれもあまりメンテされていないし。 メンテがとまってるっていわれたらwnn6,7,8も即死じゃん…
バグじゃないけど、まだまだ改善する余地はある
っていうか、メンテされてないわけではないよ
NEWS見ればわかるけど、さりげなく少しづつフィックスされてる
でも、もう何年もほとんど機能追加が行われていない
ipv6のskkserveがサポートされたぐらいか いつも思うんだけど、
C-jって、newline-and-indent だよね
このバインド奪われると、個人的にはいらいらするんだけど、
みんなはあんまりC-j使ってないもんなの?
SKKも>>32もそうだけど、デフォルトが平気でC-j奪ってて驚く
returnで改行する人のほうが多いのかな? C-jが奪われるのって、どんなIM?
そういうはなしじゃない? >>37
むしろ全ての環境でC-jはIM系のオン/オフに設定。
WindowsやMac OS Xさえも。 >>33-35
Rubyどころか、そこに書いてるNendoってRubyに乗っかったLispだぜ。
まあ、Sumibiの作者の人だから。あっちもSchemeだし。 >>32を見て思いだした。
AZIK入力を覚えたいんだが、他環境で日本語入力が
できなくなりそうで、躊躇してる。
使ってる人いる? ここにいる
1.他環境で日本語入力に困難を覚えるのがいやだから、一番よくつかう自分の環境でも多少の不便を我慢する
2.他環境でたしかに日本語入力にストレスを感じるが、時間比で98%利用している自分の環境でもっとも快適な日本語入力を構築する
このどっちかを選べばいい >>44
そう言われればそうだな。
SKKを使ってて、いまさら他環境がどうとか言ってもしょうがないかw
挑戦してみることにしよう。レスthx。 確実に変わる。いままでケータイで文章打ってた人間がキーボードにしたくらい変わる
キーの組み合わせの総数が増えるからはじめは戸惑うけど、慣れるとどうしてあちこちの
日本語入力にAZIKがプリセットされてるか納得する
まあ、どんな入力方法でも「慣れたら最強!」なんだけどね >>47
>まあ、どんな入力方法でも「慣れたら最強!」なんだけどね
ddskkで月配列使ってるけど、emacsから出られない
困った >>47
M式をPWP-100で初めて使ったときのカルチャーショックを思い出した。
にしても、いまや親指シフトですら事実上の絶滅状態なんだよなぁ。 AZIKうずうずしてきた。いや、だめだ。前に挫折したじゃないか。でも… WXG for Linux / FreeBSD Version 1.0 βって
ubuntu10.04でも使えるんでしょうか。 >>43
>>49
AZIKのDvorak版であるACT使ってるけど
Emacs -> ddskkに入ってる
Linux の uim-skk -> 最新版で使えるようになった
Windows -> SKKIMEで配列を頑張って変更すればほぼ使える
と,割と汎用な環境で使えてる.
USBメモリにソフト入れてるしから他人のWindowsでも大丈夫.
ただし会社によっては「USBメモリ一切使うな,与えられたパソコンにもソフトインストール不可」
ってのもあるらしいからビクビクしながら過ごしてる. >>52
FreeBSDならcompatとlibmapで動くかもしれんが、Ubuntuだと依存ライブラリ的に無理だと思う。 http://d.hatena.ne.jp/nokuno/20101123
> 統計的自然言語処理エンジンStaKK を開発しました。
こんなの出てるな。
期待してみる。 >>56
> 現在は、StaKK は辞書として Mozc (Google日本語入力のOSS版)のデータを使っています。
どうかしてるぜ。 wikipediaの見出し語とか小見出しとかを収集した辞書ってどこかに置いてないかなあ? >>58
こんなのはどう?
ttp://ikazuhiro.s206.xrea.com/staticpages/index.php/wikipedia-fpw >>59
skk辺りだと電子ブック形式でも使えたりするんだろうか?
っていうか、デカいの落とさなくて済む方法ないかなって話だったりする。 skkのL辞書で「殺る」のアノテーションが「(kill)首相を殺る」になってる
んだけど、どうしてこんな物騒なものに……。 上司とか連想する人物がユーザごとに異なるほうがいいのか。
けど、その上司が死んだときに、アノテーション見たらうわぁてなるかな。
やっぱ、その在任期間中はまず死なないであろう首相でいいか。
首相が殺されるなんて荒唐無稽だし。 skk辞書の人名フルネームって間違いがちょいちょい混じってるね。
下手すると大怪我を負うのでskk辞書から取り込んだ人名はいったん全部削除した。
やっぱり校正者の目を通してない辞書は駄目なんだろうな。 >>65
その間違いをいちいちフィードバックすべきだと思うんだ。
OSSってそういうもんだろ?? SKK 周りで最近お客様ばかりになってしまったので
冗談でも勘弁してくれ >>66
skkは使ってないし、今後も使うつもりはないからそこまでコミットするのはめんどくさい。
横着せず、新しい人名はそのつど調べて登録すればいいだけのことだからね。
より大きな理由は、skk辞書のライセンスが制限のきついGPLになっているので、
仮にフィードバックしたとしても、いつか何らかの形で恩恵が帰ってくるとは思えないこと。
それに、かりに間違い登録のエントリが意図的なもので、skk辞書を流用して発表した
GPL感染者の"摘発"用に混ぜてあるのだとしたら、誤登録報告されてもありがた迷惑だろうし。 >>69
今の若いもんは Happy Hacking! の気持ちなさすぎ。。。;_;
それを報告するだけでも Hack!! なのに。。。
噛みついてる人の意図は分からないけど
>>69の言ってることは理解できる
BSD→GPL 還元あり
逆はできないとかその類でしょ
若くない人の間でも、もうGPLはいいんじやないかと
海の向こうでは言われてるみたいですよ
あとハッカーとかlispは神がつくったとか
そういうの憧れもってる人は少ないと思うよ
日本のお笑いおもしろいし GPL嫌ってる人なんて、昔からBSD界隈には腐るほどいたじゃん。
二番目の段落は意味が分からない。何でLispがそこで出るよ。
SKKの話ならEmacsで動かすためにelisp使っただけだろ。 >>69はGPLで作られた辞書を使っていて誤りが見付かったのに
GPLだと自分に恩恵が帰ってこないから報告しないとか言っているんだろ?
すでにGPLの辞書使っているのに何言っているの(?)ってことでしょ。 校正して「摘発」用のGPL独自エントリを全て取り除けば、何の変哲のないフリー辞書だってことなんじゃない? 「GPLの辞書」≠「フリーの辞書」ってことだろ。
漠然と「フリー」と言っても意味がない。 GPLの自由を理解していないやつが多いよな。
GPLの自由はユーザーの自由であって、編集者やプログラマの自由じゃないだろ。
GPL 論議はともかく
かな漢字変換辞書の copyright, license のことはよく考える機会があってもいいと思う
各の辞書について本当に著作権主張できるのか、なども含めて あと辞書の編集・校正作業というものはバザール式での作成には向いてないと思う。
プログラムみたいに「バグが出たら直せばいい」ってわけじゃない。
まともな作りをしている大手出版社の書籍でも、何人もの校正者を経ているにもかかわらず
誤植をゼロにするのがむずかしいことはよく知られているしね。
やるんだったら、古典から現代の文章まで幅広く造詣の深い編集者が
強力なリーダーシップで引っ張る伽藍式でないとゴミの混入を防げないんじゃないかな。 投げた先がGPLでも、自分で書いたパッチはあとでどうしようと投稿者の自由なんだが >>75
間違いが含まれてるのに気づいてから、人名を間違えた原稿を出すのは怖いので
変換した人名が正しいかどうかいちいち確認するようになった。
で、それが面倒くさくてやってられなくなったのでskk辞書から取り込んだエントリは
全部削除したというのが経過。
skk辞書はアノテーションを除けば品詞分類付けの工夫があるわけでもなし、
わざわざGPLで囲い込む価値があるとは思えないんだね。
これがもっとフリーなライセンスだったとしたら、例えばGoogle日本語入力の辞書編集との
連携が生まれたりしていい方向に行くことだってあるかもしれない。
ただ現在はGoogle日本語入力もmozcも実用には耐えないので使ってないけれど。 SKK L 辞書は最初 (1988) に GPL にしたから、途中から変えることができず
ズルズルひきずってる。
LGPL にしたら?っていう提案が一瞬なされたことがある。 (1992 ころ)
>>84
もともとGPLが気に食わなかったので、
GPLの辞書に不備があったのをいいことに、
自説を開陳したってことですね。おつかれさんです。 >>84
そのGPLの辞書に問題が無ければ成果を利用して恩恵を得ていただろうに,
人名の間違いを指摘するのは自分に恩恵が無いからしないとか何言っているの? こんなのみつけた
SKK Advent Calendar
http://atnd.org/events/10855
まだ相当枠があるみたい。ブログやってる方いかが? >>89
;; 人名辞書 for SKK system
---
;; Last Modified: $Date: 2010/01/23 00:05:05 $
---
ながぶちつよし /長渕剛/長淵剛;人名,フルネーム/
;; フルネーム辞書 for SKK system
---
;; Last Modified: $Date: 2006/01/15 15:35:27 $
---
ほんだかついち /本田勝一;フルネーム,ジャーナリスト/
など。 長渕剛 約 3,130,000 件
長淵剛 約 144,000 件
別に問題ないんじゃない? >>90
まさかとは思うが、
地球上に「ながぶちつよし」という人は、
長渕剛しか存在しないとか思ってないよな?
漢字違いの同姓同名は変換できてはいけないとか、
思ってないよな? こういうことになるから「コミットするのはめんどくさい」と書いたんだよね。 本多勝一の方は間違いだな。
そんな名前のジャーナリストがいるのかもしれないがw 俺の使ってる SKK-JISYO.L.unannotated では
ほんだかついちは本多勝一に変換されるな SKK-JISYO.fullnameの説明に
> 本辞書は、海道昭恵氏の公開されておられる音訳用の人名録
> http://www.ctk.ne.jp/~kaidoh/
> を SKK 辞書形式に変換したものをベースに加除したものです。
> 肩書等は新聞掲載当時のもののため、現況と一致しない場合があります。
って書いてあるな。
んで上のサイトのほんだかついちの項目も見てみるとこっちも本田になってるな。
新聞には本田勝一として掲載されていた時期があったのか
それともただ誤字なのかは不明だけど、どちらにせよ、
辞書の元となるホームページが原因なんだな。 サイトが引越ししてた
http://www.ctk.ne.jp/~kai-6344/
今はこちらね。 っていうかwikipediaから自動で抜き出せば、そういうのとかゲームのキャラ名辞書とか、
一番確実な奴が作れるんじゃないの? 作れなくもないだろうけど
Wikipedaのライセンスがどうなっているのか気になるな。
俺自身は有名人の名前をフルネームで入れることなんて
年に1回もなさそうだからあまりやる気はないんだが。 ■ このスレッドは過去ログ倉庫に格納されています