ja_JP.UTF-8

■ このスレッドは過去ログ倉庫に格納されています
0001login:Penguin04/02/19 17:09ID:EuXdEmYH
Linux で ja_JP.UTF-8 ロケールで暮らす方法についてのスレです。

03273252008/05/06(火) 18:04:21ID:7GDee/mn
仮想端末についてはよく知らないけど、GUIを入れてない環境だから仮想端末は使ってないと思う。たぶん直にbashが動いてるはず。
SSH接続時はPuttyで、直接操作するときはフレームバッファ有効なCUIで使ってます。
んで、直接操作するときに化けないで表示したいなあと。
(Vine4.2)

0328login:Penguin2008/05/06(火) 18:49:41ID:2QnDaXqe
>>327
vine のことは良く知らないが、cui のままなら unicon じゃね?
>>325 のページにもあるが、unicon は utf-8 対応してないんじゃない?

フレームバッファを有効にして jfbterm あたりを使うといいんじゃね?
vine の jfbterm が utf-8 対応しているかは知らないが。

03293252008/05/06(火) 20:31:21ID:7GDee/mn
>>328
そうみたいです。VineはUNICONパッチのあたったカーネルで、フレームバッファ有効にするだけでEUCとかを表示出来ると。
ただしUTF-8は対応が難しいらしく未実装。

で、jfbterm使おうと思ったけどVineのaptに無いのでとりあえずbterm使ってみた。が、背景が青になるのが気にくわなくて諦め。
また気が向いたらjfbtermインストールしようかな。

0330login:Penguin2008/07/16(水) 14:57:36ID:SwfCIvT4
Vine('A`)

0331login:Penguin2008/07/17(木) 15:36:28ID:5pKN5CSc
>>320
Mac OS Xを仕事で使ってますが、
フレームワーク、ファイルシステムごとに扱いが違うので結構面倒です。

ブラウザでUSBサムドライブのファイルを開こうとすると、
ファイル名がNFCでひかかったり。

アプリが必ず読み書きする前後両方でにNFDあるいはNFCする必要があります。

0332login:Penguin2008/07/20(日) 17:09:47ID:VPRlcszf
>>331
>フレームワーク、ファイルシステムごとに扱いが違うので結構面倒です。

確かにファイルシステム毎に違うね。まあ歴史的経緯でどうしようもない気もする。
フレームワーク毎というのはよくわかんないけど。

>ブラウザでUSBサムドライブのファイルを開こうとすると、
>ファイル名がNFCでひかかったり。

ファイルシステム云々ゆってるのにUSBサムドライブって別階層を... FATの話?

>アプリが必ず読み書きする前後両方でにNFDあるいはNFCする必要があります。

アプリ内でファイル名の比較をするときなどのことを言ってるのかな?

0333login:Penguin2008/07/20(日) 22:23:44ID:RZXdwXj/
>>332
> フレームワーク毎というのはよくわかんないけど。

Carbon, Cocoa
10.2で検証した。

> アプリ内でファイル名の比較をするときなどのことを言ってるのかな?

ファイルシステムとフレームワークの組合わせによっては、
オープンするだけでもアウト。

0334login:Penguin2008/07/31(木) 19:24:06ID:1XpJKIsM
>>333
>ファイルシステムとフレームワークの組合わせによっては、
>オープンするだけでもアウト。

具体的にどんな組み合わせですか?

HFS+だと、確かかなり下の方でnormalizeをしてるので結構大丈夫だと踏んでるけど...?
UFSだと、たぶんただのバイト比較だから簡単に駄目な例は作るはず。
でもUFSはUnicode以前からあるわけだし、今更どうしようもないという感じ。
しかし全然Linuxじゃないというw

0335login:Penguin2008/07/31(木) 19:41:16ID:9ySiTva1
さすがに板違いだろ。HFS+まで出てきた日には。まぁ、カーネルは入ってるけどな。

0336login:Penguin2008/07/31(木) 22:40:08ID:aKfSR7ZK
>>334
Linuxはiocharset=でmount時に指定できるFSが多いよな。
VFSのレイヤーでやればいいのにな。

DarwinはどのFSも決め撃ちオンリーだな。

0337login:Penguin2008/07/31(木) 23:36:24ID:9ySiTva1
だから板違いだってば。

0338login:Penguin2008/08/03(日) 16:34:54ID:buXIFNdC
そういえばこの前ubuntuというものを初めてインストールしてみたら
ホームディレクトリに「デスクトップ」とか作られててビビったんですがw

ext3ってエンコーディングとかの規定はどうなってるんでしたっけ?

0339login:Penguin2008/08/27(水) 12:52:16ID:HfjolhVu
Unixのファイルシステムは基本的に8ビットスルーだろ
2バイト目に/が被るS-JISは事実上使えないだろうが

0340login:Penguin2008/08/27(水) 16:58:21ID:iIVDIKRx
ttp://ja.wikipedia.org/wiki/Shift_JIS
> Shift_JISの2バイトコードの空間は、第1バイトが81-9FならびにE0-FC、
> 第2バイトが40-7Eならびに80-FCである。

0341login:Penguin2008/08/28(木) 12:33:17ID:Iqmmut8G
昔の話だけど、jfsでUTF-8のファイル名するのになんか問題があった気がする。

0342login:Penguin2008/08/29(金) 09:29:42ID:JXxabAXJ
>>339
要はファイル名の比較はバイトデータの比較ってことでいいでしょうか。

ということは上の方に書いてあるみたいにnormalizationの違うファイル名を使うと
問題が起きたりすると。

0343login:Penguin2008/08/30(土) 08:46:40ID:2VCoYTof
>>342
ファイルシステム的には違うバイト列名の別ファイルだから問題は
特に起きない。が、ファイルマネージャとかアプリが表示段階で
正規化とかするとアボン。

0344login:Penguin2008/08/30(土) 11:27:22ID:4z52jeuW
>>342
一番やっかいなのは、
正規化されてないファイル名がある時。
ファイル名が正規化されていることが分かっていれば、
二つのファイルが別のファイルシステムにあって、
違う正規化がされていても、一旦正規化してから、比較すれば良い。

ただこういうことを包括的に扱っているVFSはまだない。

0345login:Penguin2008/08/30(土) 22:00:13ID:x9p+Pisp
ファイルシステムレベルでは問題ないかもしれませんが、例えばディレクトリをlsしたときに
同じ名前のファイルが複数表示されたらユーザーはアセるんじゃないですかね。

>>344
VFSですか。だとするととりあえず
「システムコールに渡すパス名はUTF-8ということになったので、そこんとこヨロシク」
みたいな宣言がいつか行われるとか?

0346login:Penguin2008/08/30(土) 23:54:54ID:2VCoYTof
>>345
別にUnicodeに限った話じゃなくて

 touch he11o hello

が識別できない環境あるけどどうよ?とかかつてなされた
文字が「同一」とはどのレイヤ(コードマップなのか
エンコーディングなのかフォントなのかコンテンツなのか)が
定めるのか?というお定まりの侃々諤々が始まるだけだと思われ。

0347login:Penguin2008/09/02(火) 08:45:08ID:phwFGNER
>>346
> touch he11o hello

これ、単にグリフのデザインの話でしょ。ファイルシステムにもUnicodeにも関係ないし。

「同じ様に見えるファイルが複数表示される」というのは単にユーザが結果を確認する
ときの現象を書いてみただけで、
正規化の問題で本来一つのファイルが複数できてる、みたいな問題自体は文字の
見た目にかかわらず存在する。

0348login:Penguin2008/10/21(火) 15:04:13ID:IoiTQ4Ul
>>342
utf-8は最短の表現以外は仕様で許さなくなったね。
複数表現があると禁止リストの回避がセキュリティ上の問題になるから。

0349login:Penguin2008/10/21(火) 15:08:37ID:sbfjW96z
なるほどね(´・ω・`)

0350login:Penguin2008/10/22(水) 06:46:11ID:rLYg3bwq
仕様が「許さない」といったってそれを強制できない以上は備えるしかあるまいよ。

0351login:Penguin2008/10/27(月) 20:01:15ID:yiylzRYp
それはもちろんだ。きちんとエラーとして処さないといけない。

0352login:Penguin2009/03/01(日) 12:12:57ID:qMTRjR4D
ぬるぽ

0353login:Penguin2009/03/06(金) 11:46:53ID:sthn8EAP
ヌルポ

0354login:Penguin2009/03/06(金) 21:53:11ID:8+doeXPT
>>353
ガッ

0355login:Penguin2009/03/09(月) 21:42:00ID:jl7GQGVK
時々、文字コードを思い出したように変えるのは止めて欲しい。
既存の製品等をオブソレートにして市場から除去する為の口実ぢゃないか?

0356login:Penguin2009/03/09(月) 21:45:10ID:gmXbHgG/
>>355
一体何の話?

0357login:Penguin2009/03/10(火) 01:10:42ID:b+3OdOvv
グリフのことを言いたいんじゃないのか?

0358login:Penguin2009/03/10(火) 01:16:58ID:RpwmY4KZ
なんというか何もかも間違ってるレスだなそれ。

0359login:Penguin2009/03/31(火) 02:07:47ID:aOI6y9SA
グ・グ・グリフの大爆笑

0360login:Penguin2010/01/26(火) 11:12:31ID:1Oe/riv2
最近のLinuxって、LANG=ja_JP は ja_JP.UTF-8 ですか?それともja_JP.EUCですか。

0361login:Penguin2010/01/26(火) 12:13:07ID:qr5/QECQ
sjis>>360

0362login:Penguin2010/01/26(火) 22:23:58ID:VACzPyUR
>>360
ふつー UTF-8

0363login:Penguin2010/01/30(土) 00:43:28ID:9vjcbNhb
日本語1文字が何バイトになっているのかなUTF8は?

0364login:Penguin2010/01/30(土) 04:30:12ID:44NlzLAs
$ echo -n "日本語1文字" | wc -c
[Gnome] アプリケーション→アクセサリ→文字マップ

0365 忍法帖【Lv=5,xxxP】 2011/06/18(土) 01:27:33.87ID:OESwTLH8
ぬるぽ

0366login:Penguin2012/03/05(月) 01:43:24.95ID:NArDNcNC
スレタイトルの改名が必要じゃないか?

>Linux で ja_JP.EUC ロケールで暮らす方法についてのスレです。
いいかげんEUCは止めて欲しい。SJISを使えみたいな話と同じだ。
いまさらEUCがデフォなのってどんな鳥?

0367login:Penguin2012/03/05(月) 06:25:40.58ID:OsgtQbaR
釣り針にすらなってないただのまっすぐな針金だな

0368login:Penguin2012/06/21(木) 14:34:34.02ID:Rt5BMv+G
>>366
次スレで変更よろ

0369login:Penguin2012/10/18(木) 12:55:49.86ID:EPhTr28Q
Windows7のNFSサービスがEUCやShiftJISに対応してるのに
意図的なのか本気で不要と考えてるのか、UTF-8に対応してないの知ってビビった。
クソ高いUltimate買わないどNFSサービスついてないくせに。
実質WinのNFSサービスは使い物にならん。

0370login:Penguin2013/04/20(土) 18:27:34.12ID:IGqqcAri
そもそもWinとNFSではロックのセマンティクスが違うし。

0371まあ日本語使うな禁止な2013/06/17(月) 14:24:57.69ID:mcoRhX6s
Jconsole消滅
KON-UTF8化消滅
Utf8-kernel消滅
UNICON消滅

カーネルレベルでUTF8対応するのを阻む流れがあるんでしょうか?
>>366
たぶんBSDなら使える。Linuxじゃないって?だからLinuxでは拒否

X window systemがクライアントに特化できないからこそGPUダイレクトで描画できない
GUI上だけがLinuxでいいじゃないかという奴とCUIがLinuxだという流れで
争っているからこそカーネルレベルでUTF8が実装されない(表示できない)

0372login:Penguin2013/06/18(火) 07:47:23.66ID:ZkyKpsxz
そもそもconsole自体kernelからなくそうという動きもあるしな。

0373login:Penguin2013/06/18(火) 15:01:13.88ID:hs8574+Z
Unicode対応をまじめにやるのは大変。
サロゲートペアとか合成文字とか異体字セレクタとか。
どこまで実装して、どこでサボるかを見極めるのすら難しい。

0374login:Penguin2013/06/27(木) 21:27:54.94ID:CnVHXcT1
EXT2、EXT3がNLS機能に対応せず。
UTF8でujis,eucJPに対応できない問題をどうすればいいの?

0375login:Penguin2013/06/27(木) 23:03:09.03ID:/O/kkLoF
必要ない。> ujis,eucJP

0376login:Penguin2013/06/28(金) 14:15:29.88ID:5T4jToix
>>375
おまえが人類には必要がない人間。

0377login:Penguin2015/07/09(木) 17:08:59.76ID:U3gzrp77

■ このスレッドは過去ログ倉庫に格納されています