Linuxの更新で日本語ファイル名がすべて文字化け!
>>1
USBメモリがFAT32でフォーマットされているとすると、Shift-JIS(CP932)の範囲外の
文字をファイル名に使用すると、文字化けする。更新?など関係ない。
Linuxで読み込んだUSBメモリが文字化けした時の対処方法
http://note.kurodigi.com/linux-usbcharset/
こういう単純な疑問は下記スレで聞くように。このスレの削除依頼も忘れずに。
くだらねえ質問はここに書き込め! Part 237
http://mao.5ch.net/test/read.cgi/linux/1563027196/ ぬるぽ(=゚ω゚)ノ.txt
FAT32でフォーマットされたUSBメモリにこんなファイルが作れたから、これLinuxの実装の問題だなw 今のLinuxでは、いまだにファイル名が多国語化されていないのかな? find . -type f | xargs nkf -w --overwrite いつまでたってもLinuxの多国語対応って中途半端感あるんだよなー。 Linuxやししゃーないな
日本語(笑)でファイル名付けるのがアカン そのうちファイル名やフォルダ名に絵文字を入れる奴が出てくる
ひょっとしたら既に存在しているかも知れず もうやってるよ。
中のコンテンツのタイトルをそのまま使ってるから
制御文字以外はどんな文字も受け入れてる。
初めて絵文字に出くわした時はさすがに驚いたけどね。 ファイル名に改行つかえるぞ。
タブは使ったことないが。 プログラムで扱うには問題ないけど人間には優しくないんだよね。
改行は「ファイル名を終わらせる文字」にしておきたい。
タブは時々本当に入ってるけど人間には '\x20' と見分けがつかないし。
何か意味があるならそのままにしておきたいけど意味があると感じたことはないね。 C言語のchar型を32ビット(4バイト)に直して、
どうしても8ビットの整数を使いたいときはbyte型にしてさ、
1文字32ビット固定長の文字型で中にUTF-8のような
ありったけの文字を表せるものにして、それでLinuxのような
OSを書き直し、作り直せば、文字化けの問題はほとんど解決
するのじゃないかな。通信するときやファイルに読み書きする
ときにだけ、1バイトのASCIIとか2バイトとか3バイトの可変長
コードを使えばいいのだろうから。 前世紀は EUC-JP でやってたけど何の問題も無かったよ。
ろくに知識が無いならやっちゃだめだろ。 &#数字〜みたいに文字化けしてる絵文字を正す方法ってないですか?
://apz.rulez.jp/36494/676535.html Unicodeを包含するさらに大きなコード体系としてGB18030というものがあって、中国に輸出する製品はこれに準拠しなくてはならない。
違反すると死刑になる場合もある。
悪いことに、規格の入手自体、さらに適合試験プログラムにもかなりの金額がかかる。 >>20
それは文字化けしてるのではなくエンコードされてるんだと思うが。
文字コードから文字への変換は Perl とか使えばできる。
ブラウザとかの話ならそのブラウザのスレに当たるべきかと。 昔々は、ファイル名もディレクトリ名も英文字でしろって、
いわれていたんじゃがのう。 自分で作るファイルは今でも英数字にしている
Windows でもそうしている
日本語のファイル名はトラブルの元 CoronaVirus Song | C-O-V-I-D 19
://www.dailymotion.com/video/x7t94zr
://s2.dmcdn.net/v/SA3g71UaSEj-ilaGt/x240#.jpg Miss Normandie 2015 : les défilés de l'élection
://www.dailymotion.com/video/x39m2af
://s2.dmcdn.net/v/BnaeN1UCz1Tv-lE-m/x240#.jpg Tokyo Travel Hacks
://www.dailymotion.com/video/x7ry8r5
://s2.dmcdn.net/v/S1jVH1UJ5t7-mNiJq/x240#.jpg 志村けんバカ殿様 超エロイコント
://www.dailymotion.com/video/x5z3iz2
://s1.dmcdn.net/v/LYBdE1PgTnFQLuPWH/x240 libc5からglibc2への移行したときこんな感じだったけど、何年前の話だ?