X



トップページLinux
270コメント86KB
awk ファンクラブ
0001login:Penguin
垢版 |
2008/07/07(月) 20:45:18ID:wYmB5VwU
おーくについて語りましょう
0002login:Penguin
垢版 |
2008/07/07(月) 20:52:18ID:7N4CeYxI
awkは言わねえ、たった一行・・・
0003login:Penguin
垢版 |
2008/07/07(月) 20:55:08ID:64cKGfca
オークは便利だオーク
0004login:Penguin
垢版 |
2008/07/07(月) 21:21:04ID:Bjq85S2V
sedファンクラブからきました。
0005login:Penguin
垢版 |
2008/07/07(月) 21:35:44ID:rSMtL5cT
ls -ltr | awk '{print $8}'
0006login:Penguin
垢版 |
2008/07/07(月) 21:50:35ID:XFLIMsgD
aho
wainberg
kernihan
0007login:Penguin
垢版 |
2008/07/07(月) 22:39:16ID:/5MnC3tB
awkでなんでもやるのって年がバレそうだなあ。ちょっと下の世代だとperlだろうし。
0008login:Penguin
垢版 |
2008/07/08(火) 00:19:21ID:9/fi698j
ttp://text.world.coocan.jp/TSNET/tsc/tsc_1.1.003.pdf
0009login:Penguin
垢版 |
2008/07/08(火) 01:19:20ID:yAMbUEpf
しばらくしたら,perlでなんでもやるのって年がバレそうだなあ。ちょっと下の世代だとpythonだろうし。ってなるんだろうな
0010login:Penguin
垢版 |
2008/07/08(火) 10:32:21ID:YEHCkTi1
下の世代はpythonよりrubyじゃないか?

自分の場合、全部シェルスクリプトだけどw
0011login:Penguin
垢版 |
2008/07/08(火) 12:50:38ID:6brAoz3h
perl->pythonときてawkの便利さに気付いた。
0012login:Penguin
垢版 |
2008/07/08(火) 16:47:52ID:TJw2Mlna
awk, perlユーザだが次はpythonとやらをいじってみるかね
0013login:Penguin
垢版 |
2008/07/09(水) 19:51:11ID:r1P6Mjit
awkを256倍はみなさん持ってます?ここがすべての始まりだったなあ
0014login:Penguin
垢版 |
2008/07/09(水) 19:52:45ID:+TY8Gpg6
オライリーのsed&awkがはじまりだったなあ・・・
んでもってx68kで遊んでいたw
0015login:Penguin
垢版 |
2008/07/09(水) 19:55:00ID:0dhBqlXX
俺はrubyとpython両方使ってる。
rubyはワンライナー〜十数行のスクリプト。
pythonは数十行〜数百行のスクリプト。
0016login:Penguin
垢版 |
2008/07/09(水) 20:03:27ID:Glf+LFW9
そんな昔にawkとかと出会えた人が羨ましい
0017login:Penguin
垢版 |
2008/07/09(水) 20:09:52ID:r1P6Mjit
awk gawk jgawk やっぱり魅力はデータなめさせた時のスピード感
0018login:Penguin
垢版 |
2008/07/09(水) 21:59:50ID:2WqtvhnN
適当なデータをSQLにして流すときとかに使ってる。
BEGIN/ENDのおかげでトランザクション使うのも簡単。
0019login:Penguin
垢版 |
2008/07/09(水) 23:40:46ID:ro47ZQt4
>>14
「プログラミング言語AWK」が絶版になると聞いてあわてて確保したが、すぐ再版された。
0020login:Penguin
垢版 |
2008/07/20(日) 12:21:50ID:j9YcHbCn
awk がなくなると困る・・・・・
Perlで$3 を表示しる!とかどーすんよ

awk '{print $3}'
0021login:Penguin
垢版 |
2008/07/20(日) 12:31:10ID:/rTvaqQG
オークについて、おおくは語らねぇ
0022login:Penguin
垢版 |
2008/07/20(日) 13:45:48ID:ysRQGfiQ
>>20
perl -ane 'print $F[2], "\n"'でいいんじゃね?
0023login:Penguin
垢版 |
2008/07/20(日) 22:40:15ID:3uxKU7IE
>>22
なんかこう、Perlってスクリプトにエレガントさを感じないんだよな。つぎはぎが多い
というか。

awkの場合、cに近いスタイルでありながらパターンマッチングとか連想配列の実装が
エレガントだからコードを見ててきれいに感じる。
0024login:Penguin
垢版 |
2008/07/20(日) 23:32:42ID:j9YcHbCn
>>22 マジレス dd ちょっとやってみる(ヲイ
0025login:Penguin
垢版 |
2008/07/21(月) 04:31:14ID:RBm9osMs
perl の -n は各行に対しての処理、-e はスクリプトをファイルでなくその場でワンライナー書く為のものだが
-a オプションはやっぱり awk の名に由来するのかねぇ
0026login:Penguin
垢版 |
2008/07/21(月) 10:22:28ID:m3jpUYR9
>>25
autosplit modeってusageに書いてあるじゃん。
0027login:Penguin
垢版 |
2008/07/22(火) 11:02:10ID:oOCbPgMu
>26
いや名目上はそうだけどさ。
スクリプトでauto〜なんて言い出したらキリが無いワケじゃん。
ぶっちゃけ -n だって自動ループと言っちゃえばそうだし。

そこで -s や -p みたいな名前じゃなくて
わざわざ -a にしたのは、やっぱ awk の名を意識したからなのかな、と
思ったんだよ。
0028login:Penguin
垢版 |
2008/08/17(日) 18:47:40ID:AZ0h4M4q
ruby -ne 'puts split[2]'のほうが楽、と思ったけど
空行とかでの扱い考えると
ruby -ne 'puts split[2] || ""'
になるのか。やっぱawkが楽だな。
0029login:Penguin
垢版 |
2008/12/03(水) 10:54:22ID:QXJz0hBL
sedのスレとかあったので、思わず「なんでawkを使わない?」って突っ込んでしまったけど、
実はおれも長らくsedからawkへ行けなかった。田中さん(緑のSerrow)が月刊asciiに書いた
記事を読んで使えるようになったのだった。

いまではperlも使うが、やはりawkが楽だなぁ。16進→10進変換の関数作ったり、
バイナリデータ読むためのコードをCで作ったりして無理やり使ってたころが
懐かしい。
0030login:Penguin
垢版 |
2008/12/03(水) 23:47:03ID:Thw8Gp7O
2年くらい前からLinuxを本格的に使い始めたけど
awk(gawk)とsedには特に力を入れて勉強してる
gawkは機能が洗練されて美しいし直感的で使いやすい
リファレンスもとてもしっかりしてる
0031login:Penguin
垢版 |
2008/12/09(火) 16:01:43ID:NHdcSNGH
おれが一番よく使うのは連想配列。

gawk '{w[$1]++;}END{for(i in w)print i,w[i];}' xxxx.txt | sort

みたいなことを何百回やったことか。
0032login:Penguin
垢版 |
2009/04/21(火) 01:25:03ID:8RfnrYFS
わらうw
ttp://awk.info/?doc/dsl/awkplusplus.html

object_variable = class_name.new[(optional parameters)]
object_variable.method_name(parameters)
object_variable.delete
0033login:Penguin
垢版 |
2009/04/21(火) 17:02:32ID:CHFddJcj
みなさん教えて下さい。

一行毎に読み込み@<と@>で囲まれた部分を
ランダムなアルファベット10文字に置換し、
元々@<@>に囲まれた部分の文字列と置換したランダムな文字列の対応を
別ファイルに書き出し

っていうのをやりたいです。
awkとsedでできるの?

pythonで書くべき?
0034login:Penguin
垢版 |
2009/04/21(火) 18:09:12ID:68A2ZTzG
できるっちゃーできるが、おすすめはしない。

BEGIN {
output = "hoge.txt"
chars = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz"
len = length(chars)
srand()
}
{
if(match($0, /@<.*@>/)){
t = substr($0, RSTART+2, RLENGTH-4)
if(!(t in m)) m[t] = rndstr(10)
$0 = substr($0, 1, RSTART+1) m[t] substr($0, RSTART+RLENGTH-2)
}
print
}
END {
for(i in m) print i, m[i] > output
}
function rndstr(n, s){
while(n--) s = s substr(chars, int(rand()*len)+1, 1)
return s
}
0035login:Penguin
垢版 |
2009/05/08(金) 21:56:17ID:uniCaTc9
まじぽかのUMAちゃんは最高にかわいいNE!
0036login:Penguin
垢版 |
2009/07/08(水) 17:12:37ID:nwzD2hQJ
printfと$ / $がうまく両立できない・・・
文型向け授業でわざわざlinux使わせるなよ・・・
0037login:Penguin
垢版 |
2009/07/14(火) 15:14:45ID:OYRFUc74
やっぱAWKいいよねー
「プログラミング言語AWK」は買い逃してたんで再販速攻で買ったよ。
Excelなんてやってられねーっつーの
0038login:Penguin
垢版 |
2009/07/14(火) 15:45:04ID:ZhPQ90qn
>>37
Excelのvlookupみたいなリレーショナルな事がやりたい場合ってどーしてる?
0039login:Penguin
垢版 |
2009/07/16(木) 23:17:47ID:up+KJ4E4
連想配列でいいんちゃうん?
0040login:Penguin
垢版 |
2009/07/18(土) 04:58:19ID:p/gu39Bx
いやさ、複数のシートから引っ張ってくるような感じで、複数のテキストファイルを対象にしたい時。
0041login:Penguin
垢版 |
2009/07/18(土) 15:26:29ID:VCKoFo8D
そんなん普通に複数ファイル処理すればいいやん。
0042login:Penguin
垢版 |
2009/07/18(土) 16:20:59ID:p/gu39Bx
>>41
> そんなん普通に複数ファイル処理すればいいやん。

「普通に」の所kwsk
0043login:Penguin
垢版 |
2009/07/18(土) 21:51:54ID:VCKoFo8D
getlineすりゃえーやろ
0044login:Penguin
垢版 |
2009/07/19(日) 04:55:45ID:TalGZSOR
awk初心者です。質問させてください。
awkでアクセスカウンタを作ろうと思い、
以下のようなスクリプトを書いたのですが、
最後のhtmlへの出力(表示)の方法がわかりません。
どうしたらいいのでしょうか?
004544
垢版 |
2009/07/19(日) 04:57:30ID:TalGZSOR
BEGIN{
#プロセスロック
lock()

#カウント数の読み込み
while (getline < count.dat > 0){
before_count = $1;
}
close(count.dat);

#カウントを1進める
new_count = before_count + 1;

#数字の置換を行う
sub(before_count, new_count, $1);

#プロセスロック解除
unlock()
}
004644
垢版 |
2009/07/19(日) 04:58:33ID:TalGZSOR
print "Context-Type: text/text";
print "\r";

END{
#表示テンプレートの読み込み
while (getline < count.txt > 0){
txt_file[++i] = $0;
}
close(count.txt);

#あらかじめセットしてあるテンプレート上の文字列を置換
gsub("<!--#count.cgi--!>", new_count, $0);

print $0;
}
0047login:Penguin
垢版 |
2009/07/19(日) 11:16:35ID:xa/YVpR4
>>43
getline知らなかったわ。
難しそうだな・・・
0048login:Penguin
垢版 |
2009/07/19(日) 15:13:23ID:Ge8Nt7Pt
>>44
SSIの仕組みは理解できていますか。
ttp://httpd.apache.org/docs/2.0/ja/howto/ssi.html
0049hogehoge
垢版 |
2009/07/21(火) 14:50:51ID:PUGBjRE4
getline は毎回リファレンス見に行ってるなぁ
頭が劣化しとるわー
0050login:Penguin
垢版 |
2009/08/01(土) 15:31:08ID:z6H8O5Sr
こんなものが落ちてたw
ttp://mitya.pp.ru/chamberlen/assorted/OReilly%20-%20Sed%20&%20Awk%202nd%20Edition.pdf
0051login:Penguin
垢版 |
2009/08/15(土) 20:33:21ID:7GY0b2Yy
Mac OS X Leopard 10.5.8でjgawkを使いたいのです。
ターミナルでawk '{print $0}' filenameですと日本語が悲しいです。
お使いのみなさん、使用法等教えて下さい。
0054正月前
垢版 |
2009/12/29(火) 22:19:45ID:UAwxD9+5
awk初心者です。
awkにはperlのjoinみたいの関数ありますか?
perl:
print join(":",$_);
0057正月前
垢版 |
2009/12/31(木) 16:45:37ID:z/pUNj8p
重複を削除するBASHスクリプトに、perlの部分はawkの連想配列で書き換えたいんですが、splitした後の処理方法が分かりません
教えて頂ければ幸いです。

-----------------------------
hoge='a:b:c:d:a:b:c:d:a'
echo -n $hoge | perl -F: -ane 'chop;foreach(@F){$s{$_}++ or push(@b,$_)}print join(":",@b)'
-----------------------------
0058login:Penguin
垢版 |
2010/01/05(火) 11:48:18ID:iQ1ypvd/
素人なりですけど
echo -n $hoge | awk 'BEGIN{OFS=":"}{n=split($0,a,":");m=1;for(i=1;i<=n;i++){if(!(a[i]in b)){$m=a[i];b[$m]++;m++}}print}'
0059login:Penguin
垢版 |
2010/01/05(火) 12:34:43ID:APedkSZb
echo -n $hoge | awk 'a[$0]++<1{printf(NR>1?RS:_)$0}' RS=:
0060login:Penguin
垢版 |
2010/01/05(火) 12:50:31ID:APedkSZb
a[$0]++<1 じゃなくて
!a[$0]++ とした方が1バイト短くなるな

って、そういう趣旨じゃないか
0062正月前
垢版 |
2010/01/11(月) 22:20:00ID:jx5sxsA2
>>58,59,60
ご回答、誠に有難うございました!
まだawkの部分理解してないけど、期待通りの動作が確認できました!
0063login:Penguin
垢版 |
2010/03/16(火) 14:08:38ID:hRXCRI1I
Linuxじゃないんですが、Gawk on Windowsだと、
 gawk '{print $1;}' data.txt
ていうのは、クォーテーションはダブルにしないといけないんですね。。。
0064login:Penguin
垢版 |
2010/03/16(火) 14:27:11ID:OV90ZKd/
うん、引数文字列をどう解釈するかは awk じゃなくてシェルだから。
cmd.exe の仕様の問題であって、awk の側では対応しようにもできない。
0065login:Penguin
垢版 |
2010/05/14(金) 13:36:36ID:XjQaHos9
BEGIN {

printf "256倍のコードが提供されてる\n"
printf "ttp://books.ascii.jp にアクセス\n"
printf "本には4756101623なんてのがついてるけど、本の通りに入れるとnot found\n"

}

END {
print "昔と本の内容が変わってるみたいだな"
}
0066login:Penguin
垢版 |
2010/05/14(金) 21:49:15ID:KfNsslph
END {
  print "まだ始まってもねーよっ!"
}

BEGIN {
  printf "・・・ごめ・・・\n"
}

0067login:Penguin
垢版 |
2010/07/22(木) 10:04:21ID:PFu3TuWN
{
if ($0 == "aka") print "red"
else print "blue"
}
の最も変態的な記法を教えて下さい。
0069login:Penguin
垢版 |
2010/07/28(水) 10:04:53ID:ZsEEtYoL
END {
system("echo " + $0 + " | perl -ne 'if(/"aka"/){print \"red\";}else{print \"blue\";}'")
}
0070初心者
垢版 |
2010/11/04(木) 22:16:05ID:UUOsCvwd
awkでシェルのPATH変数をマッチさせるときにスラッシュ//を使わない方法を教えていただけませんか?
perlだと##で行けますが
0072初心者
垢版 |
2010/11/05(金) 06:33:50ID:HLS9uc8i
ごめんなさい!
マルチがだめとは知りませんでした。
0073login:Penguin
垢版 |
2011/02/03(木) 07:43:56ID:S25iv8qF
アルフレッド・V・恵方
0075login:Penguin
垢版 |
2011/02/11(金) 21:58:36ID:W6G44msP
awkって今時オブジェクト指向もサポートしてねぇのか。
だせぇ・・・

とか思ってたらこんなのもあるんだな。
http://awk.info/?doc/dsl/awkplusplus.html
0076login:Penguin
垢版 |
2011/05/24(火) 19:21:38.77ID:iwctpm7O
awkの処理についてアドバイスを下さい。
スペースで区切られたテキストファイルがあります。

例(フィールド数も文字数も全部異なります)

abc efg hij http://www.example.com/index.html xyz
123 http://www.example.org/ she good love look good
4edi http://www.example.net/test/test.html

こんな感じのテキストファイルからURLだけを抽出したい
場合、どう言った処理を行うと良いでしょうか?

printなどは使えそうにないし頭を抱えています。
是非お助け下さい。
0077login:Penguin
垢版 |
2011/05/24(火) 19:44:33.96ID:Z14Fpx2c
>>76
{for(i=0;i<=NF;i++)if($i ~ /^http:\/\/.+$/)print $i}
0078login:Penguin
垢版 |
2011/05/24(火) 19:52:09.13ID:WxByEtFQ
自分は
match($0, /http:\/\/[^ ]+/, f)
を使う気がする。
0079login:Penguin
垢版 |
2011/05/24(火) 20:22:38.00ID:jzDVjDvh
#!/bin/sh
cat 入力ファイル | tr ' \t' '\n' | awk '/^http:/'

…まで書きかけて、あれ、これawkじゃなくてgrepで良くね、と思ってしまった俺
0080login:Penguin
垢版 |
2011/05/24(火) 20:49:07.88ID:WxByEtFQ
/bin/shでもやはり自分は
expr 文字列 : '.*\(http:\/\/[^ ]*\).*'
を使う気がする。
0081login:Penguin
垢版 |
2011/05/24(火) 23:22:37.43ID:Rb7jhN0u
うちは>>77の条件を index($i, "http:") == 1 で書くだろうなぁ
でも、処理内容がそれだけなら sed -n 's/^.*\(http:[^ ]*\).*$/\1/p' だなぁ
避けられるなら正規表現は避けたほうが速いんじゃないかと思ってる
008276
垢版 |
2011/05/25(水) 00:02:32.97ID:bOPlpFb7
まだどうしてそういう結果になるのか…が全然解らないのですが
一つ一つひもといて自分のものにしていきたいです。

みなさん本当に色々ありがとうございます。
0083login:Penguin
垢版 |
2011/05/25(水) 02:29:57.15ID:RCLD3Ghq
こういうのもpythonで書くようになってしまった俺は駄目なやつですか
0084login:Penguin
垢版 |
2011/05/25(水) 03:14:46.21ID:zyb8WUrO
流石にPythonはこういうサクッとしたテキスト処理には冗長すぎないか?
awk以外でならperl、さもなくばrubyあたりまでが俺は限度だなあ
レスを投稿する


ニューススポーツなんでも実況