よくやる作業についてメモ。
単語等の分布をざっくり見るときなど。
単語等の分布をざっくり見るときなど。
cat sample.txt (TSV) 旅行 男 ゲーム 男 ゲーム 女 旅行 男 ゴルフ 男 山登り 男 手芸 女 ゴルフ 男 アロマ 女 旅行 女 ライブ 女
perl -F"\t" -anle ' $h{$F[0]}{$F[1]}++; $s{$F[0]}++; END{ for$i(sort{$s{$b}<=>$s{$a}}keys%h){$r=$h{$i}; print join("\t",$i,$s{$i},map{"$_:$$r{$_}"} sort{$$r{$b}<=>$$r{$a}||$a cmp $b}keys%$r)} } ' sample.txt 旅行 3 男:2 女:1 ゴルフ 2 男:2 ゲーム 2 女:1 男:1 ライブ 1 女:1 山登り 1 男:1 手芸 1 女:1 アロマ 1 女:1
この記事に言及しているこのブログ内の記事