shell问答17:用join比较处理某些字段相同的文件

发表于:2007-07-04来源:作者:点击数: 标签:
整理了一梦如是、mocou、guangzongy和begincwcw的 解决方案 ,以资借鉴!谢过先:) 问: # cat aa 123|11|aaaaa 124|12|abasf 125|12|aaccc 126|13|ccccc 127|14|ccvvv 128|17|vgfgd # cat bb 12|aaa 12|ddd 13|aaa 14|aaa 要生成 124|12|abasf 124|12|abasf 1
整理了一梦如是、mocou、guangzongy和begincwcw的解决方案,以资借鉴!谢过先:)

问:
 # cat aa
123|11|aaaaa
124|12|abasf
125|12|aaclearcase/" target="_blank" >ccc
126|13|ccccc
127|14|ccvvv
128|17|vgfgd 
# cat bb
12|aaa
12|ddd
13|aaa
14|aaa
要生成
124|12|abasf
124|12|abasf
125|12|aaccc
125|12|aaccc
126|13|ccccc
127|14|ccvvv
既将aa中第二域与bb中第一域相同的记录打印出来,怎样实现?

答案:
1.join -2 1 -1 2 1 2 -t'|' -o 1.1,1.2,1.3
2.for line in `<a.txt` ;do key=`echo $line|cut -d '|' -f2`; [ -z "`grep $key b.txt`" ]||echo $line; done
3.awk的方法
A:
nawk 'BEGIN { FS = "|"; while ((getline < "bb.txt") > 0) { lines[] }}
       { if( in lines)
              print }' aa.txt
以上运行结果为aa.txt在bb.txt存在的。

B:
nawk 'BEGIN { FS = "|"; while ((getline < "bb.txt") > 0) { lines[] }}
         { if( in lines)
                 next
            else
                 print }' aa.txt
以上运行结果为aa.tt在bb.tt不存在的。

C:
nawk 'BEGIN { FS = "|"; while ((getline < "bb.txt") > 0) { lines[] }}
        { if( in lines)
                print "|find"
           else
                print "|not find" }' aa.txt
以上运行结果为aa.txt在bb.txt中找到的打印find,没有找到的打印not find。

原文转自:http://www.ltesting.net