サーバーのよく使うコマンドメモ| uniq

2015年2月23日

コマンド サーバー テクノロジー

Summery

ファイルの行単位で、重複行を削除する。 sortコマンドと組み合わせて使うと効率的。

Construction

$ sort [option] [in-file1] [* out-file]

Option

-u : 前後の行と異なる行を表示する -d : 重複行のみを表示する -c : 行番号を表示する -w : 最大文字数を指定する。(デフォルトは行末)

Sample

# 重複している行を表示しない $ uniq hoge.txt $ cat hoge.txt | uniq # 重複している行数を表示する $ uniq -d hoge.txt | wc -l # 2つのファイルをくっつけて重複していない状態にする $ car hoge1.txt hoge2.txt | sort | uniq

Discription

The uniq utility reads the specified input_file comparing adjacent lines, and writes a copy of each unique input line to the output_file. If input_file is a single dash (`-') or absent, the standard input is read. If output_file is absent, standard output is used for output. The second and succeeding copies of identical adjacent input lines are not written. Repeated lines in the input will not be detected if they are not adjacent, so it may be necessary to sort the files first. The following options are available: -c Precede each output line with the count of the number of times the line occurred in the input, followed by a single space. -d Only output lines that are repeated in the input. -f num Ignore the first num fields in each input line when doing comparisons. A field is a string of non-blank characters separated from adjacent fields by blanks. Field numbers are one based, i.e., the first field is field one. -s chars Ignore the first chars characters in each input line when doing comparisons. If specified in conjunction with the -f option, the first chars characters after the first num fields will be ignored. Character numbers are one based, i.e., the first character is character one. -u Only output lines that are not repeated in the input. -i Case insensitive comparison of lines.

人気の投稿

このブログを検索

ごあいさつ

このWebサイトは、独自思考で我が道を行くユゲタの少し尖った思考のTechブログです。 毎日興味がどんどん切り替わるので、テーマはマルチになっています。 もしかしたらアイデアに困っている人の助けになるかもしれません。

ブログ アーカイブ