2012年1月24日火曜日

Ubuntu Linuxの上半分にあるテキストフ​​ァイルを(または任意の割合)に分割

あなたが扱いにくいテキストフ​​ァイルがある場合は、プロセスにしようとしている、セクションに分割することは時々我々がスプレッドシートにファイルをインポートしようとしていた場合は特に、処理時間を助けることができる。または、単にファイルからの行の特定のセットを取得することがあります。

スプリット、トイレ、尾、猫、およびgrepを入力してください。 (sedやawkを忘れないでください)​​。 Linuxはコマンドラインでテキストフ​​ァイルを扱うためのユーティリティが豊富に含まれています。私達のタスクのために今日我々は、分割とトイレを使用します。

最初に我々のログファイルを見てみましょう....

> ls - lと
は- rw - RR - 1 thegeek ggroup 42046520 2006年9月19日11時42分のaccess.log

我々は、ファイルサイズが42メガバイトであることがわかります。これはちょっと大きいです...しかし何行我々は、扱っている?我々はExcelにこれをインポートしたい場合は、我々は65000行よりも少なく維持する必要があります。

のは"単語数"の略でWCのユーティリティを使用して、ファイル内の行の量を確認してみましょう。

>トイレ - lのaccess.log
146330のaccess.log

私たちは、制限を超えた方法です。我々は、3つのセグメントにこれを分割する必要があります。我々はこれを行うには、分割ユーティリティを使用します。

>スプリットの- l6万のaccess.log
> ls - lと

合計79124
を- rw - rw - R - 1 thegeek ggroup 40465200 2006年9月19日午前12時のaccess.log
を- rw - rw - R - 1 thegeek ggroup 16598163 2006年9月19日12時05 XAA
を- rw - rw - R - 1 thegeek ggroup 16596545 2006年9月19日12時05 XAB
を- rw - rw - R - 1 thegeek ggroup XAC 7270492 2006年9月19日12時05分

我々は現在、3つの個別ファイル、選択することがかなりの数のように思えた未満6万行を、含んでいるそれぞれに私達のテキストフ​​ァイルを分割しました。最後のファイルには、残りの金額が含まれています。あなたが半分にこの特定のファイルを切断しようとしていた場合、あなたはこれを行っていると思います。

>スプリット- L 73165のaccess.log

そして、それはそれで全部です。

0 件のコメント:

コメントを投稿