あなたが扱いにくいテキストファイルがある場合は、プロセスにしようとしている、セクションに分割することは時々我々がスプレッドシートにファイルをインポートしようとしていた場合は特に、処理時間を助けることができる。または、単にファイルからの行の特定のセットを取得することがあります。
スプリット、トイレ、尾、猫、およびgrepを入力してください。 (sedやawkを忘れないでください)。 Linuxはコマンドラインでテキストファイルを扱うためのユーティリティが豊富に含まれています。私達のタスクのために今日我々は、分割とトイレを使用します。
最初に我々のログファイルを見てみましょう....
> ls - lと
は- rw - RR - 1 thegeek ggroup 42046520 2006年9月19日11時42分のaccess.log
我々は、ファイルサイズが42メガバイトであることがわかります。これはちょっと大きいです...しかし何行我々は、扱っている?我々はExcelにこれをインポートしたい場合は、我々は65000行よりも少なく維持する必要があります。
のは"単語数"の略でWCのユーティリティを使用して、ファイル内の行の量を確認してみましょう。
>トイレ - lのaccess.log
146330のaccess.log
私たちは、制限を超えた方法です。我々は、3つのセグメントにこれを分割する必要があります。我々はこれを行うには、分割ユーティリティを使用します。
>スプリットの- l6万のaccess.log
> ls - lと合計79124
を- rw - rw - R - 1 thegeek ggroup 40465200 2006年9月19日午前12時のaccess.log
を- rw - rw - R - 1 thegeek ggroup 16598163 2006年9月19日12時05 XAA
を- rw - rw - R - 1 thegeek ggroup 16596545 2006年9月19日12時05 XAB
を- rw - rw - R - 1 thegeek ggroup XAC 7270492 2006年9月19日12時05分
我々は現在、3つの個別ファイル、選択することがかなりの数のように思えた未満6万行を、含んでいるそれぞれに私達のテキストファイルを分割しました。最後のファイルには、残りの金額が含まれています。あなたが半分にこの特定のファイルを切断しようとしていた場合、あなたはこれを行っていると思います。
>スプリット- L 73165のaccess.log
そして、それはそれで全部です。
0 件のコメント:
コメントを投稿