【linux命令讲解大全】060.文件分割工具csplit的用法和示例

2024-03-02 13:20:15 浏览数 (2)

csplit

将一个大文件分割成小的碎片文件

补充说明

csplit命令用于将一个大文件分割成小的碎片,并且将分割后的每个碎片保存成一个文件。碎片文件的命名类似 xx00xx01csplit命令是split的一个变体,split只能够根据文件大小或行数来分割,但csplit能够根据文件本身特点来分割文件。

语法

代码语言:javascript复制
csplit [选项] [参数]

选项

  • -b<输出格式>--suffix-format=<输出格式>:预设的输出格式其文件名称为 xx00xx01 等,用户可以通过改变 <输出格式> 来改变输出的文件名;
  • -f<输出字首字符串>--prefix=<输出字首字符串>:预设的输出字首字符串其文件名为 xx00xx01 等,如果指定输出字首字符串为 hello,则输出的文件名称会变成 hello00hello01
  • -k--keep-files:保留文件,即使发生错误或中断执行,也不会删除已经输出保存的文件;
  • -n<输出文件名位数>--digits=<输出文件名位数>:预设的输出文件名位数其文件名称为 xx00xx01…如果用户指定输出文件名位数为 3,则输出的文件名称会变成 xx000xx001 等;
  • -q-s--quiet--silent:不显示指令执行过程;
  • -z--elide-empty-files:删除长度为 0 字节的文件。

参数

  • 文件:指定要分割的原文件;
  • 模式:指定要分割文件时的匹配模式。

实例

示例测试文件 server.log

代码语言:javascript复制
cat server.log
SERVER-1
[con] 10.10.10.1 suc
[con] 10.10.10.2 fai
[dis] 10.10.10.3 pen
[con] 10.10.10.4 suc
SERVER-2
[con] 10.10.10.5 suc
[con] 10.10.10.6 fai
[dis] 10.10.10.7 pen
[con] 10.10.10.8 suc
SERVER-3
[con] 10.10.10.9 suc
[con] 10.10.10.10 fai
[dis] 10.10.10.11 pen
[con] 10.10.10.12 suc

需要将 server.log 分割成 server1.logserver2.logserver3.log,这些文件的内容分别取自原文件中不同的 SERVER 部分:

代码语言:javascript复制
[root@localhost split]# csplit server.log /SERVER/ -n2 -s {*} -f server -b "d.log"; rm server00.log
[root@localhost split]# ls
server01.log  server02.log  server03.log  server.log

命令详细说明:

  • /[正则表达式]/:匹配文本样式,比如 /SERVER/,从第一行到包含 SERVER 的匹配行。
  • {*}:表示根据匹配重复执行分割,直到文件尾停止,使用 {整数} 的形式指定分割执行的次数。
  • -s:静默模式,不打印其他信息。
  • -n:指定分割后的文件名后缀的数字个数。比如 010203 等。
  • -f:指定分割后的文件名前缀。
  • -b:指定后缀格式。比如 d.log,类似于 C 语言中的 printf 参数格式。
  • rm server00.log:删除第一个文件,因为分割后的第一个文件没有内容,匹配的单词位于文件的第一行中。

0 人点赞