Kafka测试初探【Go】

2023-08-04 11:25:39 浏览数 (1)

上周分享了Kafka性能测试初探的Java版本,有读者留言说太简单,内容比较水。这里澄清一下,是我学得比较水。文章定位就是一篇使用Java语言的Kafka Client客户端进行简单操作演示,然后模拟一下简单场景的性能测试。其中深入学习Kafka的可以随处搜到很权威实用的资料,有深入学习需求的可以自行寻找。

好久没有写Go了,这才突然觉察到,又重新复习了一波Go语言的基础语法。顺带着之前留下的好习惯,每个学习的框架和工具都用Java和Go写一遍。这次也分享一下Go语言的Kafka基础入门,以及生产者的简单测试场景。

我用的是shopify出的sarama,依赖如下github.com/Shopify/sarama v1.38.1。在搜资料的过程中,还发现有使用其他客户端的,选择挺多。

Kafka配置

Sarama框架中的生产者和消费者的配置类是一个,不太清楚这么设计的意图,两个配置重合度并不高,在Sarama中也是分开配置,但使用了同一个配置类。

生产者配置:

代码语言:javascript复制
 config := sarama.NewConfig()
 config.Producer.Return.Successes = true
 config.Producer.Return.Errors = true
 config.Producer.RequiredAcks = sarama.NoResponse
 config.Producer.Compression = sarama.CompressionLZ4
 config.Producer.Timeout = time.Duration(50) * time.Millisecond
 config.Producer.Retry.Max = 3

消费者配置:

代码语言:javascript复制
 config := sarama.NewConfig()
 config.Consumer.Offsets.AutoCommit.Enable = true
 config.Consumer.Offsets.AutoCommit.Interval = 1 * time.Second
 config.Consumer.Offsets.Initial = sarama.OffsetOldest
 config.Consumer.Offsets.Retry.Max = 3

这里只选择部分参数,详细的配置项和注释都可以在源码中找到,Sarama的一个好处就是注释非常全,甚至不用看官方API文档。

生产者

下面是生产者的代码,相比较Java来说,我这里增加了header的实践,其实Java也是支持的,只是当时学的时候漏掉了这个知识点。

代码语言:javascript复制
producer, err := sarama.NewSyncProducer([]string{"localhost:9092"}, config)
 if err != nil {
  log.Fatal(err)
  return
 }
 defer func() {
  // 关闭生产者
  if err = producer.Close(); err != nil {
   log.Fatal(err)
   return
  }
 }()
 // 定义需要发送的消息
 headers := []sarama.RecordHeader{sarama.RecordHeader{
  Key:   []byte("funtest"),
  Value: []byte("have fun ~"),
 }}

 msg := &sarama.ProducerMessage{
  Topic:   "topic_test",
  Key:     sarama.StringEncoder("test"),
  Value:   sarama.StringEncoder("ddddddddddddddddd"),
  Headers: headers,
 }
 // 发送消息,并获取该消息的分片、偏移量
 for i := 0; i < 100; i   {
  ftool.Sleep(1000)
  partition, offset, err := producer.SendMessage(msg)
  if err != nil {
   log.Fatal(err)
  }
  fmt.Printf("partition:%d offset:%dn", partition, offset)
 }

这里官方给的实践代码中感觉ProducerMessage类似于Java的org.apache.kafka.clients.producer.ProducerRecord#ProducerRecord,也是可以指定partitionid和时间戳,以及单独设置retries次数的。还有一个比较重要的类AsyncProducer,暂时不探索了。

消费者

消费者使用上Go和Java差异比较大,Sarama用了channel的概念,可以一直不停止从服务端获取消息对象,不像Java可以指定一次接受的消息数量,单次最大等待时间等。盲猜这里channel的性能太好了吧,不需要复杂设计也能满足需求。

代码语言:javascript复制
 consumer, err := sarama.NewConsumer([]string{"localhost:9092"}, config)
 if err != nil {
  fmt.Printf("fail to start consumer, err:%vn", err)
  return
 }
 topic := "topic_test"
 partitionList, err := consumer.Partitions(topic) // 根据topic取到所有的分区
 if err != nil {
  fmt.Printf("fail to get list of partition:err%vn", err)
  return
 }
 fmt.Println(partitionList)
 defer consumer.Close()
 for partition := range partitionList { // 遍历所有的分区
  // 针对每个分区创建一个对应的分区消费者
  log.Println(partition)
  pc, err := consumer.ConsumePartition(topic, int32(partition), sarama.OffsetOldest)
  if err != nil {
   fmt.Printf("failed to start consumer for partition %d,err:%vn", partition, err)
  }
  for msg := range pc.Messages() {
   log.Println(string(msg.Value))
   //log.Println(string(msg.Headers[0].Value))
  }
  for {
   msg := <-pc.Messages()
   log.Println(string(msg.Value))
  }
 }

后来我写了两种接受方式,其实都是阻塞的,如果是性能测试的时候可以使用Go中的go关键字起routine来执行。

性能测试

我这之展示性能测试简单的例子,即生产者不停地往Kafka发消息的Demo,复用了上文中的生产者代码,下面只展示执行部分。

代码语言:javascript复制
execute.ExecuteRoutineTimes(func() {
 _, _, _ := producer.SendMessage(msg)
}, 100, 10)

执行方法ExecuteRoutineTimes是我写的一个基于线程模型的压测执行方法,内容如下:

代码语言:javascript复制

// ExecuteRoutineTimes
// @Description: FunTester性能测试执行框架
// @param fun 待执行方法
// @param times 次数
// @param routine 线程数
func ExecuteRoutineTimes(fun func(), times, routine int) {
 c := make(chan int) //确认所有线程都结束
 key := false        //用于控制所有线程一起结束
 start := ftool.Milli()
 for i := 0; i < routine; i   {
  go func() {
   sum := 0
   for i := 0; i < times; i   {
    if key {
     break
    }
    fun()
    sum  
   }
   key = true
   c <- sum
  }()
 }
 total := 0
 for i := 0; i < routine; i   {
  num := <-c
  total  = num
 }
 end := ftool.Milli()
 diff := end - start
 //total := thread * times
 log.Printf("总耗时: %f", float64(diff)/1000)

 log.Printf("请求总数: %d", total)
 log.Printf("QPS: %f", float64(total)/float64(diff)*1000.0)
}

总结起来,相比Java,Go语言相对简单一些。如果习惯了Go语言的习惯,对于做测试来说上手要比Java快一些。再买个坑,改天测试一下两者之间的性能差异。理论上Go要比Java好一些。

FunTester原创专题推荐~Sarama是一个用于Apache Kafka的Go语言库。Kafka是一个分布式流处理平台,它可以处理大规模的数据流,并将其发布到主题中,供其他应用程序使用。Sarama库允许Go应用程序与Kafka集群进行通信。它支持多个版本的Kafka协议,并提供了生产者和消费者API,以便应用程序可以轻松地将消息发布到Kafka主题或从中读取消息。Sarama还提供了一些有用的工具,如分区选择器和负载平衡器,以帮助开发人员更好地管理Kafka消费者。 -- By FunTester

FunTester原创专题推荐~

  • 900原创合集
  • 2021年原创合集
  • 2022年原创合集
  • 接口功能测试专题
  • 性能测试专题
  • Groovy专题
  • Java、Groovy、Go、Python
  • 单测&白盒
  • FunTester社群风采
  • 测试理论鸡汤
  • FunTester视频专题
  • 案例分享:方案、BUG、爬虫
  • UI自动化专题
  • 测试工具专题

-- By FunTester

0 人点赞