实战 | OpenCV+OCR实现环形文字识别实例(详细步骤 + 代码)

2022-05-25 08:03:44 浏览数 (1)

导读

本文将介绍使用OpenCV OCR实现环形文字识别的详细步骤和代码演示。

背景介绍

光学字符识别(OCR)场景中有很多特殊情况,比如噪声、脏污、倾斜、变形等,都会对识别造成影响。环形文字也是其中一种,我们通常不能直接识别它们,而是先将文字转换到水平方向,再做识别。如下图所示:

如果我们直接识别,很容易识别失败,那怎么办呢?下面来详细介绍上图文字的识别步骤,也可看做环形文字识别的一般步骤。

详细实现步骤

【1】查找定位图中的圆形轮廓。定位圆形可以使用一般的Blob分析,也可使用霍夫圆变换实现,这里因为圆形比较规则且分明,直接使用霍夫圆变换即可,代码和检测效果如下:

代码语言:javascript复制
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
gray = cv2.medianBlur(gray,3)
circles = cv2.HoughCircles(gray,cv2.HOUGH_GRADIENT,1,100,
         param1=200,param2=30,minRadius=200,maxRadius=300)

isNG = False
if circles is None:
  print("找圆失败!")
  
else:
  circles = np.uint16(np.around(circles))
  a, b, c = circles.shape
  print (circles.shape)
  for i in range(b):
    cv2.circle(img_copy, (circles[0][i][0], circles[0][i][1]), circles[0][i][2], (0, 0, 255), 3, cv2.LINE_AA)
    cv2.circle(img_copy, (circles[0][i][0], circles[0][i][1]), 2, (0, 255, 0), 3, cv2.LINE_AA) # draw center of circle
  cv2.imshow("findCircle", img_copy)

【2】基于找到的圆做极坐标变换,将文字转换到水平方向。

代码语言:javascript复制
x = circles[0][i][0] - circles[0][i][2]
y = circles[0][i][1] - circles[0][i][2]
w = h = 2 * circles[0][i][2]
center = (circles[0][i][0], circles[0][i][1])
radius = circles[0][i][2]
C = 2 * math.pi * radius
print(C,radius)

ROI = img[y:y h,x:x w].copy()
cv2.imshow('ROI',ROI)
trans_center = (center[0]-x, center[1]-y)
polarImg = cv2.warpPolar(ROI,(int(radius),int(C)),trans_center,radius,cv2.INTER_LINEAR   cv2.WARP_POLAR_LINEAR)
polarImg = cv2.flip(polarImg,1) #镜像
polarImg = cv2.transpose(polarImg)#转置
cv2.imshow('polarImg',polarImg)
cv2.imwrite('polarImg.png',polarImg)

【3】文字识别。使用EasyOCR或PaddleOCR均可,这里使用EasyOCR。

代码语言:javascript复制
result = reader.readtext(polarImg)
print(result)
if len(result) > 0:
  for i in range(0,len(result)):
    print(result[i][1])
    if(result[i][2] < 0.4):
      continue
    for j in range(4):
      if j > 0:
        cv2.line(polarImg,(tuple(result[i][0][j-1])),(tuple(result[i][0][j])),(0,255,0),2,cv2.LINE_AA)
    cv2.line(polarImg,(tuple(result[i][0][0])),(tuple(result[i][0][3])),(0,255,0),2,cv2.LINE_AA)  
    strText = result[i][1].replace(' ','')
    cv2.putText(polarImg,strText,(result[i][0][3][0],result[i][0][3][1] 20),0,0.8,(0,0,255),2)

  cv2.imshow('polarImg-OCR',polarImg)

【4】极坐标反变换,将包含识别结果的图像还原成圆形。

代码语言:javascript复制
polarImg = cv2.flip(polarImg,0) #镜像
polarImg = cv2.transpose(polarImg)#转置
polarImg_Inv = cv2.warpPolar(polarImg,(w,h),trans_center,radius,cv2.INTER_LINEAR   
                       cv2.WARP_POLAR_LINEAR   cv2.WARP_INVERSE_MAP)
cv2.imshow('polarImg_Inv',polarImg_Inv)

【5】创建圆形mask图像做copyTo操作,使圆形外部图像与原图保持一致。

代码语言:javascript复制
mask = np.zeros((h,w,1),np.uint8)
  cv2.circle(mask,trans_center,radius-3,(255,255,255),-1, cv2.LINE_AA)
  cv2.imshow('mask', mask)
  ROI = img[y:y h,x:x w]
  for i in range(0,ROI.shape[0]):
    for j in range(0, ROI.shape[1]):
      if mask[i,j] > 0:
        ROI[i,j] = polarImg_Inv[i,j]
  cv2.imshow('result', img)
  cv2.waitKey(0)

0 人点赞