视频数据标注工具与平台(数据标注公司)

2022-06-23 10:18:22 浏览数 (3)

视频数据标注平台(标注外包公司)

数据标注公司的工作比较多样,但视频标注对工具要求稍高一些,能在线上做的平台不是特别多,主要还是语音、图片标注。目前这个行业良莠不齐,有的平台技术实力强,有品牌背景,比如京东众智、百度众包,数据保密做得好。有的平台是专门做代理的,你的数据需求交给他,他转手就分包给下一层。下面介绍几个平台,也综合了其他博主的一些意见,如下:

京东众智

标注质量比较高,项目交付准时,数据隔离方案可以不出自己的服务器完成标注,比较重视客户的数据安全。也提供私有化部署服务。

百度众测

标注能力比较广泛,百度进入标注行业比较久,积累了较多的众包用户。不过我不看好众包模式,因为质量比较难把控。

figure-eight

国外知名的数据标注平台,国外好多大公司都与它有合作。需求方可以自行配置标注工具和相应的label,直接在平台上发任务,没有客户经理沟通…这可能对国内客户不太友好。

视频数据标注工具

CDVA

CDVA(compact descriptor for video analysis),主要是基于CDVS中的紧凑视觉描述子来做视频分析,之前是紧凑视觉描述子主要应用在图像检索领域。需要制作新的数据集,对视频帧进行标注,所以根据网上一个博主的标注工具进行了一定的修改,实现的功能是在每一帧中将需要标注的区域用鼠标选取4个点,顺序是顺时针。因为四边形的范围更广,之前的一些人直接标注了矩形,但是在一些仿射变换中,往往矩形的定位效果不好,矩形定位应该比较适合于人脸定位和行人定位之中。 http://www.cnblogs.com/louyihang-loves-baiyan/p/4457462.html

视频标注工具

由于实验室里面需要做CDVA的标准,CDVA(compact descriptor for video analysis),主要是基于CDVS中的紧凑视觉描述子来做视频分析,之前是紧凑视觉描述子主要应用在图像检索领域。需要制作新的数据集,对视频帧进行标注,所以根据网上一个博主的标注工具进行了一定的修改,实现的功能是在每一帧中将需要标注的区域用鼠标选取4个点,顺序是顺时针。因为四边形的范围更广,之前的一些人直接标注了矩形,但是在一些仿射变换中,往往矩形的定位效果不好,矩形定位应该比较适合于人脸定位和行人定位之中。

这些代码都是基于openCV的,因此在工程配置的时候需要天机opencv的库路径和头文件路径。 这里简单的介绍一下这个工具的用法

  • 首先运行这个应用程序可以看到一个黑框和一个Video窗口
  • 选取需要标注的区域,按照顺时针,画出4个点(此工具的写的时候默认是每帧图像画一个,不考虑多个情况,如果你要标注多个,就可以添加一个数组存取每个四边形的区域
  • 在画的时候若是点错了地方需求进一步修正则按 'z'即可,按下‘z’可以回退一个点,若画完4个点感觉还是不满意,也可以直接按下'c'全部清除
  • 当确定矩形区域之后,按下‘n’,就会将这些数据写入到指定的txt文件中,同时将进入下一帧
  • 由于视频中连续帧的变化不好,特别是镜头停止的时候,因此,为了避免重复画目标区域,上一帧的四边形坐标会自动的画在下一帧中,若需要重新画,按下‘c’,即可,若不需要重新画,按下'n'即会写入文件,同时继续下一帧,如此往复

在写入的txt文件中,一行代表一帧中的数据,第一个数为帧数,后4个数,分别是画矩形时依次点入的4个坐标值。 你可以根据自己的需求,修改这份代码,希望对大家能有所帮助。

代码语言:javascript复制
/********************************************************************
    created:	2015/04/18
    created:	18:4:2015   17:24
    filename: 	D:WorkSpaceVS_ProjectsVideoLabelVideoLabel_Quadrilateralvideo_label_quadrilateral.cpp
    file path:	D:WorkSpaceVS_ProjectsVideoLabelVideoLabel_Quadrilateral
    file base:	video_label_quadrilateral
    file ext:	cpp
    author:		Yihang Lou
    purpose:	draw the quadrilateral labels in the frame captured from video
*********************************************************************/
#include "opencv2/opencv.hpp"
#include <iostream>
#include <string>
#include <vector>
#include <fstream>
using namespace std;
using namespace cv;

// Global variables

Mat img_original, img_drawing;
Point quad [4];
//the value of pointNum is between 0~4
static int pointNum = 0;
/*************************************************
// Method: help
// Description: describe the usage
// Author: Yihang Lou
// Date: 2015/04/18
// Returns: void
// History:
*************************************************/
static void help()
{
    cout << "This program designed for labeling video n"
            "Only if you press the 'n' the present quadrilateral data will be written into txt filen";


        cout << "Hot keys: n"
        "tESC - quit the programn"
        "tn - next frame of the videon"
        "tz - undo the last label point n"
        "tc - clear all the labelsn"
        << endl;
}
/*************************************************
// Method: drawQuadri
// Description: 
// Author: Yihang Lou 
// Date: 2015/04/18
// Returns: void
// Parameter: quad the point of Point array
// History:
*************************************************/
static void drawQuadri (Point * quad) {
    for(int i = 0; i < 4; i  )
    {
        line(img_drawing,quad[i],quad[(i 1)%4],Scalar(0,255,0),1,8,0);
    }
}


/*************************************************
// Method: onMouse
// Description: do the actions after onMouse event is called
// Author: Yihang Lou 
// Date: 2015/04/18
// Returns: void
// Parameter: event
// Parameter: x Mouse's coordinate
// Parameter: y 
// History:
*************************************************/
static void onMouse(int event, int x, int y, int, void*)
{


    switch (event)
    {
    case CV_EVENT_LBUTTONDOWN:
        quad[pointNum%4].x = x;
        quad[pointNum%4].y = y;
        cout<<"x = "<<x<<" y = "<<y<<endl;
        pointNum  ;

        break;
    case CV_EVENT_LBUTTONUP:
        //finish drawing the rect (use color green for finish)

        circle(img_drawing,cvPoint(x,y),1,Scalar(0, 255, 0),1,8,0);

        if(pointNum == 4)
        {
            pointNum = 0;

            cout<<"draw quadri line"<<endl;
            drawQuadri(quad);
        }

        break;
    }

    imshow("Video", img_drawing);
    return;
}

/*************************************************
// Method: isempty
// Description: check the quad is empty
// Author: Yihang Lou 
// Date: 2015/04/18
// Returns: int
// Parameter: quad
// History:
*************************************************/
int isempty(Point * quad)
{
    for (int i = 0 ; i < 4; i  )
    {
        if (quad[i].x !=0 || quad[i].y !=0 )
        {
            return 0;
        }
    }
    return 1;
}
int main(){
    namedWindow("Video");
    ofstream outfile("1.txt");
    help();
    VideoCapture capture("1.avi");
    capture >> img_original;
    img_original.copyTo(img_drawing);
    imshow("Video", img_original);
    setMouseCallback("Video", onMouse, 0);
    int frame_counter = 0;
    while (1){
        int c = waitKey(0);
        if ((c & 255) == 27)
        {
            cout << "Exiting ...n";
            break;
        }
        switch ((char)c)
        {
        case 'n':
            //read the next frame
              frame_counter;
            capture >> img_original;
            if (img_original.empty()){
                cout << "nVideo Finished!" << endl;
                return 0;
            }

            img_original.copyTo(img_drawing);

            if (!isempty(quad))
            {
                drawQuadri(quad);

                outfile << frame_counter << " " << quad[0].x << " "<< quad[0].y << " " 
                    << quad[1].x << " "<< quad[1].y << " "
                    << quad[2].x << " "<< quad[2].y << " "
                    << quad[3].x << " "<< quad[3].y << " "<<endl;
            }

            break;
        case 'z':
            //undo the latest labeling point
            if(pointNum == 0)
            {
                cout<<"if you want to clear the existent quad please press 'c'"<<endl;
                break;
            }
            pointNum--;
            quad[pointNum].x=0;
            quad[pointNum].y=0;
            img_original.copyTo(img_drawing);
            for(int i = 0 ; i < pointNum; i  )		
            {
                circle(img_drawing,quad[i],1,Scalar(0, 255, 0),1,8,0);
            }

            break;
        case 'c':
            //clear quad array
            memset(quad,0,4*sizeof(Point));
            img_original.copyTo(img_drawing);
        }
        imshow("Video", img_drawing);
    }

    return 0;
}

VoTT

微软发布的可视化图像/视频标记工具。能够标记和注释图像目录或独立视频。使用 Camshift 跟踪算法辅助计算机标记和跟踪视频中的物体。将标签和资源导出到 Custom Vision Service CNTK,Tensorflow(PascalVOC)或YOLO 格式,用于训练对象检测模型。 https://github.com/Microsoft/VoTT

vatic

视频标注工具(vatic)

Github:https://github.com/cvondrick/vatic

1.安装(基于Ubuntu16.04)
代码语言:javascript复制
$ sudo pip install cython==0.20
$ wget http://mit.edu/vondrick/vatic/vatic-install.sh
$ chmod  x vatic-install.sh
$ ./vatic-install.sh
$ cd vatic

vatic-install.sh可能下载不了,vatic-install下载

2.配置HTTP Serve

代码语言:javascript复制
/etc/apache2/sites-enabled/000-default.conf

替换为:

代码语言:javascript复制
WSGIDaemonProcess www-data python-eggs=/home/cmcross/.python-eggs
WSGIProcessGroup www-data

<VirtualHost *:80>
    ServerName 0.0.0.0
    DocumentRoot /home/cmcross/vatic/public

    WSGIScriptAlias /server /home/cmcross/vatic/server.py
    CustomLog /var/log/apache2/access.log combined
</VirtualHost>

启用mod_headers模块:

代码语言:javascript复制

$ sudo cp /etc/apache2/mods-available/headers.load /etc/apache2/mods-enabled

代码语言:javascript复制
重启Apache:
$ sudo apache2ctl graceful

3.配置SQL

创建vatic数据库:

代码语言:javascript复制
$ mysql -u root
mysql> create database vatic;

如果登录需要密码,密码是hail_ukraine,修改root用户为无密码状态,否则会报错,如果是上面我的csdn下载的,密码是root

更新mysql root为无密码

代码语言:javascript复制
update user set authentication_string=PASSWORD("") where User='root';
update user set plugin="mysql_native_password"; 
flush privileges; #更新所有操作权限
quit;

启动:

代码语言:javascript复制
$ cp config.py-example config.py

如果需要上线服务,修改access相应选项,离线服务可以跳过

初始化数据库:

代码语言:javascript复制
$ turkic setup --database

重启数据库:

代码语言:javascript复制
$ turkic setup --database --reset

允许vatic访问turkic:

代码语言:javascript复制
$ turkic setup --public-symlink

4.验证是否安装正确

代码语言:javascript复制
$ turkic status --verify

如果您收到任何错误消息,则表示安装未完成。

注意:不打算使用Mechanical Turk,忽略由Mechanical Turk引起的任何错误。

ERROR:

代码语言:javascript复制
Localhost: http://localhost/

Testing access to Amazon Mechanical Turk... ERROR! Signature or access key missing
Testing access to database server... OK
Testing access to web server... ERROR! HTTP Error 403: Forbidden

One or more tests FAILED!

解决:修改Apache配置/etc/apache2/apache2.conf添加

代码语言:javascript复制
<Directory /home/cmcross/vatic/public>
         Options Indexes FollowSymLinks
         AllowOverride All
         Require all granted
</Directory>
代码语言:javascript复制
重启后解决问题$ sudo apache2ctl graceful

5.示例

视频取帧

代码语言:javascript复制
$ mkdir /path/to/output/directory
$ turkic extract /path/to/video.mp4 /path/to/output/directory

宽高属性采用:--width 1000 --height 1000或者--no-resize

代码语言:javascript复制
$ turkic extract /path/to/video.mp4 /path/to/output/directory --width 1000 --height 1000

已经取好的视频帧可通过命令转化为vatic的格式

代码语言:javascript复制
$ turkic formatframes /path/to/frames/ /path/to/output/directory

导入视频(离线)

代码语言:javascript复制
$ turkic load identifier /path/to/output/directory Label1 ~Attr1A ~Attr1B
 Label2 ~Attr2A ~Attr2B ~Attr2C Label3 --offline

identifier为表示符,Label1将具有属性Attr1A和Attr1B,Label2将具有属性Attr2B,Attr2B和Attr2C,并且Label3将不具有属性。 指定属性是可选的

pulish视频(离线)

代码语言:javascript复制
$ turkic publish --offline

ERROR:publish后打开http://localhost?id=1&hitId=offline网址显示Server Error

解决方法:在/etc/apache2/sites-enabled/000-default.conf添加

代码语言:javascript复制
<Directory /path/to/vatic>
    <Files server.py>
        Require all granted
    </Files>
</Directory>

导出voc格式数据集

代码语言:javascript复制
$ turkic dump identifier -o /output --pascal --pascal-skip 1

–pascal-skip:多少帧取一次数据,不加这个属性默认为15帧取一次

更多的参数参考Github:https://github.com/cvondrick/vatic

0 人点赞