1、梳理標注數(shù)據(jù)類型,目前常見的數(shù)據(jù)的類型包括圖片、文字、音頻和視頻,對于不同類型的數(shù)據(jù),標注方法不同,相關數(shù)據(jù)標注服務商報價也不同。
2、明確數(shù)據(jù)標注方向,對于不同行業(yè),數(shù)據(jù)標注需求不同。常見的標注方向包括語義分割、3D點云、文字轉寫、音頻轉寫、自然語義處理、目標追蹤。不同的方向,方式及需求不一樣,針對圖片類,常見標注為2D拉框、多邊形拉框,對于智能駕駛行業(yè),可能標注方向更多為車道線、語義分割等。
3、評估標注方式,對于較少量或簡單的圖片等形式,一般會選擇自行標注,常見的圖片標注工具如
LabelImg,該工具可在Windows及Mac上安裝使用。但如果遇到大批量圖片標注,或音視頻數(shù)據(jù)標注,LabeIImg就無法滿足需求,需要需求外部服務商。
4、篩選外部標注服務商,目前國內在數(shù)據(jù)服務質量參差不齊,可通過標準予以篩選,避免后期服務質量不過關,導致重新標注。篩選標準:豐富的企業(yè)服務經(jīng)驗,優(yōu)秀的標注平臺或工具,具備相應的數(shù)據(jù)安全措施,穩(wěn)定的數(shù)據(jù)服務團隊。