中國西藏網 > 即時新聞 > 國內

      數據標注師:化“人工”為“智能”

      發布時間:2023-08-23 16:31:00來源: 中國青年報

        人工智能訓練師于2020年正式成為新職業并納入國家職業分類目錄。2021年,《人工智能訓練師國家職業技能標準(2021年版)》發布,數據標注員是人工智能訓練師的工種之一。

        ——————————

        4年前,陳霞還是一名全職媽媽,也從沒想到自己會成為人工智能領域中的一員。如今,31歲的她已經是一名資深的數據標注師了。

        她參與的是無人駕駛項目,負責在電腦上對車在道路上采集的現實交通場景的原始數據進行處理,將其轉化為機器學習可識別的專業數據。

        “比如道路上的各種障礙物、建筑、綠植,各類車道線以及行人等,我們要把這些人、物標出來,我們就是無人駕駛車的眼睛,告訴它們看見的東西是什么,應該怎么去行駛。”陳霞這樣描述著她的工作。

        有多少智能,就有多少人工

        “數據標注是機器感知現實世界的起點,是大部分人工智能算法得以有效運行的關鍵環節。”百度智能云數據標注基地業務產品負責人胡馳說,簡單來說,數據標注是對未經處理的語音、圖片、文本、視頻等數據進行特征標簽,將非結構化的數據轉變為機器可識別的結構化數據,使機器通過大量學習這些數據,化“人工”為“智能”。

        數據標注師是伴隨人工智能發展誕生的新職業,人工智能的進步離不開數據的標注。隨著中國人工智能產業的高速發展,數據標注師這個新職業的需求及人數也在壯大。作為人工智能的“啟蒙老師”,數據標注行業流行著一句話,“有多少智能,就有多少人工”。

        目前,數據標注不僅服務于自動駕駛行業,還服務于醫療保健、智能安防、新零售等場景。

        帥雙雙是一名醫療數據標注師,他的工作主要是對醫療類問答進行標注,糾正生成式人工智能對醫療相關問題的解答,主要用于在線問診等場景。他介紹說,“比如向AI提問心臟病的并發癥有哪些,我們要從它的多個回答中標注出符合問題的選項。有時,AI的回答雖然正確,但是語句不通順、不清晰,我們也要對此進行標注,通過這些操作,綜合培養AI的回答系統。”

        AI技術的落地應用在很大程度上緩解了醫療資源緊張、地區分布不均等問題,提升了醫療體系的整體運行效率。數據標注有望在增強人工智能在醫療保健領域的應用方面發揮重要作用。

        胡馳表示,目前,人工智能技術不斷演化、技術與行業場景融合不斷泛化,這些都需要大量的數據支撐,會對數據產生許多新的需求。數據標注也從早期的相對通用數據向專業化、復雜化方向演進。越來越多的細分場景,需要更多定制化模型進行迭代訓練,這也讓數據標注師面臨更多考驗,“未來,數據標注師會伴隨人工智能的發展不斷成長與變化,具備較長的職業生命周期與上升空間。”

        數據標注師需求多元化 門檻高低各不同

        天眼查數據顯示,目前我國有2000余家與“數據標注”相關的公司。其中,成立1-5年的占比24.2%,成立10年以上的占比50.8%。

        人工智能訓練師于2020年正式成為新職業并納入國家職業分類目錄。2021年,《人工智能訓練師國家職業技能標準(2021年版)》發布,數據標注員是人工智能訓練師的工種之一。

        德勤發布的《2022年人工智能基礎數據服務白皮書》顯示,2022年中國人工智能基礎數據服務市場規模為45億元,預計2027年市場規模將達到130億-160億元。胡馳認為,人工智能技術的迅猛發展,帶來了大量AI算法的訓練需求,這推動了數據標注產業的快速增長,人工智能訓練師的規模也由此快速增長。

        數據標注工具使用戶能夠通過向數據添加屬性標簽或對其進行標記來提高數據的價值。使用標注工具的主要好處是數據屬性的組合使用戶能夠在單個位置管理數據定義,而無需在多個地方重寫類似的規則。

        大數據的興起和大型數據集數量的激增,也需要使用人工智能數據標注領域的技術。螞蟻公益基金會副秘書長黃慶委表示,數據標注行業有望受益于對機器學習改進需求的不斷增長,以及對先進自動駕駛技術投資的不斷增加。

        對于未來,帥雙雙表示,隨著數據行業的發展,未來行業的門檻會越來越高。人工智能應用場景在不斷細分,數據分類也更加精細化、復雜化,作為數據標注師必須不斷學習以滿足行業發展需求。

        胡馳表示,數據標注行業對人才需求具有多元性,不同的標注數據與場景,對人員要求也呈現出一定的梯度分布的特征。較為低階的標注如標點、劃線等,對標注人員的要求往往不高,普通人經過培訓即可勝任;中高階的標注,如對自動駕駛、大模型等的標注,則對標注人員的要求更高、更專業。而一些細分復雜場景可能會需要更專業、更高學歷的數據標注師來提供數據服務。胡馳認為,“未來,隨著人工智能的不斷發展,數據標注可能將從勞動密集型產業轉向技術型產業。”

        中青報·中青網記者 高蕾 來源:中國青年報

      (責編:陳濛濛)

      版權聲明:凡注明“來源:中國西藏網”或“中國西藏網文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來源中國西藏網和署著作者名,否則將追究相關法律責任。

      主站蜘蛛池模板: 日韩在线视精品在亚洲| 精品亚洲一区二区| 欧美一级视频免费看| 四虎最新地址在线观看1080p| 一本高清在线视频| 杨幂精品国产福利在线| 国产丝袜视频一区二区三区| 91人人区免费区人人| 成人免费一级片| 久久精品成人一区二区三区| 欧美黑人巨大videos极品| 又爽又黄又无遮挡网站| 黑人操日本美女| 山村乱肉系列h| 久久狠狠爱亚洲综合影院| 欧美添下面视频免费观看| 内射少妇一区27P| 野花日本免费观看高清电影8 | 精品国产三级a∨在线观看| 国产性感美女在线观看| 18禁无遮挡无码网站免费| 日本牲交大片免费观看| 亚洲日韩一页精品发布| 精品一区二区三区自拍图片区| 国产人澡人澡澡澡人碰视频| videos性欧美| 国产麻豆剧果冻传媒一区| www成人在线观看| 成人黄色免费网址| 久久人人爽人人爽人人片av不| 欧美亚洲人成网站在线观看| 亚洲精品亚洲人成在线播放 | 精品国产一区二区三区久久| 国产卡1卡2卡三卡网站免费| jjzz日本护士| 国产香蕉精品视频| aⅴ免费在线观看| 孕妇videos孕交| 中文在线免费观看| 欧美日韩三级在线观看| 国产亚洲欧美日韩在线看片 |