中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频
打開APP
未登錄
開通VIP,暢享免費電子書等14項超值服
開通VIP
首頁
好書
留言交流
下載APP
聯(lián)系客服
2020數(shù)據(jù)標(biāo)注公司排行
zjshzq
>《網(wǎng)絡(luò)》
2020.04.09
關(guān)注
人工智能燃料機
回想一下你的小時候,是如何學(xué)習(xí)認(rèn)識蘋果的?只需要有人拿一個蘋果在你面前展示一遍,告訴你這是蘋果,你就能舉一反三,認(rèn)識不同形態(tài),不同顏色的蘋果。這是人類特有的學(xué)習(xí)能力。
但是,如何教機器識別蘋果呢?我們要教它認(rèn)識一個蘋果,直接給它一張?zhí)O果的照片,它是完全不知道這是什么東西的。我們必須先給它學(xué)習(xí)大量蘋果的圖片,通過學(xué)習(xí)各種顏色、各種大小、各種形狀、各種成熟程度和各種光線明亮程度下的蘋果,掌握大量的圖片中的特征,這時候再給機器任意一張?zhí)O果的圖片,它才能認(rèn)出來這是蘋果。
人工智能在被投喂了大量數(shù)據(jù)之后,才能認(rèn)出三歲小孩子都能認(rèn)出的東西,學(xué)會“黑貓白貓都是貓”。
那么,這些供給機器學(xué)習(xí)的材料從哪里來呢?這就是我們今天要說的一個因為人工智能崛起而新興的行業(yè)——數(shù)據(jù)標(biāo)注行業(yè)。所謂數(shù)據(jù)標(biāo)注,就是人工為圖片、音頻和語音內(nèi)容做標(biāo)記,打標(biāo)簽,把大量非結(jié)構(gòu)性數(shù)據(jù)加工成機器可以識別的數(shù)據(jù),標(biāo)注好的數(shù)據(jù)會被人工智能公司用來訓(xùn)練算法模型,然后運用到圖像識別、語音識別、自動駕駛等不同領(lǐng)域。
在整個人工智能體系中,算力、算法和數(shù)據(jù)是人工智能進(jìn)化的三大元素,分別承擔(dān)著人工智能基礎(chǔ)設(shè)施能力、工作指導(dǎo)方法和算法進(jìn)化依據(jù)的角色。這三大元素相輔相成,共同推動人工智能的智慧化進(jìn)化水平。在人工智能運行模式中,“數(shù)據(jù)”作為至關(guān)重要的參與元素,從本質(zhì)上決定了人工智能的進(jìn)化水平。因為通常來說,數(shù)據(jù)標(biāo)注得越準(zhǔn)確,數(shù)量越多,模型效果越好,最后的產(chǎn)品效果就越好。換句話說,“數(shù)據(jù)”作為人工智能系統(tǒng)中的算法依據(jù),就是人工智能學(xué)習(xí)的教材,是人工智能的燃料機。
數(shù)據(jù)標(biāo)注的三種市場結(jié)構(gòu)
一個完整的數(shù)據(jù)標(biāo)注流程需要經(jīng)過任務(wù)分配、標(biāo)記程序設(shè)計、進(jìn)度跟蹤和質(zhì)量跟蹤等幾個環(huán)節(jié),環(huán)節(jié)中涉及到標(biāo)注員、審核員和管理員幾個角色,這些是任何一個數(shù)據(jù)標(biāo)注團(tuán)隊都具備的基本要素,不同的是組織工作的方式。
大多數(shù)AI實驗室、初創(chuàng)型AI公司在發(fā)展初期,都需要大量的數(shù)據(jù)來訓(xùn)練模型,但如果雇傭大量的人力進(jìn)行數(shù)據(jù)標(biāo)注,就不得不面臨這樣的處境:一是管理方面的挑戰(zhàn),在研發(fā)產(chǎn)品的同時還要把大量精力放在管理標(biāo)注人員身上;二是成本的挑戰(zhàn),大量全職標(biāo)注人員的薪酬對于初創(chuàng)型公司和研究實驗室都是一筆不小的支出。
于是,數(shù)據(jù)標(biāo)注公司隨著發(fā)展如火如荼的人工智能行業(yè)也發(fā)展起來。為了適應(yīng)人工智能公司對數(shù)據(jù)標(biāo)注不同程度的需求,當(dāng)前,我國數(shù)據(jù)標(biāo)注行業(yè)的市場結(jié)構(gòu)也分化為了幾種。
最開始興起的是眾包結(jié)構(gòu),在眾包平臺上,一端對接需求公司,一端對接大量有空余時間的志愿者(兼職人員)。眾包結(jié)構(gòu)的優(yōu)點是可以組織社會上的大量兼職人員進(jìn)行標(biāo)注,節(jié)省公司的運營成本,但缺點也很明顯,就是眾多分散的兼職人員之間合力完成一個大型標(biāo)注任務(wù),他們的專業(yè)背景和工作能力參差不齊,溝通成本高昂,數(shù)據(jù)保密也相對困難,一旦需求公司要調(diào)整原有標(biāo)注需求,兼職人員流動性大,無法給與需求公司靈活服務(wù)。意識到自身的缺點,近年來一些眾包平臺也開始對入駐的數(shù)據(jù)標(biāo)注團(tuán)隊進(jìn)行測評,以及采取末尾淘汰等措施,提升平臺整體的競爭能力。當(dāng)前,市場上典型的數(shù)據(jù)眾包平臺有京東眾智、百度眾測等。
另外一種就是工廠結(jié)構(gòu),即成立專門的數(shù)據(jù)標(biāo)注公司,有穩(wěn)定的標(biāo)注人員。相對于眾包結(jié)構(gòu),數(shù)據(jù)工廠的優(yōu)勢是標(biāo)注人員穩(wěn)定,需求方和數(shù)據(jù)標(biāo)注方能即時溝通,溝通成本降低,同時,數(shù)據(jù)傳遞也有源可溯,降低了數(shù)據(jù)泄露的可能性。但工廠結(jié)構(gòu)的公司也有它的煩惱?,F(xiàn)在市場上工廠結(jié)構(gòu)的數(shù)據(jù)公司兩極分化明顯,較大的長期員工可以達(dá)到上千人;而較小的,只有幾個人,很多小團(tuán)隊還存在有項目時成立,沒項目時解散的現(xiàn)象。由于人工成本風(fēng)險較高,兩極分化下的工廠結(jié)構(gòu)市場還衍生出了這樣的現(xiàn)象:大公司很少去對接短期且數(shù)據(jù)量較少的項目,小的公司可以承接這樣的項目但是有大批量數(shù)據(jù)任務(wù)到來時,數(shù)據(jù)標(biāo)注能力又會顯得捉襟見肘。目前,市場上規(guī)模較大的專業(yè)的數(shù)據(jù)標(biāo)注公司有Testin云測、星塵紀(jì)元、夢動科技等。
也有一些將眾包和工廠結(jié)構(gòu)融合的企業(yè),能夠根據(jù)項目大小和數(shù)據(jù)保密要求靈活部署,例如數(shù)據(jù)堂和龍貓數(shù)據(jù),都有自己的標(biāo)團(tuán)隊,同時也運營數(shù)據(jù)標(biāo)注眾包平臺。
這三種數(shù)據(jù)標(biāo)注的市場結(jié)構(gòu)都有各自的優(yōu)勢和局限性,結(jié)合眾包+工廠模式的第三種結(jié)構(gòu)是否會成為未來數(shù)據(jù)標(biāo)注行業(yè)的主流形式,還有待實踐的檢驗。因為除了市場結(jié)構(gòu),準(zhǔn)確率和靈活性在數(shù)據(jù)標(biāo)注中的重要性正在變得越發(fā)突出。
準(zhǔn)確率是核心競爭力
無論是工廠、眾包還是將兩者結(jié)合的市場結(jié)構(gòu),都是在成本、準(zhǔn)確率和靈活性上做選擇,隨著越來越多數(shù)據(jù)喂養(yǎng)給了人工智能算法,人工智能公司必須想辦法積累更多更準(zhǔn)確、符合自身應(yīng)用的數(shù)據(jù)。某種程度上來說,高質(zhì)量的標(biāo)注數(shù)據(jù),決定了人工智能公司的競爭力。
隨著AI應(yīng)用的加速落地,壓低報價和提交更多的數(shù)據(jù)標(biāo)注結(jié)果顯得不再那么重要,準(zhǔn)確率成為脫穎而出的命脈。在大型人工智能公司面前,數(shù)據(jù)標(biāo)注企業(yè)的準(zhǔn)確率提升一個百分點,競爭力將躍遷幾個層級。
任何一個行業(yè),在經(jīng)歷了早期的瘋狂生長后,最終一定會經(jīng)歷一番洗牌,變得更為規(guī)范化、透明化。屆時質(zhì)量會取代成本,成為需求方最優(yōu)先考慮的變量。
當(dāng)AI完成初級識別,要進(jìn)行深度學(xué)習(xí)訓(xùn)練后,甲方的人工智能公司對數(shù)據(jù)質(zhì)量和效率的要求將超越對成本的顧慮。往金字塔的高層發(fā)展,這個行業(yè)的缺口仍然非常巨大。
大浪淘沙,不妨大膽預(yù)測,數(shù)據(jù)標(biāo)注行業(yè)有兩類機構(gòu)最終會發(fā)展較好:一是注重質(zhì)量及服務(wù)的中小型數(shù)據(jù)標(biāo)注公司,二是自有整套數(shù)據(jù)技術(shù),能依靠人工智能增加準(zhǔn)確率的平臺。
人工智能背后的“人工”
形形色色的數(shù)據(jù)標(biāo)注公司、眾包平臺之下,不能忽視的是數(shù)據(jù)標(biāo)注員。
盡管對數(shù)據(jù)標(biāo)注的要求越來越高、越來越精準(zhǔn)是大勢所趨,但是,一個不容忽視的事實是,數(shù)據(jù)標(biāo)注行業(yè)現(xiàn)在還是勞動密集型產(chǎn)業(yè)。
重復(fù)的拉框、標(biāo)點,一個個數(shù)據(jù)標(biāo)注員通過大量重復(fù)勞動為AI輸送了幾十億甚至幾百億的喂養(yǎng)數(shù)據(jù),這些數(shù)據(jù)標(biāo)注員有一個被圈內(nèi)人默認(rèn)的外號:AI民工。
在中國廣袤的三四線城市、鄉(xiāng)鎮(zhèn),無數(shù)年輕人正成為“數(shù)據(jù)貼標(biāo)人”,他們每天坐在電腦前工作8小時以上,為AI公司的算法提供和處理大量數(shù)據(jù)。他們中的大多數(shù)人教育水平不高,重復(fù)的機械勞動為他們帶來了微薄的工資,全然不知自己正在參與“價值上億”的項目。
他們是“人工智能背后的人工”。當(dāng)前,人工智能行業(yè)依賴于大量的這種廉價的人工,因為算法和“機器學(xué)習(xí)”在很多情況下都是由真人訓(xùn)練。
這些類似富士康工廠的流水線工人,卻有著自己的夢想故事。從大眾的視角,他們是被忽視的一群人;在大眾關(guān)注不到的地方,數(shù)據(jù)標(biāo)注公司不僅僅是為人工智能賦能,也在賦能“人工”。
貴州夢動科技有限公司是少有的產(chǎn)教融合的數(shù)據(jù)標(biāo)注公司。公司緊鄰著一家扶貧高職“盛華職業(yè)學(xué)院”,此處的學(xué)生大多來自貧困山區(qū),該公司近一半的數(shù)據(jù)標(biāo)注員也來自與此。公司的一些工作人員,同時兼任著學(xué)校的老師。學(xué)校的學(xué)生在公司實習(xí),賺來的錢不僅足夠生活,有時還能拿出一些補貼家用。這份數(shù)據(jù)標(biāo)注的工作幫助他們改變了自己和家庭的命運,有時,一些優(yōu)秀的學(xué)生還能成為人工智能公司的專業(yè)標(biāo)注員,完成職業(yè)升級。
同樣賦能“人工”的還有京東眾智。京東眾智上有一千多名聾啞人數(shù)據(jù)標(biāo)注員,京東為他們成立專門的“靜公會”,項目上優(yōu)先照顧。
這些曾經(jīng)在社會上的邊緣人物,終于在“數(shù)據(jù)標(biāo)注”領(lǐng)域成了“有用的人”。一位京東眾智平臺的培訓(xùn)講師說:“想當(dāng)把英雄,承擔(dān)更多的責(zé)任。”聾啞人培訓(xùn)相對來說會費勁些,但是他們的優(yōu)點是專注、認(rèn)真、對視覺信號敏銳,數(shù)據(jù)標(biāo)注行業(yè)對他們來說是機會。
事實上,除了數(shù)據(jù)標(biāo)注員的職業(yè)升級野望,數(shù)據(jù)標(biāo)注行業(yè)還承載著很多創(chuàng)業(yè)者的人工智能夢。
一位小型數(shù)據(jù)標(biāo)注公司創(chuàng)始人曾說:“雖然標(biāo)注是相當(dāng)?shù)图墑e的工作,但進(jìn)入門檻相對較低,而且仍屬于人工智能行業(yè)。”他說,“所以我們認(rèn)為,如果我們可以從這里開始,也有可能慢慢地、一步一步地走向更高價值的領(lǐng)域?!?/section>
機器會代替人類嗎?
數(shù)據(jù)標(biāo)注員也有一些擔(dān)憂,他們的工作是幫機器更好的學(xué)習(xí),促進(jìn)人工智能行業(yè)的發(fā)展,而當(dāng)行業(yè)發(fā)展到一定階段,那還需要人工嗎?數(shù)據(jù)標(biāo)注員所做的工作就是在加速自己失去這份工作。
開發(fā)一款能夠?qū)崿F(xiàn)自動化數(shù)據(jù)標(biāo)注的工具,既是在解放人力,又是行業(yè)發(fā)展的必然結(jié)果。一旦智能化的數(shù)據(jù)標(biāo)注工具能夠替代人工,即使是能部分替代,數(shù)據(jù)量和質(zhì)量都會快速提升,進(jìn)而推動算法成熟得更快。而市場上已有企業(yè)在開發(fā)自動化數(shù)據(jù)標(biāo)注工具,嘗試用AI取代“AI民工”。
機器會代替人類嗎?或許,馬云先生在2018世界人工智能大會上所說的話,至今仍有啟發(fā)意義:“蒸汽機釋放了人的體力,但是蒸汽機并不是模仿人的體力,汽車比人跑得快,但是汽車并不是模仿人的雙腿。未來的計算會釋放人的腦力,但是計算機不是按照人腦一樣去思考,機器必須要有自己的方式去思考。”
讓計算機擁有自己的思考方式,是一個復(fù)雜的過程,在這個復(fù)雜的架構(gòu)中,數(shù)據(jù)標(biāo)注是滋養(yǎng)這個系統(tǒng)運轉(zhuǎn)的燃料,通過不斷升級改變的標(biāo)注內(nèi)容來適應(yīng)不斷強大的人工智能。
汽車的出現(xiàn),讓馬夫失業(yè)了,但是馬夫并沒有活不下去,而是去做更高級的工作,比如司機、汽修人員。19世紀(jì)紡織業(yè)突飛猛進(jìn)發(fā)展,一些任務(wù)變得自動化,大量紡織工人下崗,但機器降低了制作衣服的成本,人們對布料的需求也在增長。服裝需求的增長又帶來了新的就業(yè)機會,工廠不得不雇傭新一代的工人,學(xué)習(xí)操作復(fù)雜的機械。
當(dāng)一些需求被滿足時,又會產(chǎn)生新的需求。新技術(shù)、新科技,從來都不是人類的限制,而是人類一種認(rèn)識和思考世界的方式,我們借助新技術(shù)為自己的未來確定一種生活方式。
結(jié)語
在探討數(shù)據(jù)標(biāo)注這個行業(yè)存在的合理性與是否能長久發(fā)展之前,能帶給從業(yè)者的改變和對人工智能的推動就已足夠振奮人心。
現(xiàn)在就已經(jīng)很有意義,未來會更有意義。
(文/迷鎮(zhèn))
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報
。
打開APP,閱讀全文并永久保存
查看更多類似文章
猜你喜歡
類似文章
百度李鑫:如何利用人工智能處理大數(shù)據(jù)難題?11步輕松解決!
人工智能背后的“人工”:誰在訓(xùn)練AI?
人工智能在人工關(guān)節(jié)置換中的應(yīng)用
什么是機器學(xué)習(xí)以及它與人工智能的區(qū)別
AI算法測試之淺談
助力AI騰飛,深度學(xué)習(xí)走向何方?
更多類似文章 >>
生活服務(wù)
熱點新聞
首頁
萬象
文化
人生
生活
健康
教育
職場
理財
娛樂
藝術(shù)
上網(wǎng)
留言交流
回頂部
聯(lián)系我們
分享
收藏
點擊這里,查看已保存的文章
導(dǎo)長圖
關(guān)注
一鍵復(fù)制
下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!
聯(lián)系客服
微信登錄中...
請勿關(guān)閉此頁面
先別劃走!
送你5元優(yōu)惠券,購買VIP限時立減!
5
元
優(yōu)惠券
優(yōu)惠券還有
10:00
過期
馬上使用
×