大地资源网视频在线观看新浪,日本春药精油按摩系列,成人av骚妻潮喷,国产xxxx搡xxxxx搡麻豆

正在閱讀:人工智能發展一大瓶頸:缺乏高質量數據集

人工智能發展一大瓶頸:缺乏高質量數據集

2016-07-07 10:35:57來源:數據分析網 原標題:制約人工智能領域的并非算法不夠先進,而是缺乏高質量數據集 關鍵詞:人工智能大數據機器人閱讀量:32539

導讀:制約人工智能(AI)領域很多重大突破的,并非算法不夠先進,而是缺乏高質量數據集。擁有針對特定領域的龐大數據集,能夠成為競爭優勢的一個重要來源。
  【中國智能制造網 名家論壇】用于機器學習用途的數據,其“不合理的有效性”引發了多年的廣泛爭論。也有觀點認為,制約人工智能(AI)領域很多重大突破的,并非算法不夠先進,而是缺乏高質量數據集。想要開發出先進的機器學習技術,數據至關重要,這是貫穿那些討論的共同主題。
  
  人工智能發展一大瓶頸:缺乏高質量數據集
  
  對于在業務中將機器學習作為核心技術的初創公司來說,能否獲得高質量的訓練數據極為關鍵。雖然很多算法和軟件工具都是開源和共享的,但好的數據集通常是專有的,且很難創建。因此,擁有針對特定領域的龐大數據集,能夠成為競爭優勢的一個重要來源,尤其是在初創公司能夠快速引發數據網絡效應的情況下(更多的用戶→更多的數據→更智能的算法→更好的產品→更多的用戶)。
  
  所以,如何創建高質量數據集以用于訓練學習算法,這是機器學習初創公司必須作出的一個重要的戰略決定。不幸的是,在剛開始的時候,初創公司的標記數據常常十分有限,甚至缺失,為他們在數據驅動型產品的打造上取得重大進展增添了阻礙。因此,在聘請數據科學團隊或者部署昂貴的核心設施之前,有必要從一開始就研究制定好數據采集的策略。
  
  很多方法都可以幫助初創公司克服數據采集的冷啟動問題。數據策略/來源的選擇通常與商業模式的選擇、公司的關注點(消費者或企業,水平或垂直,等等)以及融資的情況息息相關。以下是五種數據采集策略,雖然并不詳盡,且多少互有重疊,但能讓你對很多可用的方法有一個直觀的感受。
  
  策略一:人工作業
  
  從零開始創建好的專有數據集,幾乎永遠意味著預先投入大量人力采集數據,執行難以規模化的人工任務??啃U力開路的初創公司有很多。例如,很多聊天機器人初創公司聘請人類擔任“AI訓練師”,讓他們手動創建或核實虛擬助手作出的預測(實際效果各異,且員工流動率高)。就連科技巨頭都采用這種策略:Facebook虛擬助手M的所有回答,都由一支合同工隊伍進行檢查和編輯。
  
  只要數據網絡效應在某個時候生效,所需人力不再跟隨客戶數量同步增加,那么用蠻力來手動標記數據點的策略就能取得成功。一旦AI系統的進步速度夠快,不明確的異常值就會變得更少,進行手動標記的人員數量就可以減少或者保持不變。
  
  適用于:幾乎所有的機器學習初創公司
  
  例子:
  
  *很多聊天機器人初創公司(包括Magic、GoButler、x.ai和Clara)
  
  *MetaMind(手動采集和標記的食物分類數據集)
  
  *BuildingRadar(由員工/實習生手動標記建筑物圖片)
  
  策略二:縮小范圍

  
  大多數初創公司都會試圖從用戶那里直接采集數據,但問題在于,在機器學習的好處尚未全部體現出來之前,會很難說服早期采用者使用產品(因為先要有數據才能訓練和改進算法)。避開這種兩難處境的一個方法是大幅縮小問題域(如果以后有需要再擴大范圍)??死锼?middot;迪克森(ChrisDixon)說:“你需要的數據量與你試圖解決的問題廣度有關。”
  
  關于縮小范圍的好處,聊天機器人再次成為很好的例子。這個領域的初創公司可以在兩個市場進入策略之間做出選擇:一種是打造水平型虛擬助手,也就是幫助解答很多問題并響應即時請求的機器人,例如Viv、Magic、Awesome、Maluuba和Jam;一種是打造垂直型虛擬助手,也就是力求極為出色地完成某項明確具體工作的機器人,例如x.ai、Clara、DigitalGenius、Kasisto、Meekan和近期的GoButler。雖然兩個方法都可行,但解決閉域問題的初創公司在數據的采集上要容易許多。
  
  適用于:垂直整合型公司
  
  例子:
  
  *高度專業化的垂直型聊天機器人(比如x.ai、Clara和GoButler)
  
  *DeepGenomics(利用深度學習技術對基因變異進行分類和解讀)
  
  *QuantifiedSkin(利用客戶自拍照進行皮膚分析)
我要評論
  • 人工智能、物聯網和5G的融合:對未來意味著什么

    人工智能、物聯網和5G的融合是未來技術發展的必然趨勢。這一融合將為社會、經濟和生活帶來深遠的影響,同時也面臨著諸多挑戰。本文將探討人工智能、物聯網和5G融合的現狀、未來影響以及面臨的挑戰和機遇。
    人工智能物聯網5G
    2025-07-01 13:41:44
  • 數字孿生:為人工智能驅動的智能工廠鋪平道路

    數字孿生和人工智能的結合為智能工廠的建設和發展提供了強大的技術支持。本文將探討數字孿生和人工智能如何協同作用,推動智能工廠的建設和發展。
    數字孿生人工智能智能工廠
    2025-07-04 09:39:57
  • 法國發布AI企業推廣計劃,劍指2030年企業全面智能化

    人工智能與數字事務部長級代表克拉拉·沙帕指出,AI技術已在優化客戶服務、改善供應鏈管理和推動產品創新等領域展現出顯著成效。
    人工智能科技
    2025-07-02 17:40:59
  • 中鹽化工攜手和利時,共譜鹽化工智能發展新篇章

    考察團先后參觀了和利時西北總部基地智能體驗中心、智能化實驗室以及智能制造數字化生產車間,近距離觀摩了和利時自建的智能化工廠、無人倉儲物流車間、一體化智能機器人生產線等設施。
    中鹽化工和利時人工智能
    2025-07-02 10:56:02
  • 解放人手!亞馬遜宣稱完成100萬臺機器人部署:可分揀95%包裹

    目前,亞馬遜已培訓超70萬名員工掌握機器人操作技能,以配合自動化升級。數據顯示,其美國納什維爾運營中心借助機器人實現近95%的包裹自動分揀,日均處理量達數十萬件。
    亞馬遜機器人AI智能體
    2025-07-02 09:39:36
  • 早報|全國首輛AI外賣配送車武漢首發;Meta重組其人工智能部門

    近日,全國首輛搭載“AI大腦”的外賣配送車——智音車在武漢市漢陽區正式首發;據外媒報道,Meta CEO馬克?扎克伯格宣布對公司人工智能部門進行重組......
    AI外賣配送車人工智能
    2025-07-02 09:16:56
版權與免責聲明:

凡本站注明“來源:智能制造網”的所有作品,均為浙江興旺寶明通網絡有限公司-智能制造網合法擁有版權或有權使用的作品,未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:智能制造網”。違反上述聲明者,本站將追究其相關法律責任。

本站轉載并注明自其它來源(非智能制造網)的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:智能制造網”,本站將依法追究責任。

鑒于本站稿件來源廣泛、數量較多,如涉及作品內容、版權等問題,請與本站聯系并提供相關證明材料:聯系電話:0571-89719789;郵箱:1271141964@qq.com。

不想錯過行業資訊?

訂閱 智能制造網APP

一鍵篩選來訂閱

信息更豐富

推薦產品/PRODUCT 更多
智造商城:

PLC工控機嵌入式系統工業以太網工業軟件金屬加工機械包裝機械工程機械倉儲物流環保設備化工設備分析儀器工業機器人3D打印設備生物識別傳感器電機電線電纜輸配電設備電子元器件更多

我要投稿
  • 投稿請發送郵件至:(郵件標題請備注“投稿”)1271141964.qq.com
  • 聯系電話0571-89719789
工業4.0時代智能制造領域“互聯網+”服務平臺
智能制造網APP

功能豐富 實時交流

智能制造網小程序

訂閱獲取更多服務

微信公眾號

關注我們

抖音

智能制造網

抖音號:gkzhan

打開抖音 搜索頁掃一掃

視頻號

智能制造網

公眾號:智能制造網

打開微信掃碼關注視頻號

快手

智能制造網

快手ID:gkzhan2006

打開快手 掃一掃關注
意見反饋
我要投稿
我知道了
主站蜘蛛池模板: 金湖县| 双流县| 通渭县| 宝清县| 井研县| 古交市| 桑日县| 木里| 综艺| 彰化市| 大同县| 丽水市| 金华市| 宿迁市| 南通市| 明水县| 九台市| 武清区| 察哈| 西城区| 海原县| 崇阳县| 竹溪县| 常熟市| 德江县| 建宁县| 宁夏| 开江县| 闽侯县| 丹东市| 忻城县| 专栏| 邓州市| 顺平县| 汶川县| 基隆市| 彭州市| 阿拉善盟| 贵阳市| 城步| 抚州市|