www.亚洲男人天堂_欧美最顶级的aⅴ艳星_国产精品免费网站_欧美日韩在线一区_欧美床上激情在线观看_日韩av色在线_国产精品亚洲综合天堂夜夜_欧美做爰性生交视频_国产成人高潮免费观看精品_久久天天躁夜夜躁狠狠躁2022_国产美女久久精品香蕉69_亚洲专区在线视频_国产精品夜间视频香蕉_国产成人综合一区二区三区_国产精品69av_岛国av午夜精品

網絡消費網 >  科技 > > 正文
全球觀速訊丨“耗盡”人類語言:ChatGPT還有多少數據可用?
時間:2023-02-07 11:21:05

ChatGPT是個通才,可以與各行各業的人們對話,因為它用來訓練的語言,來自整個網絡和人類所有的知識寶庫,并且建立在一個看似無所不包的知識體系之上。

無論是ChatGPT之類的聊天機器人,還是其他的內容生成技術與應用,背后都是日益強大的學習和訓練的計算系統,它們被稱為大型語言模型(LLM),動輒設置成千上萬億個參數。機器很難像人類一樣通過推理來進行有效的學習,所以機器學習的能力很大程度上依賴于海量的數據。


【資料圖】

但是,人類的語言是有限的,當計算機建立起越來越巨大的算力和強大的算法,自然語言作為“原料”供應,是不是終有一天像石油一樣,被人類開采枯竭?當前的機器學習模型依賴于不斷增長的巨大數據集,其發展趨勢是否可能會放緩?

是的,語言數據資源是有限的,高質量的語言數據更是有限的。

來自阿伯丁大學、麻省理工大學、圖賓根大學的Pablo Villalobos等6位計算機科學家,近日發布了一篇論文,名為《我們會用完數據嗎?機器學習中數據集縮放的局限性分析》。他們開發的概率模型,估算了2022年至2100年之間可用的語言和視覺數據的總量,估計了語言和視覺模型訓練數據集規模的演變趨勢,試圖發現由于可用數據耗盡而導致的趨勢的極限。

目前絕大多數存量數據是用戶生成的,存儲在社交媒體平臺、博客、論壇等。有三個因素決定了在一個給定的時間段內產生多少內容:人口數量、互聯網滲透率、每個互聯網用戶產生的平均數據量。

互聯網上的大部分文本數據對訓練大型語言模型(LLM)都沒有用,專業人士通常只使用高質量的數據來訓練模型,因為這是他們希望模型學習和效仿的語言類型。常見的高質量數據的來源是書籍、新聞文章、科學論文、維基百科和過濾后的網頁內容。這些數據源的一個共同特性是,它們經過了質量和有用性的篩選。例如,在新聞、科學文章或開源代碼項目中,有用性必須由專業標準(如同行評議)的篩選產生。

他們發現,語言數據枯竭情況比視覺數據嚴峻得多。

語言和視覺模型的數據存量的增長速度比訓練數據集的大小慢得多,所以如果按照目前的趨勢繼續下去,數據集最終會因為數據枯竭而停止增長。

對于語言模型來說,數據耗盡的情況將在2030年到2040年之間發生。語言大模型的訓練數據主要來自互聯網,現在的模型越做越大,已經把網上能收集到的網頁數據用的差不多了,或者說隨著算力投入的進一步增加,基本上能夠把網絡上收集到的數據全部用盡。

近在眼前的擔憂是,高質量語言數據在 2026 年之前耗盡。

高質量數據增長的放緩是不可避免的,對于高質量的語言數據來說尤其如此。高質量的數據集通常包括了50%的用戶生成內容,15%~20%的書籍,10%~20%的科學論文,近10%的代碼和近10%的新聞。

研究人員估算了數字化書籍、公共GitHub和科學論文中可用文本的全部數量,并假設其占據高質量數據集的30%到50%之間,從而預測出當前高質量語言數據的總存量為9萬億(即9e12,上下限大概為4.6萬億到17萬億)個單詞,每年增長率為 4% 到 5%。以高質量語言數據庫作為上限來預測語言數據集的增長,放緩發生得更早,在2026年之前。

相比之下,低質量語言數據的存量在69萬億~7.1億億個單詞之間,當前增長率在6.41%至17.49%之間。其中,谷歌這樣資金雄厚的大公司可用的數據存量約為100萬億個單詞;所有科技公司可用的約為1000萬億個單詞;全人類擁有約1億億個單詞,也包括了所有的短信、電話和視頻會議等所產生的數據。低質量數據集先是隨著時間推移會快速增長,達到2030年后,增長會大幅放緩,直到耗盡數據存量。

視覺數據的情況要復雜一些。

現在互聯網上的存量視覺數據數量在8.1萬億到23萬億之間,目前的年增長率在8%左右,視覺模型數據耗盡的情況將在2030年到2060年之間發生,相對于語言模型來說,目前看起來情況還沒有那么嚴重。IDEA研究院計算機視覺與機器人研究中心講席科學家張磊博士認為,主要原因是視覺數據的維度和復雜度要更高,使得現有模型能夠使用的數據量和網上存在的數據量相比還有比較大的差距。

“視覺數據更復雜,視覺方面的問題也更多樣化?,F在的視覺大模型通常都是針對全圖(whole image)理解的預訓練,即模型只是針對全圖做分類或圖文檢索類的學習,但是視覺還有很多細粒度的問題,比如物體檢測、視覺分割等,大模型學到的全圖表征用于細粒度問題也會性能遞減。這些困難使得視覺模型還不能簡單地用增加數據的方法來解決?!?/p>

張磊博士還強調,視覺模型繼續增加數據量,獲得的增益也會逐漸變小,這也需要視覺算法方面的進一步改進,因此,視覺大模型目前還沒有達到單純增加數據提高效果的階段,還有更多的問題需要研究。

如果未來數據效率提升,大模型用更少的數據就能實現相同的功能;如果證明縮放定律是錯誤的,即使數據效率沒有額外的提升,或許還有更好的方法來使用更少的數據;如果通過遷移學習,多模態模型可能被證明比單一模態的模型表現得更好,這將有效地增加數據存量,從而擴大所有數據模態存量的組合。

合成數據將來是一個重要的數據來源,這一點受到最近騰訊發布的AIGC報告的極度看好。MIT科技評論將AI合成數據列為2022年10大突破性技術之一;Gartner也預測稱,到2030年合成數據將徹底取代真實數據,成為訓練AI的主要數據來源。

此外,一些非自然語言的數據也會大量產生。例如,如果大規模采用自動駕駛汽車將導致空前數量的道路視頻記錄;如果擁有充足的預算(如有政府或大公司的參與),也許能夠增加數據的產出,特別是在針對特定領域的高質量數據。

目前一個問題仍在擺在眼前:更多的數據難道一定就會“喂養”出更好的模型嗎?也不一定。正如前文張磊博士所說的,“目前視覺模型的相關困難還不能簡單地用通過增加數據的方法來解決?!?/p>

關鍵詞:

版權聲明:
    凡注明來網絡消費網的作品,版權均屬網絡消費網所有,未經授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明"來源:網絡消費網"。違反上述聲明者,本網將追究其相關法律責任。
    除來源署名為網絡消費網稿件外,其他所轉載內容之原創性、真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考并自行核實。
熱文

網站首頁 |網站簡介 | 關于我們 | 廣告業務 | 投稿信箱
 

Copyright © 2000-2020 www.yushuoyun.cn All Rights Reserved.
 

中國網絡消費網 版權所有 未經書面授權 不得復制或建立鏡像
 

聯系郵箱:920 891 263@qq.com

備案號:京ICP備2022016840號-15

營業執照公示信息

www.亚洲男人天堂_欧美最顶级的aⅴ艳星_国产精品免费网站_欧美日韩在线一区_欧美床上激情在线观看_日韩av色在线_国产精品亚洲综合天堂夜夜_欧美做爰性生交视频_国产成人高潮免费观看精品_久久天天躁夜夜躁狠狠躁2022_国产美女久久精品香蕉69_亚洲专区在线视频_国产精品夜间视频香蕉_国产成人综合一区二区三区_国产精品69av_岛国av午夜精品

        艳女tv在线观看国产一区| 国产精品国产福利国产秒拍| 玖玖玖免费嫩草在线影院一区| 亚洲中午字幕| 亚洲欧美激情视频在线观看一区二区三区| 欧美视频在线一区二区三区| 欧美午夜影院| 国产精品久久久久久妇女6080| 久久精品中文字幕一区二区三区| 伊人久久大香线蕉av超碰演员| 美女成人午夜| 欧美一级在线视频| 久久精品亚洲热| 影音欧美亚洲| 亚洲自拍偷拍网址| 一区二区免费在线视频| 国产乱码精品一区二区三区不卡| 欧美一区二区网站| 久久aⅴ乱码一区二区三区| 欧美一区2区三区4区公司二百| 亚洲麻豆视频| 久久久久久久久久久成人| 久久综合九色九九| 亚洲永久字幕| 久久亚洲精品中文字幕冲田杏梨| 欧美一二三视频| 国产日韩精品一区二区三区| 亚洲国产日韩在线一区模特| 一区久久精品| 日韩亚洲精品视频| 久久久久女教师免费一区| 国产精品羞羞答答| 亚洲国产小视频在线观看| 国产精品视频免费观看www| 欧美精品久久久久久| 国产日韩精品久久| 亚洲精品免费在线观看| 亚洲精品欧美激情| 久久在线免费视频| 久久久久久久综合色一本| 国产精品女主播在线观看| 国产精品入口麻豆原神| 欧美剧在线免费观看网站| 欧美+亚洲+精品+三区| 国产精品欧美一区喷水| 91久久综合亚洲鲁鲁五月天| 国产在线拍偷自揄拍精品| 国产精品视频观看| 亚洲久久成人| 欧美**字幕| 久久夜色精品国产欧美乱| 久久精彩视频| 久久久之久亚州精品露出| 亚洲黄色天堂| 日韩香蕉视频| 久久综合久久综合久久| 国产老肥熟一区二区三区| 伊人久久久大香线蕉综合直播| 亚洲免费av网站| 欧美性猛交xxxx乱大交蜜桃| 麻豆国产精品va在线观看不卡| 久久久水蜜桃av免费网站| 亚洲精品日韩欧美| 欧美一级理论片| 欧美激情一二三区| 亚洲欧美国产精品专区久久| 亚洲尤物在线视频观看| 欧美一区二区精品| 国产主播一区二区| 在线观看91久久久久久| 亚洲高清免费视频| 久久国产精品久久精品国产| 欧美日韩国产精品一区二区亚洲| 亚洲日本电影| 狠狠狠色丁香婷婷综合激情| 亚洲欧美成人在线| 亚洲小说区图片区| 欧美日韩三区| 欧美在线日韩| 在线观看一区欧美| 亚洲国产精品va在线看黑人动漫| 亚洲综合二区| 午夜精品一区二区三区在线播放| 一区二区三区在线观看视频| 亚洲国产精品久久久久| 国产精品都在这里| 欧美日韩网址| 欧美中日韩免费视频| 在线免费一区三区| 麻豆成人91精品二区三区| 亚洲精品免费一区二区三区| 免费永久网站黄欧美| 国产精品视频网站| 亚洲图片你懂的| 久久久久久有精品国产| 久久久精品国产免大香伊| 亚洲国产精品成人va在线观看| 亚洲综合电影| 亚洲欧美卡通另类91av| 欧美三级午夜理伦三级中文幕| 国内精品久久久久影院优| 欧美日韩免费观看一区二区三区| 亚洲午夜在线| 亚洲午夜电影在线观看| 美女网站久久| 欧美永久精品| 亚洲中字在线| 中文亚洲字幕| 久久久噜噜噜久久人人看| 午夜久久一区| 欧美日韩成人在线| 久久免费视频观看| 国产精品国产三级国产专播精品人| 亚洲精选视频免费看| 欧美日韩久久精品| 国内精品模特av私拍在线观看| 在线播放不卡| 亚洲国产视频一区二区| 亚洲电影在线免费观看| 黄色亚洲在线| 国产欧美一区二区三区视频| 欧美成人首页| 夜夜躁日日躁狠狠久久88av| 欧美在线视频导航| 亚洲乱码视频| 欧美在线二区| 国产精品一区二区在线观看| 狠狠做深爱婷婷久久综合一区| 一区二区黄色| 亚洲国产精品123| 亚洲婷婷国产精品电影人久久| 欧美一区二区三区的| 亚洲一本视频| 亚洲国产精品久久人人爱蜜臀| 麻豆精品视频在线| 欧美与黑人午夜性猛交久久久| 亚洲伦理在线观看| 欧美视频在线一区| 亚洲第一精品夜夜躁人人躁| 一本色道久久综合狠狠躁的推荐| 亚洲日本欧美在线| 狠狠色丁香久久婷婷综合丁香| 欧美视频在线观看免费| 亚洲国产一区二区三区青草影视| 国产欧美日韩精品在线| 美女任你摸久久| 欧美色精品天天在线观看视频| 伊伊综合在线| 欧美精品一区二区三区很污很色的| 国产伦理精品不卡| 久久九九电影| 国产欧美日韩| 欧美精品二区三区四区免费看视频| 国产精品亚洲激情| 欧美午夜视频在线| 欧美亚洲在线观看| 欧美一区二区高清| 另类图片国产| 欧美日韩一卡二卡| 亚洲欧美日韩一区二区| 欧美成人免费在线视频| 亚洲男女自偷自拍图片另类| 欧美jizz19性欧美| 日韩一二在线观看| 在线综合亚洲欧美在线视频| 久久在线免费视频| 国产午夜精品在线观看| 亚洲国产欧美一区| 国产视频精品免费播放| 国产色综合网| 国产精品网站视频| 久久久亚洲高清| 国产精品国产精品国产专区不蜜| 亚洲精品久久久久久久久久久久| 一本色道婷婷久久欧美| 欧美日本在线观看| 在线亚洲美日韩| 性色av一区二区怡红| 亚洲剧情一区二区| 日韩一区二区高清| 正在播放欧美一区| 国产一区二区黄色| 一级日韩一区在线观看| 狠狠色综合一区二区| 国产综合精品| 久久成人免费| 国内精品视频在线播放| 亚洲在线观看| 一本到高清视频免费精品| 狠狠色综合色区| 国产欧美一区二区三区国产幕精品| 老司机免费视频一区二区三区| 亚洲高清影视| 欧美日韩一区二区在线| 久久不射电影网| 亚洲第一免费播放区| 亚洲国产精品t66y| 亚洲天堂久久| 欧美日韩国产综合视频在线观看中文| 亚洲综合色网站| 另类专区欧美制服同性| 亚洲欧美日本在线| 欧美国产在线视频| 午夜精品亚洲一区二区三区嫩草| 欧美精品一区二区视频| 欧美一区二区三区免费观看| 亚洲一二三四久久| 欧美性天天影院| 夜夜嗨av一区二区三区网站四季av| 在线观看成人av| 欧美成人69av| 一区二区视频免费在线观看| 国产九九精品| 欧美性猛片xxxx免费看久爱| 亚洲国产免费看| 亚洲精品黄色| 久久久久一本一区二区青青蜜月| 夜夜嗨av一区二区三区四季av| 欧美国产丝袜视频| 久久这里有精品15一区二区三区| 久久se精品一区精品二区| 国产欧美日韩视频在线观看| 夜色激情一区二区| 国产精品久久久久久久第一福利| 一区二区三区高清视频在线观看| 亚洲区欧美区| 亚洲欧美日韩一区二区三区在线| 国产一区二区三区观看| 免费亚洲电影在线| 乱人伦精品视频在线观看| 欧美在线视频观看| 欧美第一黄色网| 国产精品一区二区你懂得| 欧美午夜一区| 欧美成人一区二区三区片免费| 99综合电影在线视频| 欧美成人中文| 欧美精品videossex性护士| 欧美成人在线网站| 欧美日韩国产综合视频在线观看| 国产精品日韩精品欧美在线| 亚洲一区二区网站| 欧美视频日韩| 一区二区三区国产在线观看| 欧美激情综合色综合啪啪| 久热成人在线视频| 久久野战av| 欧美在线播放一区二区| 欧美日韩二区三区| 久久精品国产免费| 一区二区三区视频在线| 久久久精品性| 亚洲欧美日韩成人高清在线一区| 亚洲特色特黄| 亚洲国产日本| 国产精品美女久久久久av超清| 在线视频观看日韩| 欧美成人dvd在线视频| 亚洲一区二区高清视频| 欧美一级淫片播放口| 亚洲欧洲一区二区天堂久久| 亚洲区免费影片| 亚洲在线视频免费观看| 在线看日韩av| 国产精品免费电影| 久久免费视频网站| 久久视频在线免费观看| 亚洲国产成人精品视频| 亚洲女人av| 欧美1区2区| 欧美亚洲一区| 欧美成人综合一区| 在线观看亚洲视频| 亚洲欧美日韩区| 久久在线免费观看| 欧美日韩国产美女| 亚洲黄色av一区| 欧美日韩在线三区| 久久精品一本| 欧美亚洲色图校园春色| 国产婷婷精品| 欧美aa在线视频| 欧美午夜美女看片| 亚洲激情成人网| 最新69国产成人精品视频免费| 红桃视频成人| 国产精品久久久久久久久婷婷| 欧美日韩一区二区三区在线观看免| 国产一区二区三区在线观看视频| 欧美在线一级va免费观看| 激情欧美国产欧美| 久久久久久亚洲精品杨幂换脸| 亚洲在线观看免费| 欧美日韩久久| 国产精品毛片高清在线完整版| ●精品国产综合乱码久久久久| 在线观看日韩一区| 久久亚洲影院| 久久久午夜视频| 久久精品日产第一区二区三区| 亚洲女同同性videoxma| 亚洲综合色丁香婷婷六月图片| 久久久成人精品| 可以看av的网站久久看| 一区二区视频免费在线观看| 国产一区二区按摩在线观看| 久久国产一区| 在线观看视频欧美| 久久精品一本久久99精品| 久久精品国产一区二区三区| 欧美日韩亚洲一区二区| 久久一区二区三区四区| 国产精品国产精品国产专区不蜜| 亚洲电影成人| 欧美va天堂在线| 欧美日韩精品伦理作品在线免费观看| 久久成人羞羞网站| aaa亚洲精品一二三区| 一本色道久久88亚洲综合88| 欧美高清视频www夜色资源网| 99国产一区二区三精品乱码| 亚洲视频999| 国产精品丝袜白浆摸在线| 激情亚洲网站| 亚洲成人自拍视频| 欧美国产日韩精品| 99视频在线精品国自产拍免费观看| 国产精品美女www爽爽爽视频|